阿里技术

真武 AI 芯片 T-Head SAIL® 软件栈正式开源开放
作者：阿里技术发布日期：2026-07-18 12:40:03
今天，真武AI芯片软件栈 T-Head SAIL® 正式开源，向全球开发者开放高效、开放的AI算力基础设施核心能力。作为自主算力新标杆，真武AI芯片凭借卓越算力与数据中心系统级全栈协同生态，高效助力将
阅读全文
面向复杂业务场景的智能分析 Skills 架构设计与演进实践
作者：阿里技术发布日期：2026-07-17 18:18:00
这是2026年的第 37 篇文章（本文阅读时间：约 15 分钟）背景过去一个月，我们在搭建一个面向本地生活业务的分析类 Skill，让 AI 能像资深分析师一样做经营诊断、归因拆解和趋势预测。业务
阅读全文
阿里荣膺 ACL 2026 最佳资源论文 | HSCodeComp 揭开智能体「分层规则应用」的能力鸿沟
作者：阿里技术发布日期：2026-07-15 18:08:00
这是2026年的第 36 篇文章（本文阅读时间：约 15 分钟）开篇当 Deep Search Agent 撞上真实世界的专家规则过去两年，大模型 Agent 在深度搜索（Deep Search）
阅读全文
从 Coder 到 Designer ：电商团队数据研发的 Harness Engineering 实践
作者：阿里技术发布日期：2026-07-14 18:08:00
这是2026年的第 36 篇文章（本文阅读时间：约 20 分钟）01项目背景我们团队今年在 AI Data 方向共有两个命题，一个是「数据研发效率提升」，另一个是「数据价值交付」，在项目启动之初，
阅读全文
一个小模型意图识别系统的 5 天进化实录｜支付宝618
作者：阿里技术发布日期：2026-07-13 20:17:01
这是2026年的第 35 篇文章（本文阅读时间：约 25 分钟）01业务背景2026 年，AI 不再是一个 buzzword——它已经切切实实地渗透进了每一行代码、每一次技术决策。说来惭愧，作为一
阅读全文
上交 x 阿里：让机器人闭眼先学动作，vla 成功率涨 43%
作者：阿里技术发布日期：2026-07-13 20:17:01
近年来，Vision-Language-Action（VLA）模型正在成为通用机器人操作的重要路线。主流做法通常是把视觉观测、语言指令和机器人动作放在一起训练，让模型根据当前图像和语言目标直接预测下一
阅读全文
意识 × Loop：让 Loop 跨 Session 自进化的最佳实践
作者：阿里技术发布日期：2026-07-10 18:18:00
这是2026年的第 34 篇文章（本文阅读时间：约20分钟）本文提到的意识指 QoderWork 内的意识功能，包括但不限于长短期记忆、用户画像、工作手册等，但本最佳实践适用于任何市面主流的 Ag
阅读全文
Cloud Use：当 Agent 开始真正使用云
作者：阿里技术发布日期：2026-07-09 18:08:00
这是2026年的第 33 篇文章（本文阅读时间：约25分钟）前言Qoder Cloud Agents 工程实践系列：如果 Agent 的边界是工具调用，那么 Cloud Use 的边界则是云原生执
阅读全文
阿里云发布 AgentTeams 与 AgentLoop
作者：阿里技术发布日期：2026-07-09 18:08:00
近日，阿里云正式发布两款面向企业 AI 落地的核心产品——多智能体协作治理平台 AgentTeams 与智能体观测优化平台 AgentLoop。两款产品分别解决企业在大规模部署 AI 智能体时面临的两
阅读全文
Harness 工程实践：如何让 Agent 完成自主迭代
作者：阿里技术发布日期：2026-07-08 19:36:24
这是2026年的第 32 篇文章（本文阅读时间：约20分钟）前言一个人一天最多跑一次迭代实验，但每周上百个 badcase 追着我们跑，这是团队今年年初的状态。我们负责一个服务大规模用户的线上业务
阅读全文
硬核少年技术节5.0抢鲜看！四大AI成果首发，报名即将截止
作者：阿里技术发布日期：2026-07-08 19:36:24
7月20日至24日，横跨阿里巴巴淘天集团与ATH事业群的年度最大技术节日——硬核少年技术节5.0将在杭州和北京两地同步启幕。为期一周的技术节涵盖技术市集、博见社、Openday、AI Hackatho
阅读全文
从「不敢发」到「天天发」：AI Agent 时代的 CI/CD 生存指南
作者：阿里技术发布日期：2026-07-07 18:08:00
这是2026年的第 31 篇文章（本文阅读时间：约15分钟）01当 AI 开始写代码，「敢不敢发」成了新问题先看一组数据：a1 CLI（一款统一研发命令行工具）—— 数十万行 Go 代码，数百个命
阅读全文
为什么 Agent 时代，大家都在做 CLI ？
作者：阿里技术发布日期：2026-07-06 18:08:00
这是2026年的第 30 篇文章（本文阅读时间：约15分钟）前言过去一段时间，AI Agent 相关工具出现了一个有意思的变化：能力在不断演进，交互入口却越来越多地回到最朴素的命令行。看起来像是一
阅读全文
为什么大模型的缓存命中率能到 90%？
作者：阿里技术发布日期：2026-07-03 19:18:47
这是2026年的第29篇文章（本文阅读时间：约15分钟）缘起：一个 90% 的观察如果看过自己团队的大模型 token 消耗看板，我们多半会注意到一个现象：主力模型的缓存命中率常年挂在 90% 上
阅读全文
Agent 评测：方法论与体系设计
作者：阿里技术发布日期：2026-07-02 18:08:18
这是2026年的第28篇文章（本文阅读时间：约15分钟）01为什么 Agent 评测需要体系化划重点：Agent 评测是把「不稳定的智能行为」持续收敛成「可发布的工程质量」，不是上线前抽查。和传统
阅读全文
OpenSandbox 再进化：Credential Vault 让真实密钥不再进入沙箱
作者：阿里技术发布日期：2026-06-26 16:07:13
这是2026年的第27篇文章（本文阅读时间：约20分钟）前言OpenSandbox 是一个阿里巴巴开源的面向 AI Agent 的通用沙箱平台，提供多语言 SDK、CLI、MCP Server，以
阅读全文
阿里开源 Open Code Review：一周揽下 5k star，更专业的代码评审 CLI
作者：阿里技术发布日期：2026-06-24 09:06:30
这是2026年的第26篇文章（本文阅读时间：约20分钟）前言AI 每天生成的代码量已经远超人工评审的上限：以前每天 review 几百行，现在动辄几千、几万行。代码评审，正在成为研发效率新的质量瓶
阅读全文
HappyHorse 1.1来了，现已登陆千问云、百炼
作者：阿里技术发布日期：2026-06-23 18:13:14
视频生成模型 HappyHorse 1.1 正式发布，现已登陆 HappyHorse 官网、千问云及阿里云百炼平台。相较1.0版本，HappyHorse 1.1围绕动态表现力、主体一致性、指令遵循、视
阅读全文
Loop Engineering 概念解析、思考与实践
作者：阿里技术发布日期：2026-06-18 18:20:22
这是2026年的第25篇文章（本文阅读时间：约20分钟）01背景此前已有不少文章围绕 Agent 自进化这个主题展开过讨论，内容涵盖了 Hermes Agent 等自进化框架，以及 Skill 自
阅读全文
后端架构 AI Friendly 的标准与路径：面向无人值守开发时代的系统重构
作者：阿里技术发布日期：2026-06-15 19:26:48
这是2026年的第24篇文章（本文阅读时间：约20分钟）前言过去十几年，互联网软件的后端系统核心目标大多围绕「人类工程师友好」展开：架构要清晰，接口要稳定，日志要可查，监控要完整，发布要可控，故障
阅读全文
Qoder 工程实践：当瓶颈从模型转移到人
作者：阿里技术发布日期：2026-06-12 17:54:53
这是2026年的第23篇文章本文阅读时间：约15分钟（注：下文中的“我”系作者本人）引言当 AI 输出的价值稳定超过 Token 成本之后，瓶颈从模型能力转移到了人的精力。这个认知改变了我过去半年的工
阅读全文
AI 不缺智商缺纪律：一场 Harness 工程化实践
作者：阿里技术发布日期：2026-06-10 20:23:51
这是2026年的第22篇文章本文阅读时间：约20分钟（注：下文中的“我”系作者本人）引言本文核心观点：AI Coding 的瓶颈正从「模型能力」转移到「流程工程」——模型已经足够聪明，但不稳定，而稳定
阅读全文
Harness Engineering：长程自动化 AI Coding / Skills 开发实践
作者：阿里技术发布日期：2026-06-09 20:42:13
这是2026年的第21篇文章本文阅读时间：约20分钟 01Harness Engineering 是什么？Harness Engineering，本质上是在为 Agent 构建一个能够持续感知、持续
阅读全文
重新思考研发基础设施：当 Agent 成为第一公民
作者：阿里技术发布日期：2026-06-03 18:09:21
这是2026年的第20篇文章本文阅读时间：约30分钟（本文作者晓斌，阿里巴巴研发基础设施负责人）前言从一个周报系统说起过去几个月，我做了一个小系统：收集团队在多个异构系统（代码托管、项目管理、数据平台
阅读全文
Agent核心技术概念与范式发生了哪些演变以及背后的思考
作者：阿里技术发布日期：2026-06-01 18:18:00
这是2026年的第19篇文章（本文阅读时间：约20分钟）前言近几年，随着基模能力的快速升级与迭代，Agent 领域迎来了爆发式的增长。特别是近期，像 Claud Code、Codex、OpenCl
阅读全文
让项目管理也 AI Native —— 两个 Git 仓库干掉了周报、洞察和效能报表
作者：阿里技术发布日期：2026-05-28 19:05:42
这是2026年的第18篇文章（本文阅读时间：约20分钟）前言这篇文章讲的事情不复杂：我们用两个 Git 仓库 + AI 编码助手 + 几个 Shell 脚本，替代了传统项目管理中至少 80% 的人
阅读全文
从语言涌现到协作涌现：如何让 AI 产生高质量决策
作者：阿里技术发布日期：2026-05-27 18:29:28
这是2026年的第17篇文章（本文阅读时间：约20分钟）前言“涌现”不是一个玄学词。在复杂系统里，涌现指的是：系统整体表现出某种单个组成部分并不具备、也没有被直接写死的性质。这种性质来自大量局部单
阅读全文
近9倍训练加速：DiT里的残差流，正在成为收敛瓶颈
作者：阿里技术发布日期：2026-05-26 18:50:05
这是2026年的第16篇文章（本文阅读时间：约20分钟）前言近年来，基于Diffusion Transformer（DiT）的视觉生成模型几乎每一个关键部件都被重新审视过：tokenizer、at
阅读全文
Codex 的 /goal 为什么能让 Agent 稳定做长任务？本质就是一张状态表
作者：阿里技术发布日期：2026-05-23 18:28:00
这是2026年的第16篇文章（本文阅读时间：15分钟）前言最近在看 Codex 里 /goal 的实现，越看越觉得这个功能被低估了。很多人一聊起 Agent 长任务，就会说：让它自己规划、自己执行
阅读全文
从0到1搭建 Agent ：Agent 原理分析及个人助手实践（长文干货）
作者：阿里技术发布日期：2026-05-21 19:28:22
这是2026年的第15篇文章（本文阅读时间：约50分钟）前言AI 发展越来越快，对于大部分人来说，想深入参与 LLM 研究的机会很少，但是大家都有机会成为 agent 开发者，或是低成本搭建一个a
阅读全文