通义实验室

30W奖池已就位！手机上的创意AI挑战赛，等你瓜分
作者：通义实验室发布日期：2026-05-19 16:30:00
阅读全文
FlashQLA：让 Qwen 的注意力层跑得更快
作者：通义实验室发布日期：2026-04-29 19:07:56
训练大模型时，注意力层的计算开销往往是个"隐形瓶颈"。尤其当模型规模越来越大、上下文越来越长时，这部分开销会悄悄吃掉大量算力和时间。自 Qwen3-Next 发布以来，Gated Delta Netw
阅读全文
搜对≠答对：EAPO用“证据奖励”让大模型不再靠猜
作者：通义实验室发布日期：2026-04-27 17:55:40
如今，AI 搜索把全网资料塞进几百万 Token 的上下文，大模型要做的就是从中找出正确答案。但让人崩溃的常常是：正确资料喂到嘴边，它要么答错，要么答案碰巧对了，引用的证据却全是错的。问题出在哪？出在
阅读全文
Qwen3.6-27B：无需MoE路由，旗舰级编程能力
作者：通义实验室发布日期：2026-04-22 21:00:00
阅读全文
我的 Agent 又乱调工具了！
作者：通义实验室发布日期：2026-04-21 17:22:03
精心写好的 Agent，一上线就翻车？不懂行业黑话、乱调 API、业务规则一变策略就失效……手动改 Prompt、换模型、重新部署，维护成本越来越高。静态的工程部署，根本扛不住真实业务的复杂多变。Ag
阅读全文
敢不敢用家乡话测试这个 AI？
作者：通义实验室发布日期：2026-04-20 14:01:57
你的家乡话，语音识别能听懂吗？过去，答案是“很难”。方言一出口，转写结果常常是乱码或空白。但这一切正在改变......通义实验室正式推出 Fun-ASR1.5，实现了「方言工业级可用」的语音识别大模型
阅读全文
Qwen3.6-35B-A3B 开源！
作者：通义实验室发布日期：2026-04-16 21:22:14
体量轻巧、推理高效，Qwen3.6-35B-A3B 开源！这是一款采用稀疏混合专家（MoE）架构的高效模型：总参数 350 亿，每次推理仅激活 30 亿参数。参数量虽小，性能依旧强劲。在智能体编程上，
阅读全文
5句AI时代的心里话，哪句戳中了你？
作者：通义实验室发布日期：2026-04-10 15:50:56
阅读全文
图文视频All in One！一个开源框架搞定全模态知识库
作者：通义实验室发布日期：2026-04-09 17:30:00
给大模型接上企业知识库（RAG）已是行业标配。它让 AI 告别“凭空捏造”，回答有据可查。但当知识库从纯文档升级为图文、视频交织的立体资产时，传统方案就开始力不从心了。想象一家制造企业的真实知识库：1
阅读全文
FIPO：精准追踪2%的Token，突破大模型推理瓶颈！
作者：通义实验室发布日期：2026-04-07 17:32:43
蝴蝶效应告诉我们，一次微小的振翅，足以在千里之外引发风暴。但主流强化学习（RLVR）却对推理链上的每个Token一视同仁——它不知道哪一只“蝴蝶”才是关键。如何找到它？通义实验室智能计算团队连发四篇技
阅读全文
热浪中的每个“我”：一场关于AI与人的年度对话
作者：通义实验室发布日期：2026-04-07 17:32:43
阅读全文
Wan2.7-Video 为创作自由而来
作者：通义实验室发布日期：2026-04-03 14:14:07
AI 视频创作，我们常遇到两大难题：内容生成不专业：想要一段紧张的追逐戏，AI 却不懂剧本；想要细腻的微表情，它只会呆板假笑。视频修改困难：多了一个路人，删不掉；动作差了点意思，改不了。换个机位？只能
阅读全文
Qwen3.6-Plus：编码智能体能力全面跃升！
作者：通义实验室发布日期：2026-04-02 12:32:37
Qwen3.6其他开源尺寸模型和更强大的Qwen3.6Max模型近期发布，敬请期待继今年 2 月发布 Qwen3.5 系列后，今天我们正式推出 Qwen3.6-Plus，现已通过阿里云百炼 API 开
阅读全文
Wan2.7-Image：人更真，字更稳，色更准
作者：通义实验室发布日期：2026-04-01 14:57:08
.
阅读全文
CoPaw 1.0 发布：定制小模型、安全机制与多智能体全面进化
作者：通义实验室发布日期：2026-03-31 17:34:51
一个月前，AgentScope 团队正式开源了 CoPaw，一款可快速部署在用户本地或云上环境的个人智能助理。CoPaw 开源以来，获得了大量来自社区的关注和贡献，我们已经合并了 900 多个 PR。
阅读全文
215项SOTA + 自然涌现Vibe Coding！Qwen3.5-Omni发布
作者：通义实验室发布日期：2026-03-30 21:08:55
为什么我们要做多模态模型？因为人与世界接触的方式是多维度的。所以我们要为 AI 装上“眼睛”和“耳朵”，让它能像人一样感知——看到你的手势，听懂你的语气，打破硅基智能与物理世界之间的次元壁。只有这样，
阅读全文
PrismAudio：声画同频，音效随行
作者：通义实验室发布日期：2026-03-24 15:34:07
当你看到一段视频：一匹马在草原上奔跑。要给这段视频配上声音，我们要保证声音像真的，还要和画面"合拍"。想完成上述这个"很简单"的任务，要同时通过四重考验：声音对吗？必须是马蹄声，不能是鸟叫或风声（语
阅读全文
P-GenRM：当奖励模型遇上千人千面
作者：通义实验室发布日期：2026-03-17 17:51:08
同样的问题，不同的人，在不同的场景下，需要的答案可能截然不同。统一的标准，遇上千人千面的偏好，传统奖励模型显然不够用了。如何让 AI 真正适配动态变化的个性化需求？通义实验室自然语言智能团队提出了 P
阅读全文
Fun-CineForge：首个影视级配音多模态大模型
作者：通义实验室发布日期：2026-03-16 15:06:26
让 AI 给电影配音，这事难吗？能否还原出演员的情绪爆发？能否对上角色张嘴闭嘴的每一帧画面？能让观众听不出来是机器在说话吗？在影视、动画和游戏制作中，配音从来不是“把文字读出来”这么简单，它是一项需要
阅读全文
Qwen3.5 × Twinkle 低成本模型训练最佳实践
作者：通义实验室发布日期：2026-03-12 17:20:20
大模型训练正在成为越来越多开发者和企业的刚需。但随着模型规模扩大，分布式训练的复杂度也呈指数级上升：显存不够用、通信开销大、配置太复杂......这些问题几乎每个做大模型训练的人都会遇到。最新开源的
阅读全文
Qwen3.5更小尺寸来啦！
作者：通义实验室发布日期：2026-03-03 08:55:00
阅读全文
一句话即可自由生成！语音双模型上线
作者：通义实验室发布日期：2026-03-02 10:38:00
在传统语音生成中，表达方式往往依赖预设标签，例如：固定情绪选项预定义语气类别限定风格模板用户只能在有限选项中选择，而难以进行更自由、细腻的表达控制。FreeStyle 新范式的核心突破在于不再依赖固定
阅读全文
CoPaw 开源！欢迎爆改你的专属智能搭档
作者：通义实验室发布日期：2026-02-28 10:46:30
年前，我们发布了《CoPaw 发布：即刻加载你的专属智能搭档》，向大家介绍了 CoPaw 这款可本地可云端部署的个人智能助理。在收集了大家对 CoPaw 的使用反馈后，AgentScope 团队对 C
阅读全文
Zvec 向量数据库，给大模型装上“外挂知识库”！
作者：通义实验室发布日期：2026-02-26 17:38:00
我们常用“大脑”比喻大模型，它负责“思考”。但落地到真实场景，还需要“外挂知识库”，为大模型提供语义检索能力。向量数据库，就是这个外挂知识库的核心引擎。它可存储多模态向量数据，让大模型快速检索到相关知
阅读全文
Qwen3.5 开源家族扩容！
作者：通义实验室发布日期：2026-02-25 09:18:52
阅读全文
Qwen3.5：更少激活参数，更强智能体能力
作者：通义实验室发布日期：2026-02-16 17:49:36
大家期盼已久的 Qwen3.5，它来啦！旗舰模型 Qwen3.5-397B-A17B 首次以开源权重形式亮相。这是一款原生视觉语言模型，通过训练阶段的早期文本-视觉融合，让视觉与语言在统一表征空间中联
阅读全文
CoPaw发布：即刻加载你的专属智能搭档
作者：通义实验室发布日期：2026-02-14 09:30:00
今年年初，OpenClaw（前身 ClawdBot）以「本地优先、多频道接入、主动心跳」的智能体范式引起关注：个人 AI 不再只是聊天框里的问答，而是可以跑在用户自己的电脑里、连着用户常用的软件、能按
阅读全文
可复用的Skill封装实践：当OpenClaw接入通义晓蜜外呼
作者：通义实验室发布日期：2026-02-12 17:24:29
近期，OpenClaw 在开发者社区引发广泛关注。作为一次面向企业应用场景的技术探索，我们尝试将其与通义晓蜜的外呼能力结合，验证了一条可行路径：将成熟的垂直 AI 能力封装为标准 Skill，供通用
阅读全文
如何让 AI 用“温柔但坚定”的语气说话？
作者：通义大模型发布日期：2026-02-05 19:00:12
通义实验室语音团队提出一种基于心理学 PAD 模型的情感语音合成框架，支持用户在愉悦度（Pleasure）、唤醒度（Arousal）和支配度（Dominance）上灵活控制情感表达。无需依赖固定情感标
阅读全文
Qwen3-Coder-Next 开源：小而强！
作者：通义大模型发布日期：2026-02-04 01:27:21
小型混合模型，能胜任复杂的编程智能体任务吗？为探索这一问题的边界，我们开源了 Qwen3-Coder-Next，一款专为编程智能体打造的高效混合专家（MoE）模型。总参数80B，激活参数仅3B，在权
阅读全文