全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Qwen3.6-27B:无需MoE路由,旗舰级编程能力

    作者:通义实验室发布日期:2026-04-22 21:00:00

    阅读全文
  • 文章封面

    我的 Agent 又乱调工具了!

    作者:通义实验室发布日期:2026-04-21 17:22:03

    精心写好的 Agent,一上线就翻车?不懂行业黑话、乱调 API、业务规则一变策略就失效……手动改 Prompt、换模型、重新部署,维护成本越来越高。静态的工程部署,根本扛不住真实业务的复杂多变。Ag

    阅读全文
  • 文章封面

    敢不敢用家乡话测试这个 AI?

    作者:通义实验室发布日期:2026-04-20 14:01:57

    你的家乡话,语音识别能听懂吗?过去,答案是“很难”。方言一出口,转写结果常常是乱码或空白。但这一切正在改变......通义实验室正式推出 Fun-ASR1.5,实现了「方言工业级可用」的语音识别大模型

    阅读全文
  • 文章封面

    Qwen3.6-35B-A3B 开源!

    作者:通义实验室发布日期:2026-04-16 21:22:14

    体量轻巧、推理高效,Qwen3.6-35B-A3B 开源!这是一款采用稀疏混合专家(MoE)架构的高效模型:总参数 350 亿,每次推理仅激活 30 亿参数。参数量虽小,性能依旧强劲。在智能体编程上,

    阅读全文
  • 文章封面

    5句AI时代的心里话,哪句戳中了你?

    作者:通义实验室发布日期:2026-04-10 15:50:56

    阅读全文
  • 文章封面

    图文视频All in One!一个开源框架搞定全模态知识库

    作者:通义实验室发布日期:2026-04-09 17:30:00

    给大模型接上企业知识库(RAG)已是行业标配。它让 AI 告别“凭空捏造”,回答有据可查。但当知识库从纯文档升级为图文、视频交织的立体资产时,传统方案就开始力不从心了。想象一家制造企业的真实知识库:1

    阅读全文
  • 文章封面

    FIPO:精准追踪2%的Token,突破大模型推理瓶颈!

    作者:通义实验室发布日期:2026-04-07 17:32:43

    蝴蝶效应告诉我们,一次微小的振翅,足以在千里之外引发风暴。但主流强化学习(RLVR)却对推理链上的每个Token一视同仁——它不知道哪一只“蝴蝶”才是关键。如何找到它?通义实验室智能计算团队连发四篇技

    阅读全文
  • 文章封面

    热浪中的每个“我”:一场关于AI与人的年度对话

    作者:通义实验室发布日期:2026-04-07 17:32:43

    阅读全文
  • 文章封面

    Wan2.7-Video 为创作自由而来

    作者:通义实验室发布日期:2026-04-03 14:14:07

    AI 视频创作,我们常遇到两大难题:内容生成不专业:想要一段紧张的追逐戏,AI 却不懂剧本;想要细腻的微表情,它只会呆板假笑。视频修改困难:多了一个路人,删不掉;动作差了点意思,改不了。换个机位?只能

    阅读全文
  • 文章封面

    Qwen3.6-Plus:编码智能体能力全面跃升!

    作者:通义实验室发布日期:2026-04-02 12:32:37

    Qwen3.6其他开源尺寸模型和更强大的Qwen3.6Max模型近期发布,敬请期待继今年 2 月发布 Qwen3.5 系列后,今天我们正式推出 Qwen3.6-Plus,现已通过阿里云百炼 API 开

    阅读全文
  • 文章封面

    Wan2.7-Image:人更真,字更稳,色更准

    作者:通义实验室发布日期:2026-04-01 14:57:08

    .

    阅读全文
  • 文章封面

    CoPaw 1.0 发布:定制小模型、安全机制与多智能体全面进化

    作者:通义实验室发布日期:2026-03-31 17:34:51

    一个月前,AgentScope 团队正式开源了 CoPaw,一款可快速部署在用户本地或云上环境的个人智能助理。CoPaw 开源以来,获得了大量来自社区的关注和贡献,我们已经合并了 900 多个 PR。

    阅读全文
  • 文章封面

    215项SOTA + 自然涌现Vibe Coding!Qwen3.5-Omni发布

    作者:通义实验室发布日期:2026-03-30 21:08:55

    为什么我们要做多模态模型?因为人与世界接触的方式是多维度的。所以我们要为 AI 装上“眼睛”和“耳朵”,让它能像人一样感知——看到你的手势,听懂你的语气,打破硅基智能与物理世界之间的次元壁。只有这样,

    阅读全文
  • 文章封面

    PrismAudio:声画同频,音效随行

    作者:通义实验室发布日期:2026-03-24 15:34:07

    当你看到一段视频:一匹马在草原上奔跑。要给这段视频配上声音,我们要保证声音像真的,还要和画面"合拍"。想完成上述这个"很简单"的任务,要同时通过四重考验:声音对吗? 必须是马蹄声,不能是鸟叫或风声(语

    阅读全文
  • 文章封面

    P-GenRM:当奖励模型遇上千人千面

    作者:通义实验室发布日期:2026-03-17 17:51:08

    同样的问题,不同的人,在不同的场景下,需要的答案可能截然不同。统一的标准,遇上千人千面的偏好,传统奖励模型显然不够用了。如何让 AI 真正适配动态变化的个性化需求?通义实验室自然语言智能团队提出了 P

    阅读全文
  • 文章封面

    Fun-CineForge:首个影视级配音多模态大模型

    作者:通义实验室发布日期:2026-03-16 15:06:26

    让 AI 给电影配音,这事难吗?能否还原出演员的情绪爆发?能否对上角色张嘴闭嘴的每一帧画面?能让观众听不出来是机器在说话吗?在影视、动画和游戏制作中,配音从来不是“把文字读出来”这么简单,它是一项需要

    阅读全文
  • 文章封面

    Qwen3.5 × Twinkle 低成本模型训练最佳实践

    作者:通义实验室发布日期:2026-03-12 17:20:20

    大模型训练正在成为越来越多开发者和企业的刚需。但随着模型规模扩大,分布式训练的复杂度也呈指数级上升:显存不够用、通信开销大、配置太复杂......这些问题几乎每个做大模型训练的人都会遇到。最新开源的

    阅读全文
  • 文章封面

    Qwen3.5更小尺寸来啦!

    作者:通义实验室发布日期:2026-03-03 08:55:00

    阅读全文
  • 文章封面

    一句话即可自由生成!语音双模型上线

    作者:通义实验室发布日期:2026-03-02 10:38:00

    在传统语音生成中,表达方式往往依赖预设标签,例如:固定情绪选项预定义语气类别限定风格模板用户只能在有限选项中选择,而难以进行更自由、细腻的表达控制。FreeStyle 新范式的核心突破在于不再依赖固定

    阅读全文
  • 文章封面

    CoPaw 开源!欢迎爆改你的专属智能搭档

    作者:通义实验室发布日期:2026-02-28 10:46:30

    年前,我们发布了《CoPaw 发布:即刻加载你的专属智能搭档》,向大家介绍了 CoPaw 这款可本地可云端部署的个人智能助理。在收集了大家对 CoPaw 的使用反馈后,AgentScope 团队对 C

    阅读全文
  • 文章封面

    Zvec 向量数据库,给大模型装上“外挂知识库”!

    作者:通义实验室发布日期:2026-02-26 17:38:00

    我们常用“大脑”比喻大模型,它负责“思考”。但落地到真实场景,还需要“外挂知识库”,为大模型提供语义检索能力。向量数据库,就是这个外挂知识库的核心引擎。它可存储多模态向量数据,让大模型快速检索到相关知

    阅读全文
  • 文章封面

    Qwen3.5 开源家族扩容!

    作者:通义实验室发布日期:2026-02-25 09:18:52

    阅读全文
  • 文章封面

    Qwen3.5:更少激活参数,更强智能体能力

    作者:通义实验室发布日期:2026-02-16 17:49:36

    大家期盼已久的 Qwen3.5,它来啦!旗舰模型 Qwen3.5-397B-A17B 首次以开源权重形式亮相。这是一款原生视觉语言模型,通过训练阶段的早期文本-视觉融合,让视觉与语言在统一表征空间中联

    阅读全文
  • 文章封面

    CoPaw发布:即刻加载你的专属智能搭档

    作者:通义实验室发布日期:2026-02-14 09:30:00

    今年年初,OpenClaw(前身 ClawdBot)以「本地优先、多频道接入、主动心跳」的智能体范式引起关注:个人 AI 不再只是聊天框里的问答,而是可以跑在用户自己的电脑里、连着用户常用的软件、能按

    阅读全文
  • 文章封面

    可复用的Skill封装实践:当OpenClaw接入通义晓蜜外呼

    作者:通义实验室发布日期:2026-02-12 17:24:29

    近期,OpenClaw 在开发者社区引发广泛关注。作为一次面向企业应用场景的技术探索,我们尝试将其与通义晓蜜的外呼能力结合,验证了一条可行路径:将成熟的垂直 AI 能力封装为标准 Skill,供通用

    阅读全文
  • 文章封面

    如何让 AI 用“温柔但坚定”的语气说话?

    作者:通义大模型发布日期:2026-02-05 19:00:12

    通义实验室语音团队提出一种基于心理学 PAD 模型的情感语音合成框架,支持用户在愉悦度(Pleasure)、唤醒度(Arousal)和支配度(Dominance)上灵活控制情感表达。无需依赖固定情感标

    阅读全文
  • 文章封面

    Qwen3-Coder-Next 开源:小而强!

    作者:通义大模型发布日期:2026-02-04 01:27:21

    小型混合模型,能胜任复杂的编程智能体任务吗? 为探索这一问题的边界,我们开源了 Qwen3-Coder-Next,一款专为编程智能体打造的高效混合专家(MoE)模型。总参数80B,激活参数仅3B,在权

    阅读全文
  • 文章封面

    Z-Image微调教程|几十张图定制你的专属角色与风格

    作者:通义大模型发布日期:2026-01-29 18:08:04

    昨天,我们正式开源并发布了全新一代文生图基础模型 Z-Image —— 一个为高度创作自由度而生的、未经蒸馏的完整 Transformer 模型。不同于追求推理速度的轻量版本(Z-Image-Turb

    阅读全文
  • 文章封面

    微调更友好的Z-Image模型现已开源!

    作者:通义大模型发布日期:2026-01-28 00:40:25

    阅读全文
  • 文章封面

    两个事奥~

    作者:通义大模型发布日期:2026-01-26 23:29:26

    Qwen3-TTS全家桶开源你的声音,你做主!通义千问正式开源 Qwen3-TTS 全系列语音合成模型,全面支持音色克隆、音色创造、超高质量拟人化语音生成,以及基于自然语言描述的语音控制,为你提供最全

    阅读全文
下一页