通义

360° 视频也能“听见方向”了？
作者：通义大模型发布日期：2025-05-29 17:25:51
当你置身于一场音乐会，闭上眼睛，仍能凭借声音判断乐器的位置；在电影院，环绕音效让我们仿佛置身于电影场景之中；这是我们大脑对声音的“空间感知”。空间音频，作为一种能够模拟真实听觉环境的技术，正逐渐成为提
阅读全文
语音识别怕噪声？CoGenAV 音画同步来破局！
作者：通义大模型发布日期：2025-05-28 18:06:04
CoGenAV 的核心理念是让 AI 模型也实现“音画同步”的深度理解。它不再只是“听见声音”，而是通过学习 audio-visual-text 之间的时序对齐关系，构建出一个更鲁棒、更通用的语音表征
阅读全文
手机也能跑 Qwen3？手把手教你部署！
作者：通义大模型发布日期：2025-05-22 16:18:36
全球开源模型冠军 Qwen3、端到端全模态模型 Qwen2.5-Omni，现已成功在手机上跑通！在 MNN 的支持下，Qwen3 系列模型已适配 Android、iOS 及桌面端，实现低延迟、本地化、
阅读全文
通义万相VACE开源！一款模型搞定多种视频编辑任务
作者：通义大模型发布日期：2025-05-14 22:44:39
此次开源的 Wan2.1-VACE-1.3B 支持 480P 分辨率，Wan2.1-VACE-14B 支持 480P 和 720P 分辨率。通过 VACE，用户可一站式完成文生视频、图像参考生成、局部
阅读全文
通义灵码 × Qwen3：编程智能体上线
作者：通义大模型发布日期：2025-05-13 17:26:54
通义灵码已全面支持 Qwen3，并正式上线编程智能体。升级后的通义灵码，不再只是“写代码”的工具，而是真正能“理解任务”的智能搭档。依托 Qwen3 的强大能力，结合智能体与 MCP 能力，通义灵码可
阅读全文
我用 Qwen3 做了____?
作者：通义大模型发布日期：2025-05-06 17:30:00
阅读全文
Qwen3 重磅开源！
作者：通义大模型发布日期：2025-04-29 06:45:27
性能卓越灵活适配多场景需求作为Qwen系列全新一代的混合推理模型，Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。在相同计算资源下，Q
阅读全文
通义笔下的宋代山水长卷
作者：通义大模型发布日期：2025-04-24 20:30:34
以AI为笔墨、代码为丹青第十届中国航天日通义实验室联合中国航天局新闻宣传中心打造了一副 AIGC 宋代山水长卷如何将诗句中的意境转化为生动的视频画面“破译”诗句的镜头语言尤为重要借助 Qwen2.5-
阅读全文
通义万相“首尾帧挑战赛”开始！！！
作者：通义大模型发布日期：2025-04-18 18:48:17
阅读全文
开源！
作者：通义大模型发布日期：2025-04-17 22:39:33
案例展示首帧尾帧提示词：“黑暗的环境，一群人站成一列，背对镜头，站在一束光前，镜头上移，俯拍出光源全貌。”首帧尾帧提示词：“写实风格，一个身穿粉色运动服的女生在城市街道中跑步，镜头先特写女生的脸部，然
阅读全文
MCP保姆级教程｜从部署到Agent搭建
作者：通义大模型发布日期：2025-04-16 18:58:23
作为大模型的“桥梁”，MCP 通过统一标准，让大模型轻松调用各类数据源和外部工具，真正实现能力的无限扩展。MCP 协议是什么？如何快速搭建 MCP 服务并完成 Agent 配置？本文将从零开始，手把手
阅读全文
1张照片 2秒钟一键变身3D数字人
作者：通义大模型发布日期：2025-04-07 17:30:00
Q1LHM是什么？LHM是一个单视角输入、端到端的Transformer模型，依赖于人体先验模型SMPL-X进行驱动，最终输出一个可驱动的高斯3D人体模型。你可以把LHM看作一个“魔法工具”，它能帮你
阅读全文
通义千问+科学家=？
作者：通义大模型发布日期：2025-03-31 13:47:53
水资源动态预测、天体瞬变现象、珊瑚生态退化这些「地球级难题」遇上AI都变成了可以计算的数学题当气候变化按下加速键，青藏高原正在经历一场无声的危机——“亚洲水塔失衡”。「亚洲水塔失衡」过去50年，青藏高
阅读全文
通义千问+科学家=？
作者：通义大模型发布日期：2025-03-28 18:42:06
水资源动态预测、天体瞬变现象、珊瑚生态退化这些「地球级难题」遇上AI都变成了可以计算的数学题当气候变化按下加速键，青藏高原正在经历一场无声的危机——“亚洲水塔失衡”。「亚洲水塔失衡」过去50年，青藏高
阅读全文
消费级显卡也能跑！Qwen2.5-Omni-7B开源
作者：通义大模型发布日期：2025-03-27 17:39:08
Qwen2.5的秘密武器“大脑+嘴巴”双核架构Qwen2.5-Omni采用Thinker-Talker双核架构。Thinker负责“想”，Talker负责“说”，两者无缝协作！Thinker模块如同大
阅读全文
强强联合，这下超AI的～
作者：通义大模型发布日期：2025-03-26 17:59:13
阅读全文
性能提升+技术创新全拆解｜报告公开
作者：通义大模型发布日期：2025-03-25 17:30:00
可扩展训练范式多阶段递进训练：从192P图像预训练到720P视频的多阶段递进训练，结合Flow Matching框架，实现14B参数模型的高效稳定收敛。分布式训练加速：经过详细的负载分析，结合DP、C
阅读全文
多国创企、985/211高校接入通义千问
作者：通义大模型发布日期：2025-03-24 17:30:00
阅读全文
R1-Omni开源！多模态模型+RLVR，让各模态作用清晰可见
作者：通义大模型发布日期：2025-03-11 18:58:36
随着DeepSeek R1的推出，强化学习在大模型领域的潜力被进一步挖掘。Reinforcement Learning with Verifiable Reward (RLVR) 方法的出现，为多模态
阅读全文
通义千问推理模型QwQ-32B，开源！
作者：通义大模型发布日期：2025-03-06 12:39:57
QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程能力和通用能力。下图展示了 QwQ-32B 与其他模型的性能对比，包括 DeepSeek-R1-Distilled-Qwen-32B、
阅读全文
通义实验室2026届实习生招聘正式启动
作者：通义大模型发布日期：2025-03-05 11:40:00
阅读全文
通义万相，开源！
作者：通义发布日期：2025-02-25 23:19:06
本次开源的 Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势，无论是创作者、开发者还是企业用户，都可以根据自己的需求选择合适的模型和功能，轻松实现高质量的
阅读全文