全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Qwen3.5 × Twinkle 低成本模型训练最佳实践

    作者:通义实验室发布日期:2026-03-12 17:20:20

    大模型训练正在成为越来越多开发者和企业的刚需。但随着模型规模扩大,分布式训练的复杂度也呈指数级上升:显存不够用、通信开销大、配置太复杂......这些问题几乎每个做大模型训练的人都会遇到。最新开源的

    阅读全文
  • 文章封面

    Qwen3.5更小尺寸来啦!

    作者:通义实验室发布日期:2026-03-03 08:55:00

    阅读全文
  • 文章封面

    一句话即可自由生成!语音双模型上线

    作者:通义实验室发布日期:2026-03-02 10:38:00

    在传统语音生成中,表达方式往往依赖预设标签,例如:固定情绪选项预定义语气类别限定风格模板用户只能在有限选项中选择,而难以进行更自由、细腻的表达控制。FreeStyle 新范式的核心突破在于不再依赖固定

    阅读全文
  • 文章封面

    CoPaw 开源!欢迎爆改你的专属智能搭档

    作者:通义实验室发布日期:2026-02-28 10:46:30

    年前,我们发布了《CoPaw 发布:即刻加载你的专属智能搭档》,向大家介绍了 CoPaw 这款可本地可云端部署的个人智能助理。在收集了大家对 CoPaw 的使用反馈后,AgentScope 团队对 C

    阅读全文
  • 文章封面

    Zvec 向量数据库,给大模型装上“外挂知识库”!

    作者:通义实验室发布日期:2026-02-26 17:38:00

    我们常用“大脑”比喻大模型,它负责“思考”。但落地到真实场景,还需要“外挂知识库”,为大模型提供语义检索能力。向量数据库,就是这个外挂知识库的核心引擎。它可存储多模态向量数据,让大模型快速检索到相关知

    阅读全文
  • 文章封面

    Qwen3.5 开源家族扩容!

    作者:通义实验室发布日期:2026-02-25 09:18:52

    阅读全文
  • 文章封面

    Qwen3.5:更少激活参数,更强智能体能力

    作者:通义实验室发布日期:2026-02-16 17:49:36

    大家期盼已久的 Qwen3.5,它来啦!旗舰模型 Qwen3.5-397B-A17B 首次以开源权重形式亮相。这是一款原生视觉语言模型,通过训练阶段的早期文本-视觉融合,让视觉与语言在统一表征空间中联

    阅读全文
  • 文章封面

    CoPaw发布:即刻加载你的专属智能搭档

    作者:通义实验室发布日期:2026-02-14 09:30:00

    今年年初,OpenClaw(前身 ClawdBot)以「本地优先、多频道接入、主动心跳」的智能体范式引起关注:个人 AI 不再只是聊天框里的问答,而是可以跑在用户自己的电脑里、连着用户常用的软件、能按

    阅读全文
  • 文章封面

    可复用的Skill封装实践:当OpenClaw接入通义晓蜜外呼

    作者:通义实验室发布日期:2026-02-12 17:24:29

    近期,OpenClaw 在开发者社区引发广泛关注。作为一次面向企业应用场景的技术探索,我们尝试将其与通义晓蜜的外呼能力结合,验证了一条可行路径:将成熟的垂直 AI 能力封装为标准 Skill,供通用

    阅读全文
  • 文章封面

    如何让 AI 用“温柔但坚定”的语气说话?

    作者:通义大模型发布日期:2026-02-05 19:00:12

    通义实验室语音团队提出一种基于心理学 PAD 模型的情感语音合成框架,支持用户在愉悦度(Pleasure)、唤醒度(Arousal)和支配度(Dominance)上灵活控制情感表达。无需依赖固定情感标

    阅读全文
  • 文章封面

    Qwen3-Coder-Next 开源:小而强!

    作者:通义大模型发布日期:2026-02-04 01:27:21

    小型混合模型,能胜任复杂的编程智能体任务吗? 为探索这一问题的边界,我们开源了 Qwen3-Coder-Next,一款专为编程智能体打造的高效混合专家(MoE)模型。总参数80B,激活参数仅3B,在权

    阅读全文
  • 文章封面

    Z-Image微调教程|几十张图定制你的专属角色与风格

    作者:通义大模型发布日期:2026-01-29 18:08:04

    昨天,我们正式开源并发布了全新一代文生图基础模型 Z-Image —— 一个为高度创作自由度而生的、未经蒸馏的完整 Transformer 模型。不同于追求推理速度的轻量版本(Z-Image-Turb

    阅读全文
  • 文章封面

    微调更友好的Z-Image模型现已开源!

    作者:通义大模型发布日期:2026-01-28 00:40:25

    阅读全文
  • 文章封面

    两个事奥~

    作者:通义大模型发布日期:2026-01-26 23:29:26

    Qwen3-TTS全家桶开源你的声音,你做主!通义千问正式开源 Qwen3-TTS 全系列语音合成模型,全面支持音色克隆、音色创造、超高质量拟人化语音生成,以及基于自然语言描述的语音控制,为你提供最全

    阅读全文
  • 文章封面

    AI应用上线就崩?你可能缺个“评测引擎”

    作者:通义大模型发布日期:2026-01-22 17:54:15

    你的AI应用是不是“一上线就崩”?调优全靠感觉,修复一个 Bug 却引入两个新问题?很多开发者在从 POC(早期原型)走向真实生产环境时都会遇到这样的困境:在 Demo 中惊艳的 Agent,一旦面对

    阅读全文
  • 文章封面

    当AI面对“说不清”的需求:如何实现更优解?

    作者:通义大模型发布日期:2026-01-14 17:39:55

    在数学、代码等有标准答案的场景,强化学习已取得瞩目成绩。但在真实世界里,大多数问题没有唯一解——尤其是那些需求模糊、约束多元、解空间巨大的开放域任务。而出行规划正是这类任务的“天然试验场”。如:“帮我

    阅读全文
  • 文章封面

    多模态搜索新标杆,Qwen3-VL-Embedding&Reranker开源!

    作者:通义大模型发布日期:2026-01-08 22:11:38

    去年,我们开源了 Qwen3-Embedding 和 Qwen3-Reranker 模型,凭借其在多语言检索、聚类等任务中的领先性能,受到了开发者的喜爱。今天,Qwen 家族新成员+2,我们正式发布

    阅读全文
  • 文章封面

    如何用Fun-ASR-Nano微调一个“听懂行话”的语音模型?

    作者:通义大模型发布日期:2026-01-07 17:50:00

    虽然通用语音识别模型在大多数场景下表现不错,但有些时候,面对专业术语、特定口音或私有词汇时,难免“听错”甚至“幻听”,比如把内部产品代号识别为常见词,或在方言会议中漏掉关键信息。如果你希望模型更贴合自

    阅读全文
  • 文章封面

    MAI-UI 开源:通用 GUI 智能体基座登顶 SOTA!

    作者:通义大模型发布日期:2025-12-29 11:31:15

    “帮我查最早从杭州西站到上海虹桥的二等座车次,在钉钉前沿技术研讨群同步到达时间,再把我和水番的会议改到明天同一时间,并在群里@他说明因出差调整,问明天是否有空。”当用户发出这样一条指令,MAI-UI

    阅读全文
  • 文章封面

    端侧AI创新挑战赛|获奖名单

    作者:通义大模型发布日期:2025-12-26 12:22:24

    本次赛事共吸引 900+ 开发者报名,收到超 100 份高质量作品,覆盖智能家居、无障碍交互、科研辅助、教育、游戏、办公、工业巡检等多个真实场景。参赛团队不仅展现了对 Qwen 大模型、OpenVIN

    阅读全文
  • 文章封面

    Z-Image-Turbo 本地 Docker 部署指南

    作者:通义大模型发布日期:2025-12-24 17:44:01

    上篇文章中,我们通过模型下载、ComfyUI 配置、提示词调试和报错排查,完成了 Z-Image 的本地部署与使用。本文则介绍另一种更轻量的方式:使用 Docker 一键部署 Z-Image-Turb

    阅读全文
  • 文章封面

    📢 我们发布了新一代端到端语音交互模型 Fun-Audio-Chat!

    作者:通义大模型发布日期:2025-12-23 17:37:28

    阅读全文
  • 文章封面

    你的AI,能过真实电商这一关吗?

    作者:通义大模型发布日期:2025-12-17 18:08:41

    如果一款电商 AI 助手,却算不清跨境税费、看不懂最新促销政策、选不出潜力爆品……这样的 AI,你敢用在生意里吗?这正是当前多数 AI Agent 面临的困境:在实验室里“样样都会”,一到真实商业场景

    阅读全文
  • 文章封面

    人人都能当导演?Wan 2.6 发布!

    作者:通义大模型发布日期:2025-12-16 14:43:56

    .

    阅读全文
  • 文章封面

    通义百聆语音双子星,同步开源!

    作者:通义大模型发布日期:2025-12-15 16:01:34

    只需3秒录音,就能让你的声音无缝切换语种、方言与情绪——中、粤、日、英、开心、愤怒......9 种通用语言、18种方言,通通搞定!一段嘈杂环境下的会议录音,AI 也能毫秒级输出文字,绕口令、RAP、

    阅读全文
  • 文章封面

    AgentScope 1.0 全面进化,从原型走向产业落地!

    作者:通义大模型发布日期:2025-12-12 11:56:24

    我们曾经畅想,未来的智能体不仅能思考,还能像人类专家一样——拥有专属技能、实时响应,并安全执行真实任务。本次 AgentScope 更新,实现了一次面向生产级智能体应用的基建全面升级。我们聚焦生产级落

    阅读全文
  • 文章封面

    阿里云析言XiYan-SQL智能体,登顶BIRD-CRITIC全球榜单!

    作者:通义大模型发布日期:2025-12-09 13:40:04

    阅读全文
  • 文章封面

    阿里云析言XiYan-SQL智能体,登顶BIRD-CRITIC全球榜单!

    作者:通义大模型发布日期:2025-12-05 13:45:47

    阅读全文
  • 文章封面

    阿里云通义智能硬件展,1月8日见!

    作者:通义大模型发布日期:2025-12-04 19:05:26

    ↓ 点击「阅读原文」,直达官网了解更多信息!

    阅读全文
  • 文章封面

    Z-Image 零基础上手指南:本地部署 + 提示词模板实战

    作者:通义大模型发布日期:2025-12-03 18:21:34

    无需 4090,6GB 显存笔记本也能生成带中文字的商业级海报!Z-Image 作为一款高效能、轻量化的生成式 AI 模型,不仅推理速度快,更原生支持中英双语理解与精准渲染。本文将从模型下载 → 配置

    阅读全文
下一页