云栖大会,Qwen在现场等你来!
2025云栖大会「通义干问模型技术分论坛」与「Agentic Coding线下研讨会」正式官宣!通义干问模型技术分论坛⏰ 9月25日 上午9:40📍 杭州·云栖大会 · 会展中心D2-1我们也会同步开
阅读全文2025云栖大会「通义干问模型技术分论坛」与「Agentic Coding线下研讨会」正式官宣!通义干问模型技术分论坛⏰ 9月25日 上午9:40📍 杭州·云栖大会 · 会展中心D2-1我们也会同步开
阅读全文刚刚,我们发布了下一代基础模型架构 Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B 系列模型。我们认为Context Length Scaling和Total Par
阅读全文今天,我们正式推出通义千问系列最新的语音识别模型 Qwen3-ASR-Flash,它基于Qwen3基座模型,经海量多模态数据以及千万⼩时规模的ASR(自动语音识别)数据训练构建而成。Qwen3-ASR
阅读全文我们很⾼兴推出 Qwen-Image-Edit,Qwen-Image的图像编辑版本。Qwen-Image-Edit基于我们20B的Qwen-Image模型进⼀步训练,成功将Qwen-Image的独特的
阅读全文我们很高兴开源 Qwen-Image,一个20B的MMDiT模型。这是通义千问系列中首个图像生成基础模型,其在复杂文本渲染和精确图像编辑方面取得了显著进展。Qwen-Image的主要特性包括:卓越的文
阅读全文强化学习 (Reinforcement Learning,RL)已成为拓展语言模型、增强其深度推理与问题求解能力的关键技术范式。为了持续拓展 RL,首要前提是确保稳定、鲁棒的训练过程。然而,我们观察到
阅读全文多模态大模型的演进正在不断突破我们对技术边界的认知。从最初的 Qwen-VL 到如今的 Qwen2.5 -VL,我们在提升模型对图像内容的理解能力方面取得了一些进展。今天,我们正式推出 Qwen VL
阅读全文今天,我们正式发布Qwen3-Embedding系列模型, Qwen模型家族的新成员。该系列模型专为文本表征、检索与排序任务设计,基于Qwen3基础模型进行训练,充分继承了Qwen3在多语言文本理解能
阅读全文Scaling Law最早在语言建模当中被发现,在下一个词预测任务当中,研究者们发现测试损失随着训练规模和模型规模的指数增长而线性下降。这一发现迄今促成了一系列强大的语言模型,他们对人类语言和知识展现
阅读全文提升大模型智能水平,通常有两条主流的Scaling Law(扩展定律)路线:一是扩展参数(Parameter Scaling),用更多模型参数来更细致地学习,进而提升性能;二是扩展推理思考的时间(In
阅读全文