全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Wan2.2-S2V 正式发布!

    作者:通义大模型发布日期:2025-08-26 22:49:39

    阅读全文
  • 文章封面

    AI通识课|和通义一起动手学AI

    作者:通义大模型发布日期:2025-08-25 17:17:29

    如何让每一位大学生都能真正“动手”学 AI,而不只是听概念、看 PPT?由通义大模型提供模型能力支持,阿里云携手超星尔雅,联合北京大学、南京大学、复旦大学、上海交通大学、浙江大学五所高校名师,共同推出

    阅读全文
  • 文章封面

    先SFT后RL但是效果不佳?你可能没用好“离线专家数据”!

    作者:通义大模型发布日期:2025-08-20 17:30:00

    提到提升大模型能力,SFT(监督微调)再接 RL(强化学习)的范式是一套常见操作。但在各种场景实践后,你可能会发现事情并没有那么简单。作为大模型从业者或者研究人员的你,大概率也遇到过以下困境之一:越学

    阅读全文
  • 文章封面

    WebWatcher:挑战多模态Deep Research极限的开源视觉智能体

    作者:通义大模型发布日期:2025-08-15 17:06:32

    尽管闭源系统如 OpenAI 的 DeepResearch 已展现出强大的文本深度研究能力,但它们大多局限于纯文本环境,难以处理现实世界中无处不在的图像、图表和混合内容。而现有开源 Agent 也面临

    阅读全文
  • 文章封面

    真的假的?填个表格,就能调动1000个AI程序员给我打工?

    作者:通义大模型发布日期:2025-08-14 18:26:29

    当打工人用上了 AI 搭子......过去需要一个研发团队一天才能完成的事,现在一个人、几分钟就能闭环完成。只需要在钉钉 AI 表格里敲一行需求,或上传一份文档,系统就能自动触发阿里云百炼工作流,将任

    阅读全文
  • 文章封面

    图生视频更“轻快”| Wan2.2-I2V-Flash 全新发布

    作者:通义大模型发布日期:2025-08-11 15:32:54

    阅读全文
  • 文章封面

    下班前5分钟,看完本周模型动态!

    作者:通义大模型发布日期:2025-08-08 17:14:34

    阅读全文
  • 文章封面

    从零到上线:用 Qwen3-Coder 和 MCP 打造儿童学习助手

    作者:通义大模型发布日期:2025-08-07 17:42:50

    本篇是《Qwen3-Coder 挑战赛》系列教程的第二期:借助 Qwen3-Coder 模型强大的代码生成与任务代理能力,结合 MCP 部署方案 与 VS Code 插件工具链(通义灵码),从零开始打

    阅读全文
  • 文章封面

    2026届秋季校招通道开启,抢占Offer先机!

    作者:通义大模型发布日期:2025-08-06 10:15:43

    阅读全文
  • 文章封面

    感谢家人们,榜一了!

    作者:通义大模型发布日期:2025-08-05 20:36:46

    阅读全文
  • 文章封面

    这几个狮子座模型,7月份的尾巴也是稳稳踩上了!

    作者:通义大模型发布日期:2025-08-04 18:08:08

    阅读全文
  • 文章封面

    Qwen3-Coder入门教程|10分钟搞定安装配置

    作者:通义大模型发布日期:2025-08-01 16:35:25

    欢迎来到 Qwen3-Coder 挑战赛!还在觉得 Coding 遥不可及?别担心!无论你是技术小白,还是寻求效率提升的办公达人,这篇超基础教程都将手把手带你入门。直接上手 Qwen-Code CLI

    阅读全文
  • 文章封面

    Trinity-RFT:构建智能体持续学习的自动化强化微调工厂

    作者:通义大模型发布日期:2025-07-31 19:08:42

    当大型语言模型被赋予智能体的角色,部署在开放、动态的真实环境中时,如何让它在与环境的持续交互中不断学习、持续进化,就成了核心命题。这标志着我们正迈入一个全新的“经验时代”——智能体的能力提升,将越来越

    阅读全文
  • 文章封面

    Qwen3-Coder 挑战赛启动!

    作者:通义大模型发布日期:2025-07-30 15:59:44

    阅读全文
  • 文章封面

    WebShaper:探索DeepResearch的数据理论基础

    作者:通义大模型发布日期:2025-07-29 18:00:18

    在 AI 智能体(Agent)领域,训练数据的质量决定了模型的上限。作为通义实验室推出的全新训练数据合成系统,WebShaper 通过三大核心技术模块 ,实现了训练数据的“可控、可解释、可扩展”,让

    阅读全文
  • 文章封面

    Wan2.2开源:让每个像素都懂电影美学

    作者:通义大模型发布日期:2025-07-28 21:14:40

    电影级视觉控制:对电影镜头语言的理解和还原,包含光影、色彩、构图等多维度的视觉呈现。画面风格多变,表现细腻。大幅度运动:轻松还原各类复杂运动,并进一步强化运动的流畅度和可控性。精准语义遵循:对复杂场景

    阅读全文
  • 文章封面

    超详细提示词教程|玩转Wan2.2

    作者:通义大模型发布日期:2025-07-28 21:14:40

    想让 Wan2.2 生成你心中的画面?关键在提示词怎么写。本文将带你掌握文生视频 Prompt 写作技巧,建议收藏+关注!提示词公示提示词用来描述视频中所包含的内容和运动过程,它是控制视频画面内容与效

    阅读全文
  • 文章封面

    来了!通义万相2.2开源直播

    作者:通义大模型发布日期:2025-07-27 17:14:54

    .

    阅读全文
  • 文章封面

    本周Qwen都发了啥?

    作者:通义大模型发布日期:2025-07-25 18:54:21

    阅读全文
  • 文章封面

    HumanOmniV2 比你还懂“社交潜台词”!

    作者:通义大模型发布日期:2025-07-08 12:41:23

    如何让AI真正“读懂”人心,理解对话背后的真实意图?先来查看下面这个案例⬇️在这张相亲对话截图中,暴露了多模态大模型(MLLMs)的两大认知错误:1、全局上下文理解不足模型只听到了“可以做朋友”的表面

    阅读全文
  • 文章封面

    WebSailor:探索 WebAgent的超人类推理能力

    作者:通义大模型发布日期:2025-07-07 17:08:55

    阅读全文
  • 文章封面

    ThinkSound:你的专业音效师

    作者:通义大模型发布日期:2025-07-04 14:38:43

    通义实验室首个音频生成模型 ThinkSound 开源,是时候打破“静音画面”的想象力局限了!近年来,尽管端到端视频到音频(V2A)生成技术取得了显著进展,但仍难以真正捕捉画面中的动态细节和空间关系。

    阅读全文
  • 文章封面

    真·零门槛!原来手搓AI应用这么简单

    作者:通义大模型发布日期:2025-07-03 20:38:50

    { "mcpServers": { "mcp-server-hotnews": { "command": "npx", "args": [ "-y",

    阅读全文
  • 文章封面

    如何用泡面预算,喂饱一个手机AI

    作者:通义大模型发布日期:2025-06-12 18:00:28

    这是 18 岁大一学生郑宇皓,在假期完成的一次开发实践。全程没有租用 GPU 或云服务,仅靠本地环境搭建,就完成了 14B 大模型的合并、量化与部署工作。目前就读于广州科技职业技术大学的他,所学专业是

    阅读全文
  • 文章封面

    检索增强预训练框架MaskSearch:让AI更聪明地“找答案”

    作者:通义大模型发布日期:2025-06-10 11:42:40

    你有没有遇到过这样的情况:问 AI 一个问题,它回答得头头是道,但其实是在“编答案”?这并不是 AI 故意“说谎”,而是因为它没有能力实时查找最新的外部信息 。大多数语言模型的知识都来自于它们在训练时

    阅读全文
  • 文章封面

    Qwen 家族再上新!

    作者:通义大模型发布日期:2025-06-06 12:36:53

    Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,能够将离散的、高维的符号(如文字、图片、声音等)转化为低维、连续的数字向量(Vector)的转化技术。通过捕捉不同数

    阅读全文
  • 文章封面

    WebDancer:从零训练一个 DeepResearch 类智能体

    作者:通义大模型发布日期:2025-06-05 16:40:00

    传统的问答式 AI 模型往往只能处理简单、单跳的问题,比如“北京有多少人口?”这类任务只需一次检索就能完成。但现实中的复杂问题远不止如此,例如:“某药物对晚期肺癌患者是否有效?有哪些临床试验支持?”这

    阅读全文
  • 文章封面

    视觉感知RAG×多模态推理×强化学习=VRAG-RL

    作者:通义大模型发布日期:2025-05-30 17:51:07

    在真实业务场景中,大量关键信息都藏在图像、表格、设计稿中。这些“视觉语言”,对 AI 来说不仅是理解的挑战,更是推理能力的终极考验。如何在复杂的视觉文档知识库中检索关键信息,并精细化推理给出答案? 通

    阅读全文
  • 文章封面

    360° 视频也能“听见方向”了?

    作者:通义大模型发布日期:2025-05-29 17:25:51

    当你置身于一场音乐会,闭上眼睛,仍能凭借声音判断乐器的位置;在电影院,环绕音效让我们仿佛置身于电影场景之中;这是我们大脑对声音的“空间感知”。空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提

    阅读全文
  • 文章封面

    语音识别怕噪声?CoGenAV 音画同步来破局!

    作者:通义大模型发布日期:2025-05-28 18:06:04

    CoGenAV 的核心理念是让 AI 模型也实现“音画同步”的深度理解。它不再只是“听见声音”,而是通过学习 audio-visual-text 之间的时序对齐关系,构建出一个更鲁棒、更通用的语音表征

    阅读全文
下一页