全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    Qwen3-Coder入门教程|10分钟搞定安装配置

    作者:通义大模型发布日期:2025-08-01 16:35:25

    欢迎来到 Qwen3-Coder 挑战赛!还在觉得 Coding 遥不可及?别担心!无论你是技术小白,还是寻求效率提升的办公达人,这篇超基础教程都将手把手带你入门。直接上手 Qwen-Code CLI

    阅读全文
  • 文章封面

    Trinity-RFT:构建智能体持续学习的自动化强化微调工厂

    作者:通义大模型发布日期:2025-07-31 19:08:42

    当大型语言模型被赋予智能体的角色,部署在开放、动态的真实环境中时,如何让它在与环境的持续交互中不断学习、持续进化,就成了核心命题。这标志着我们正迈入一个全新的“经验时代”——智能体的能力提升,将越来越

    阅读全文
  • 文章封面

    Qwen3-Coder 挑战赛启动!

    作者:通义大模型发布日期:2025-07-30 15:59:44

    阅读全文
  • 文章封面

    WebShaper:探索DeepResearch的数据理论基础

    作者:通义大模型发布日期:2025-07-29 18:00:18

    在 AI 智能体(Agent)领域,训练数据的质量决定了模型的上限。作为通义实验室推出的全新训练数据合成系统,WebShaper 通过三大核心技术模块 ,实现了训练数据的“可控、可解释、可扩展”,让

    阅读全文
  • 文章封面

    Wan2.2开源:让每个像素都懂电影美学

    作者:通义大模型发布日期:2025-07-28 21:14:40

    电影级视觉控制:对电影镜头语言的理解和还原,包含光影、色彩、构图等多维度的视觉呈现。画面风格多变,表现细腻。大幅度运动:轻松还原各类复杂运动,并进一步强化运动的流畅度和可控性。精准语义遵循:对复杂场景

    阅读全文
  • 文章封面

    超详细提示词教程|玩转Wan2.2

    作者:通义大模型发布日期:2025-07-28 21:14:40

    想让 Wan2.2 生成你心中的画面?关键在提示词怎么写。本文将带你掌握文生视频 Prompt 写作技巧,建议收藏+关注!提示词公示提示词用来描述视频中所包含的内容和运动过程,它是控制视频画面内容与效

    阅读全文
  • 文章封面

    来了!通义万相2.2开源直播

    作者:通义大模型发布日期:2025-07-27 17:14:54

    .

    阅读全文
  • 文章封面

    本周Qwen都发了啥?

    作者:通义大模型发布日期:2025-07-25 18:54:21

    阅读全文
  • 文章封面

    HumanOmniV2 比你还懂“社交潜台词”!

    作者:通义大模型发布日期:2025-07-08 12:41:23

    如何让AI真正“读懂”人心,理解对话背后的真实意图?先来查看下面这个案例⬇️在这张相亲对话截图中,暴露了多模态大模型(MLLMs)的两大认知错误:1、全局上下文理解不足模型只听到了“可以做朋友”的表面

    阅读全文
  • 文章封面

    WebSailor:探索 WebAgent的超人类推理能力

    作者:通义大模型发布日期:2025-07-07 17:08:55

    阅读全文
  • 文章封面

    ThinkSound:你的专业音效师

    作者:通义大模型发布日期:2025-07-04 14:38:43

    通义实验室首个音频生成模型 ThinkSound 开源,是时候打破“静音画面”的想象力局限了!近年来,尽管端到端视频到音频(V2A)生成技术取得了显著进展,但仍难以真正捕捉画面中的动态细节和空间关系。

    阅读全文
  • 文章封面

    真·零门槛!原来手搓AI应用这么简单

    作者:通义大模型发布日期:2025-07-03 20:38:50

    { "mcpServers": { "mcp-server-hotnews": { "command": "npx", "args": [ "-y",

    阅读全文
  • 文章封面

    如何用泡面预算,喂饱一个手机AI

    作者:通义大模型发布日期:2025-06-12 18:00:28

    这是 18 岁大一学生郑宇皓,在假期完成的一次开发实践。全程没有租用 GPU 或云服务,仅靠本地环境搭建,就完成了 14B 大模型的合并、量化与部署工作。目前就读于广州科技职业技术大学的他,所学专业是

    阅读全文
  • 文章封面

    检索增强预训练框架MaskSearch:让AI更聪明地“找答案”

    作者:通义大模型发布日期:2025-06-10 11:42:40

    你有没有遇到过这样的情况:问 AI 一个问题,它回答得头头是道,但其实是在“编答案”?这并不是 AI 故意“说谎”,而是因为它没有能力实时查找最新的外部信息 。大多数语言模型的知识都来自于它们在训练时

    阅读全文
  • 文章封面

    Qwen 家族再上新!

    作者:通义大模型发布日期:2025-06-06 12:36:53

    Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,能够将离散的、高维的符号(如文字、图片、声音等)转化为低维、连续的数字向量(Vector)的转化技术。通过捕捉不同数

    阅读全文
  • 文章封面

    WebDancer:从零训练一个 DeepResearch 类智能体

    作者:通义大模型发布日期:2025-06-05 16:40:00

    传统的问答式 AI 模型往往只能处理简单、单跳的问题,比如“北京有多少人口?”这类任务只需一次检索就能完成。但现实中的复杂问题远不止如此,例如:“某药物对晚期肺癌患者是否有效?有哪些临床试验支持?”这

    阅读全文
  • 文章封面

    视觉感知RAG×多模态推理×强化学习=VRAG-RL

    作者:通义大模型发布日期:2025-05-30 17:51:07

    在真实业务场景中,大量关键信息都藏在图像、表格、设计稿中。这些“视觉语言”,对 AI 来说不仅是理解的挑战,更是推理能力的终极考验。如何在复杂的视觉文档知识库中检索关键信息,并精细化推理给出答案? 通

    阅读全文
  • 文章封面

    360° 视频也能“听见方向”了?

    作者:通义大模型发布日期:2025-05-29 17:25:51

    当你置身于一场音乐会,闭上眼睛,仍能凭借声音判断乐器的位置;在电影院,环绕音效让我们仿佛置身于电影场景之中;这是我们大脑对声音的“空间感知”。空间音频,作为一种能够模拟真实听觉环境的技术,正逐渐成为提

    阅读全文
  • 文章封面

    语音识别怕噪声?CoGenAV 音画同步来破局!

    作者:通义大模型发布日期:2025-05-28 18:06:04

    CoGenAV 的核心理念是让 AI 模型也实现“音画同步”的深度理解。它不再只是“听见声音”,而是通过学习 audio-visual-text 之间的时序对齐关系,构建出一个更鲁棒、更通用的语音表征

    阅读全文
  • 文章封面

    手机也能跑 Qwen3?手把手教你部署!

    作者:通义大模型发布日期:2025-05-22 16:18:36

    全球开源模型冠军 Qwen3、端到端全模态模型 Qwen2.5-Omni,现已成功在手机上跑通!在 MNN 的支持下,Qwen3 系列模型已适配 Android、iOS 及桌面端,实现低延迟、本地化、

    阅读全文
  • 文章封面

    通义万相VACE开源!一款模型搞定多种视频编辑任务

    作者:通义大模型发布日期:2025-05-14 22:44:39

    此次开源的 Wan2.1-VACE-1.3B 支持 480P 分辨率,Wan2.1-VACE-14B 支持 480P 和 720P 分辨率。通过 VACE,用户可一站式完成文生视频、图像参考生成、局部

    阅读全文
  • 文章封面

    通义灵码 × Qwen3:编程智能体上线

    作者:通义大模型发布日期:2025-05-13 17:26:54

    通义灵码已全面支持 Qwen3,并正式上线编程智能体。升级后的通义灵码,不再只是“写代码”的工具,而是真正能“理解任务”的智能搭档。依托 Qwen3 的强大能力,结合智能体与 MCP 能力,通义灵码可

    阅读全文
  • 文章封面

    我用 Qwen3 做了____?

    作者:通义大模型发布日期:2025-05-06 17:30:00

    阅读全文
  • 文章封面

    Qwen3 重磅开源!

    作者:通义大模型发布日期:2025-04-29 06:45:27

    性能卓越灵活适配多场景需求作为Qwen系列全新一代的混合推理模型,Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。在相同计算资源下,Q

    阅读全文
  • 文章封面

    通义笔下的宋代山水长卷

    作者:通义大模型发布日期:2025-04-24 20:30:34

    以AI为笔墨、代码为丹青第十届中国航天日通义实验室联合中国航天局新闻宣传中心打造了一副 AIGC 宋代山水长卷如何将诗句中的意境转化为生动的视频画面“破译”诗句的镜头语言尤为重要借助 Qwen2.5-

    阅读全文
  • 文章封面

    通义万相“首尾帧挑战赛”开始!!!

    作者:通义大模型发布日期:2025-04-18 18:48:17

    阅读全文
  • 文章封面

    开源!

    作者:通义大模型发布日期:2025-04-17 22:39:33

    案例展示首帧尾帧提示词:“黑暗的环境,一群人站成一列,背对镜头,站在一束光前,镜头上移,俯拍出光源全貌。”首帧尾帧提示词:“写实风格,一个身穿粉色运动服的女生在城市街道中跑步,镜头先特写女生的脸部,然

    阅读全文
  • 文章封面

    MCP保姆级教程|从部署到Agent搭建

    作者:通义大模型发布日期:2025-04-16 18:58:23

    作为大模型的“桥梁”,MCP 通过统一标准,让大模型轻松调用各类数据源和外部工具,真正实现能力的无限扩展。MCP 协议是什么?如何快速搭建 MCP 服务并完成 Agent 配置?本文将从零开始,手把手

    阅读全文
  • 文章封面

    1张照片 2秒钟 一键变身3D数字人

    作者:通义大模型发布日期:2025-04-07 17:30:00

    Q1LHM是什么?LHM是一个单视角输入、端到端的Transformer模型,依赖于人体先验模型SMPL-X进行驱动,最终输出一个可驱动的高斯3D人体模型。你可以把LHM看作一个“魔法工具”,它能帮你

    阅读全文
  • 文章封面

    通义千问+科学家=?

    作者:通义大模型发布日期:2025-03-31 13:47:53

    水资源动态预测、天体瞬变现象、珊瑚生态退化这些「地球级难题」遇上AI都变成了可以计算的数学题当气候变化按下加速键,青藏高原正在经历一场无声的危机——“亚洲水塔失衡”。「亚洲水塔失衡」过去50年,青藏高

    阅读全文
上一页下一页