全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    AI应用元年,这场标杆赛事见证了中国创新速度与野心

    作者:机器之心发布日期:2025-09-10 12:00:02

    机器之心原创编辑:吴昕一场关于未来金融智能的集体预演,见证了创业者们的冲刺,也折射出一个行业的进化。2025 年的 AI ,正在上演「双线长跑」。一端是大模型底层的持续进化,远未触顶;另一端是场景应用

    阅读全文
  • 文章封面

    AI胡说八道这事,终于有人管了?

    作者:机器之心发布日期:2025-09-10 12:00:02

    机器之心报道编辑:+0、张倩想象一下,如果 ChatGPT 等 AI 大模型在生成的时候,能把自己不确定的地方都标记出来,你会不会对它们生成的答案放心很多?上周末,OpenAI 发的一篇论文引爆了社区

    阅读全文
  • 文章封面

    人人都能炼专属Agent,上海交大开源端侧Agent全栈工具链,真实场景性能超GPT-5!

    作者:机器之心发布日期:2025-09-10 12:00:02

    打开手机,让 AI Agent 自动帮你完成订外卖、订酒店、网上购物的琐碎任务,这正成为智能手机交互的新范式。一个能自主处理大部分日常任务的个人专属智能体,正在从科幻走进现实。然而,通往 “解放双手”

    阅读全文
  • 文章封面

    文心新出的推理大模型,给了我们信心

    作者:机器之心发布日期:2025-09-09 19:43:45

    机器之心报道机器之心编辑部当下的大语言模型,不怕它搞不定,就怕它胡说八道:有「幻觉」存在,我们经常会下意识地不信任 AI 输出的结果。就在上周,OpenAI 的论文《Why Language Mode

    阅读全文
  • 文章封面

    SFT远不如RL?永不过时的剃刀原则打开「终身学习」大模型训练的大门

    作者:机器之心发布日期:2025-09-09 19:43:45

    机器之心报道编辑:冷猫我们已经进入了大模型时代,越来越多的应用依赖大模型的能力,可以说大模型已经成为智能化基础设施的核心组成部分,支撑着语言,视觉分析,智能驾驶,机器人等各种下游应用。在大模型的实际使

    阅读全文
  • 文章封面

    从第一性原理出发的RAG推理新范式来了,蚂蚁DIVER登顶权威基准

    作者:机器之心发布日期:2025-09-09 19:43:45

    在当前由大语言模型(LLM)驱动的技术范式中,检索增强生成(RAG)已成为提升模型知识能力与缓解「幻觉」的核心技术。然而,现有 RAG 系统在面对需多步逻辑推理任务时仍存在显著局限,具体挑战如下:表面

    阅读全文
  • 文章封面

    全球图生视频榜单第一,爱诗科技PixVerse V5如何改变一亿用户的视频创作

    作者:机器之心发布日期:2025-09-08 14:19:27

    机器之心原创作者:冷猫好玩好用的明星视频生成产品再更新,用户操作基础,模型技术就不基础。熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。在图像生成领域,纳米香蕉在短期内

    阅读全文
  • 文章封面

    扎克伯格的豪赌初见成效?Meta新方法让LLM长上下文处理提速30倍

    作者:机器之心发布日期:2025-09-08 14:19:27

    机器之心报道编辑:+0,冷猫经历了前段时间的鸡飞狗跳,扎克伯格的投资似乎终于初见成效。近期,Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架,旨

    阅读全文
  • 文章封面

    具身VLA后训练:TeleAI提出潜空间引导的VLA跨本体泛化方法

    作者:机器之心发布日期:2025-09-08 14:19:27

    在多模态大模型的基座上,视觉 - 语言 - 动作(Visual-Language-Action, VLA)模型使用大量机器人操作数据进行预训练,有望实现通用的具身操作能力。然而,现有 VLA 基座模型

    阅读全文
  • 文章封面

    国内外AI大厂重押,初创梭哈,谁能凭「记忆」成为下一个「DeepSeek」?

    作者:机器之心发布日期:2025-09-07 13:10:24

    机器之心报道作者:Youli谁率先让模型拥有「记忆」,谁就掌握主动权。「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗?如果时间往前推半年或四五个月,业界对于这一问题可能都是疑惑、不解:彼时 Dee

    阅读全文
  • 文章封面

    斯坦福:优化器「诸神之战」?AdamW 凭「稳定」胜出

    作者:机器之心发布日期:2025-09-07 13:10:24

    机器之心报道机器之心编辑部自 2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。随着模型规模迅速扩大,预训练

    阅读全文
  • 文章封面

    字节跳动Seed推出「机器人大脑」Robix:让机器人学会思考、规划与灵活互动

    作者:机器之心发布日期:2025-09-07 13:10:24

    近日,字节跳动 Seed 团队发布了最新的机器人研究成果——Robix,一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。标题:Robix: A Unified Model for Robo

    阅读全文
  • 文章封面

    OpenAI罕见发论文:我们找到了AI幻觉的罪魁祸首

    作者:机器之心发布日期:2025-09-06 11:11:15

    机器之心报道编辑:PandaAI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。大模型会有幻觉,

    阅读全文
  • 文章封面

    00后以1.1亿美金「掀桌」,硅谷AI将书写影视新传奇 终结制片旧时代

    作者:机器之心发布日期:2025-09-06 11:11:15

    机器之心发布机器之心编辑部最年轻的工程师,和团队一起将产品卖给 Fortune 500 的客户,从 0 带到 10。她,22 岁,成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D

    阅读全文
  • 文章封面

    任意骨骼系统的模型都能驱动?AnimaX提出基于世界模型的3D动画生成新范式

    作者:机器之心发布日期:2025-09-06 11:11:15

    本文的主要作者来自北京航空航天大学、清华大学、香港大学和 VAST。本文的第一作者为北京航空航天大学硕士生黄泽桓。本文的通讯作者为北京航空航天大学盛律教授与 VAST 公司首席科学家曹炎培博士。在游戏

    阅读全文
  • 文章封面

    Nano Banana爆火之后,一个神秘的「胡萝卜」代码模型又上线了

    作者:机器之心发布日期:2025-09-05 12:28:02

    机器之心报道机器之心编辑部以前,每当上线一个新模型,大家总要绞尽脑汁想个响亮又不撞车的名字。不得不说,有时候名字起得太出彩,甚至能把模型本身给卷下去。别人还没搞懂它能干嘛,名字已经在朋友圈刷屏了。不过

    阅读全文
  • 文章封面

    沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了

    作者:机器之心发布日期:2025-09-05 12:28:02

    机器之心发布机器之心编辑部在端侧 AI 这个热门赛道,华为盘古大模型扔下了一颗 “重磅炸弹” 。如今,云端大模型已经能侃侃而谈、答疑解惑。但如果这些 AI 大脑能被装进手机、摄像头甚至无人机,会带来怎

    阅读全文
  • 文章封面

    多模态大模型持续学习系列研究,综述+Benchmark+方法+Codebase一网打尽!

    作者:机器之心发布日期:2025-09-05 12:28:02

    本系列工作核心作者: 郭海洋(自动化所博士生)、 朱飞 (中科院香港院AI中心AP)、 曾繁虎 (自动化所硕士生)、 刘文卓 (自动化所博士生)、 赵宏博 (自动化所博士生)。通讯作者为自动化所博士生

    阅读全文
  • 文章封面

    长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

    作者:机器之心发布日期:2025-09-04 12:07:43

    机器之心发布机器之心编辑部随着内容创作智能化需求的爆发,长时长、高质量数字人视频生成始终是行业痛点。近日,字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——In

    阅读全文
  • 文章封面

    全奖读AI!人工智能专业排名全球前10的MBZUAI启动本硕博项目招生

    作者:机器之心发布日期:2025-09-04 12:07:43

    机器之心发布机器之心编辑部在阿联酋 2031 国家人工智能战略的驱动下,穆罕默德・本・扎耶德人工智能大学(MBZUAI) 正以 AI 专业学术全球排名前十的硬实力,重塑 AI 教育格局。这所由阿联酋总

    阅读全文
  • 文章封面

    SIGCOMM 2025|重新定义个性化视频体验,快手与清华联合提出灵犀系统

    作者:机器之心发布日期:2025-09-04 12:07:43

    近日,快手与清华大学孙立峰团队联合发表论文《Towards User-level QoE: Large-scale Practice in Personalized Optimization of A

    阅读全文
  • 文章封面

    从复刻魔术开始,RoboMirage打开了机器人仿真的新世界

    作者:机器之心发布日期:2025-09-03 12:30:00

    机器之心发布RoboScience在具身智能的发展路径中,如何获得海量且高质量的数据是行业绕不开的核心问题。如果说大语言模型依赖于互联网规模的语料库,那么具身智能的成长同样需要规模化的交互经验。现实中

    阅读全文
  • 文章封面

    宇树科技官宣:年内提交IPO,或将冲刺科创板

    作者:机器之心发布日期:2025-09-03 12:30:00

    机器之心报道机器之心编辑部宇树的上市进程,终于又向前迈进了一步。9 月 2 日晚间,杭州宇树科技股份有限公司(简称「宇树科技」)发布声明说,预计于今年四季度向证券交易所提交上市申请文件,立即引来了大量

    阅读全文
  • 文章封面

    其实,扩散语言模型在最终解码之前很久,就已确定最终答案

    作者:机器之心发布日期:2025-09-03 12:30:00

    机器之心报道编辑:陈萍随着扩散语言模型(DLM)在各个领域的快速发展,其已成为自回归(AR)模型有力的替代方案。与 AR 模型相比,DLMs 的主要优势包括但不限于:高效的并行解码和灵活的生成顺序。尽

    阅读全文
  • 文章封面

    语音分离最全综述来了!清华等团队深度分析200+文章,系统解析「鸡尾酒会问题」研究

    作者:机器之心发布日期:2025-09-03 12:30:00

    语音分离领域针对具有挑战性的 “鸡尾酒会问题”,随着深度神经网络 (DNN) 的发展,该领域取得了革命性的进展。语音分离可以用于独立应用,在复杂的声学环境中提高语音清晰度。此外,它还可以作为其他语音处

    阅读全文
  • 文章封面

    冲上热搜!美团大模型,靠「快」火了

    作者:机器之心发布日期:2025-09-02 11:41:23

    机器之心原创编辑:张倩、陈陈国内外开发者:亲测,美团新开源的模型速度超快!当 AI 真的变得像水和电一样普及之后,模型强不强已经不是大家唯一关心的问题了。从年初的 Claude 3.7 Sonnet、

    阅读全文
  • 文章封面

    DeepMind爆火论文:向量嵌入模型存在数学上限,Scaling laws放缓实锤?

    作者:机器之心发布日期:2025-09-02 11:41:23

    机器之心报道编辑:杜伟、+0这几天,一篇关于向量嵌入(Vector Embeddings)局限性的论文在 AlphaXiv 上爆火,热度飙升到了近 9000。要理解这篇论文的重要性,我们先简单回顾一下

    阅读全文
  • 文章封面

    AI读网页,这次真不一样了,谷歌Gemini解锁「详解网页」新技能

    作者:机器之心发布日期:2025-09-02 11:41:23

    机器之心报道机器之心编辑部谷歌回归搜索老本行,这一次,它要让 AI 能像人一样「看见」网页。这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能(5 月 28 日已在 Go

    阅读全文
  • 文章封面

    性能逼近闭源最强,通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

    作者:机器之心发布日期:2025-09-02 11:41:23

    覆盖桌面、移动和 Web,7B 模型超越同类开源选手,32B 模型挑战 GPT-4o 与 Claude 3.7,通义实验室全新 Mobile-Agent-v3 现已开源。一眼看到实力:关键成绩速览。备

    阅读全文
  • 文章封面

    首个为具身智能而生的大规模强化学习框架RLinf!清华、北京中关村学院、无问芯穹等重磅开源

    作者:机器之心发布日期:2025-09-01 10:46:08

    机器之心报道机器之心编辑部清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。人工智能正在经历从 “感知” 到 “行动”

    阅读全文
上一页下一页