10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个
机器之心报道编辑:杨文这个AI让打工人「磕头」致谢。前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩
阅读全文机器之心报道编辑:杨文这个AI让打工人「磕头」致谢。前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩
阅读全文近年来,基于智能体的强化学习(Agent + RL)与智能体优化(Agent Optimization)在学术界引发了广泛关注。然而,实现具备工具调用能力的端到端智能体训练,首要瓶颈在于高质量任务数据
阅读全文机器之心报道机器之心编辑部不知大家是否还记得 Roy Lee 这位网红小哥,他曾先后被哈佛大学和哥伦比亚大学开除,之后辍学创办公司,并成功获得 530 万美元的投资。如今,他的初创公司 Cluely
阅读全文机器之心报道编辑:Panda据路透社等多家媒体报道,一位知情人士称,OpenAI 最近开始租用谷歌的 AI 芯片来支持 ChatGPT 及其其他产品。现目前,OpenAI 是英伟达 GPU 的最大买家
阅读全文本文第一作者为美国东北大学博士生沈轩,研究方向为高效人工智能,致力于在 GPU、移动端、FPGA 和 ASIC 等多种硬件平台上实现大模型的高效部署与加速。第二作者为香港中文大学的韩晨夏,研究方向聚焦
阅读全文机器之心报道编辑:泽南AI 生成的「最后一道关卡」已经突破?因为生成式 AI,火遍全球的 Labubu 有了超萌专属 BGM:视频来自可灵 AI 创意圈用户。复杂的自然环境也可以获得相应的背景音。视频
阅读全文机器之心报道机器之心编辑部只需一眨眼的功夫,Mercury 就把任务完成了。「我们非常高兴地推出 Mercury,这是首款专为聊天应用量身定制的商业级扩散 LLM!Mercury 速度超快,效率超高,
阅读全文本文第一作者为北京邮电大学副教授、彩云科技首席科学家肖达,其他作者为彩云科技算法研究员孟庆业、李省平,彩云科技CEO袁行远。残差连接(residual connections)自何恺明在 2015 年
阅读全文机器之心报道编辑:杨文马斯克终于不「画饼」了!4.2美元坐特斯拉Robotaxi初体验:平稳但尚不成熟。马斯克兑现了承诺。早在十年前,埃隆・马斯克就曾多次表示,特斯拉有能力推出无人驾驶服务,但后来却食
阅读全文机器之心报道编辑:Panda斯坦福大学 2025 年春季的 CS336 课程「从头开始创造语言模型(Language Models from Scratch)」相关课程和材料现已在网上全面发布! 课程
阅读全文在 3D 重建领域,无论是 NeRF 还是最新的 3D Gaussian Splatting(3DGS),在生成逼真新视角时仍面临一个核心难题:视角一旦偏离训练相机位置,图像就容易出现模糊、鬼影、几何
阅读全文机器之心报道机器之心编辑部人人都绕不开的推荐系统,如今正被注入新的 AI 动能。随着 AI 领域掀起一场由大型语言模型(LLM)引领的生成式革命,它们凭借着强大的端到端学习能力、海量数据理解能力以及前
阅读全文机器之心报道编辑:张倩生成模型会重现识别模型的历史吗?今年的 CVPR 已经在美国田纳西州纳什维尔顺利闭幕。除了交流论文、互加好友,很多参会者还参加了个非常有意思的项目 —— 追星。这个「星」自然是学
阅读全文近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大主流算法。如今,这股
阅读全文机器之心原创作者:张倩「2025 年,多模态生成是一个好方向吗?」这是一位同学在今年年初提出的问题。他之所以有此疑问,是因为在找实习时发现,狭义的 AIGC(如视频生成)岗位较少,就业前景不佳,自己的
阅读全文机器之心报道自变量机器人当 AI 放下海德格尔的锤子时,意味着机器人已经能够熟练使用工具,工具会“隐退”成为本体的延伸,而不再是需要刻意思考的对象。当一位熟练的木匠抓起锤子时,锤子消失了 —— 不是物
阅读全文机器之心报道编辑:+0人类从农耕时代到工业时代花了数千年,从工业时代到信息时代又花了两百多年,而 LLM 仅出现不到十年,就已将曾经遥不可及的人工智能能力普及给大众,让全球数亿人能够通过自然语言进行创
阅读全文本文由南京大学,香港大学,上海人工智能实验室,中国科学院大学与南洋理工大学 S-Lab 联合完成。扩散模型在视频合成任务中取得了显著成果,但其依赖迭代去噪过程,带来了巨大的计算开销。尽管一致性模型(C
阅读全文机器之心报道作者:泽南L3 级别智能驾驶的关键:大算力、大模型、大数据。端到端智能驾驶,正在沿着大模型 Scaling Laws 的道路狂奔。上周三,全球首款 L3 级算力「AI 汽车」小鹏 G7 正
阅读全文机器之心发布机器之心编辑部从春晚舞台上扭秧歌、转手绢,到稳健完整跑完半程马拉松…… 过去半年,一系列炫酷的表演,把人们对机器人的认知从想象拉进了现实。但当 AI 圈、车圈、互联网圈大佬们纷纷跻身到具身
阅读全文本文第一作者:崔文谦,香港中文大学博士生,致力于语音大模型,多模态大模型,AI音乐生成等方向的研究。由香港中文大学团队撰写的语音语言模型综述论文《Recent Advances in Speech L
阅读全文机器之心原创编辑:吴昕AI 不缺模型,缺的是能把它带到真实世界里的「玩家」,会是你吗?高考刚刚结束,AI 正在进入「真实世界的考试季」。三年前,ChatGPT 开启生成式 AI 副本,一路打怪升级,势
阅读全文机器之心原创编辑:吴昕大赛报名于2025年6月25日截止,感兴趣的团队尽快报名参赛。百舸争流,「启智杯」初赛火热进行中 随着人工智能技术的不断突破,智能化浪潮正深刻改变千行百业,中国也迎来人工智能加速
阅读全文机器之心报道机器之心编辑部上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。在机器之心的测试中,七个大模型在「2025 年数学新课标 I 卷」中的成绩是这样的:Ge
阅读全文在金融科技智能化转型进程中,大语言模型以及多模态大模型(LVLM)正成为核心技术驱动力。尽管 LVLM 展现出卓越的跨模态认知能力,其部署却长期受限于显著的算力瓶颈 —— 大小中等的模型一次多图推理可
阅读全文机器之心原创作者:闻菲真正的智能在于理解任务的模糊与复杂,Context Scaling 是通向 AGI 的关键一步。2024 年底,Ilya Sutskever 断言「我们所知的预训练时代即将终结」
阅读全文机器之心报道编辑:大盘鸡、杜伟凌晨三点的 AI 实验室,键盘敲击声在空荡的房间回响。屏幕上,博士生小王、小李、小赵正疯狂调整模型参数,只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.
阅读全文在进入本文之前,我们先来玩个 10 秒小游戏:在心里选一个「1-10」的整数。现在设想我问:「你想的是 5 吗?」如果听到是自己的数字,你会本能地答 Yes,其余统统 No。这件小事背后其实考验的是你
阅读全文本文第一作者为中国科学院大学的博士生陈若愚,主要研究可解释 AI 以及在训练推理中的落地应用。第二作者为新加坡国立大学的梁思源,主要研究可信 AI。主要合作者来自华为技术有限公司的刘势明和李茂森。通讯
阅读全文机器之心报道机器之心编辑部又到一年毕业季。这个 6 月,相信很多同学都已经收到了心仪的实习 offer,或者在准备秋招投递。对于 AI 相关专业毕业生来说,就业市场选择很多,各个大厂、小厂、初创都在积
阅读全文