机器之心

马斯克吹牛了吗？Grok 4第一波实测出炉：既能完虐o3，也菜到数不清6根手指
作者：机器之心发布日期：2025-07-11 16:27:38
机器之心报道机器之心编辑部网友氪重金体验Grok4。昨天，马斯克亮相 Grok 4 发布会，一脸骄傲地表示：Grok 现在所有学科都达到博士后水平，没有例外，甚至可以在今年内实现科学新发现。这一下子激
阅读全文
实测Vidu Q1参考生功能，看到诸葛亮丘吉尔拿破仑在长城拍照留念
作者：机器之心发布日期：2025-07-11 16:27:38
机器之心报道编辑：Youli这次真的不一样，遇到了「想象力的神」！以前常说「要把自己活成一支队伍」，如今感谢 AI，真的实现了。最近，生数科技旗下 AI 视频模型 Vidu Q1 推出参考生功能，极大
阅读全文
微软研究院BioEmu登上Science，用生成式AI重塑蛋白质功能研究
作者：机器之心发布日期：2025-07-11 16:27:38
7 月 10 日，微软研究院 AI for Science 团队在《Science》杂志发表了题为「Scalable emulation of protein equilibrium ensemble
阅读全文
告别Transformer！北大、北邮、华为开源纯卷积DiC：3x3卷积实现SOTA性能，比DiT快5倍！
作者：机器之心发布日期：2025-07-11 16:27:38
当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时，一项来自北大、北邮和华为的最新研究却反其道而行之，重新审视了深度学习中最基础、最经典的模块——3x3 卷积。他们提出的 D
阅读全文
奖励模型终于迎来预训练新时代！上海AI Lab、复旦POLAR，开启Scaling新范式
作者：机器之心发布日期：2025-07-10 12:26:47
机器之心发布机器之心编辑部在大语言模型后训练阶段，强化学习已成为提升模型能力、对齐人类偏好，并有望迈向 AGI 的核心方法。然而，奖励模型的设计与训练始终是制约后训练效果的关键瓶颈。目前，主流的奖励建
阅读全文
他47岁转方向，一举解决了球体堆积领域内最大的未解问题
作者：机器之心发布日期：2025-07-10 12:26:47
选自quantamagazine作者：Joseph Howlett机器之心编译编辑：泽南在数学领域里，对于最优模式的探索永无止境，球体填充问题也不例外，它旨在尽可能高效地将球体塞进一个（高维）盒子里。
阅读全文
VLA统一架构新突破：自回归世界模型引领具身智能
作者：机器之心发布日期：2025-07-10 12:26:47
本文来自：王宇琪，中国科学院自动化所博士，研究方向为世界模型，自动驾驶感知与决策等，在 CVPR、NeurIPS、ICCV、ECCV、ICLR 等顶级会议上发表过多篇论文。王鑫龙团队，北京智源研究院，
阅读全文
ICML 2025 | 给AI装上「智能升级插件」！阿里安全-清华大学D-MoLE让模型在持续学习中动态进化
作者：机器之心发布日期：2025-07-10 12:26:47
本文第一作者为清华大学计算机系的硕士二年级研究生葛晨笛，研究方向为多模态大语言模型、自动机器学习和图机器学习。主要合作者为来自阿里巴巴集团安全部的樊珈珮、黄龙涛和薛晖。通讯作者为清华大学的朱文武教授、
阅读全文
刚刚，为对抗哥大退学生开发的AI作弊器，哥大学生造了个AI照妖镜
作者：机器之心发布日期：2025-07-09 12:23:49
机器之心报道编辑：PandaCluely 和 Roy Lee，想必大家对这两个名字已经不陌生了。简单来说，后者与 Neel Shanmugam 共同创办了名为 Cluely 的创业公司，而他们目前的主
阅读全文
OpenAI反挖四位特斯拉、xAI、Meta高级工程师，目标星际之门
作者：机器之心发布日期：2025-07-09 12:23:49
机器之心报道机器之心编辑部反击从这里开始？最近 Meta 挖 AI 人才成了科技圈最大的瓜。有人找到了山姆・奥特曼，问他有关扎克伯格和 Meta 挖人的看法。奥特曼说：还行吧。实际上表面的尴尬之下，激
阅读全文
百万奖金 + 顶配资源！AI 创业者征集令！
作者：机器之心发布日期：2025-07-09 12:23:49
“AI赋能未来：创新与应用的无限可能”复曜青溪智链长三角——上海银行杯AI创新创业大赛正式启动！这里不仅是技术的竞技场更是梦想的孵化器聚焦AI技术在技术创新、产业应用中的跨界融合推动AI模型从实验室
阅读全文
给你一群顶尖AI，如何组队才能发挥最大战力？UIUC用一个新的多智能体协作基准寻找答案
作者：机器之心发布日期：2025-07-09 12:23:49
朱昆仑是伊利诺伊大学香槟分校（UIUC）计算机科学系的研究生，现隶属于Ulab与Blender Lab，曾在斯坦福大学、卡内基梅隆大学（CMU）与蒙特利尔学习算法研究所（Mila）进行学术访问。他的研
阅读全文
V·STAR顶尖人才计划启动｜不只是顶薪+期权，更与VAST一起定义下一代3D范式
作者：机器之心发布日期：2025-07-08 12:09:08
阅读全文
Transformer死角，只需500步后训练，循环模型突破256k长度泛化极限
作者：机器之心发布日期：2025-07-08 12:09:08
机器之心报道编辑：陈陈、笑寒线性循环模型（如 Mamba）和线性注意力机制都具备这样一个显著优势：它们能够处理极长的序列，这一能力对长上下文推理任务至关重要。事实上，这正是它们相较于 Transfor
阅读全文
ICML 2025 | 清华、上海AI Lab提出专家级医学基准MedXpertQA，看o3、R1哪家强
作者：机器之心发布日期：2025-07-08 12:09:08
本文作者来自于清华大学和上海 AI Lab，通讯作者为清华大学丁宁助理教授和清华大学讲席教授、上海 AI Lab 主任周伯文教授。论文标题：MedXpertQA: Benchmarking Exper
阅读全文
RL 圈的夏夜之约！12 人唠嗑局：当强化学习撞上大模型 Agent
作者：机器之心发布日期：2025-07-08 12:09:08
🌟 嘿！RL 圈的潮玩咖看过来！大模型时代卷起技术狂潮，强化学习（RL）早已不是 “小众玩家”，当它牵手大模型智能体，直接开启「王炸组合」模式！想不想潜入神秘据点，边嗨边聊最 in 的 RL 新范式？
阅读全文
重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%
作者：机器之心发布日期：2025-07-07 12:48:00
机器之心发布机器之心编辑部大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向，MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升，平均准确性提升超过 38.97%
阅读全文
新范式来了！新能量模型打破Transformer++扩展上限，训练扩展率快35%
作者：机器之心发布日期：2025-07-07 12:48:00
机器之心报道机器之心编辑部是否可以在不依赖额外监督的前提下，仅通过无监督学习让模型学会思考？答案有了。在心理学领域，人类思维通常被划分为两种不同类型：系统 1（快速思维）和系统 2（慢速思维）。当面
阅读全文
Stream-Omni：同时支持各种模态组合交互的文本-视觉-语音多模态大模型
作者：机器之心发布日期：2025-07-07 12:48:00
GPT-4o式的多模态大模型（LMMs）展现出在文本、视觉和语音模态上的全能能力，其在线语音服务还能在语音交互过程中同步提供中间文本结果（即用户输入和模型响应的转录内容），为用户提供“边看边听”的灵活
阅读全文
求医十年，病因不明，ChatGPT：你看起来有基因突变
作者：机器之心发布日期：2025-07-06 11:49:22
机器之心报道编辑：张倩用AI给自己看病正在成为新趋势，但目前我们仍需要人类医生。身体不适，求医十年，医生没找出原因，ChatGPT 给分析出来了。这是一位 Reddit 网友刚刚分享的个人经历。这位网
阅读全文
原来Scaling Law还能被优化？Meta这招省token又提效
作者：机器之心发布日期：2025-07-06 11:49:22
机器之心报道编辑：Panda2017 年，一篇《Attention Is All You Need》论文成为 AI 发展的一个重要分水岭，其中提出的 Transformer 依然是现今主流语言模型的基
阅读全文
集成20+先进算法，优于GPT-4o，自主因果分析智能体来了
作者：机器之心发布日期：2025-07-06 11:49:22
来自加利福尼亚大学圣迭戈分校（UC San Diego）Biwei Huang 实验室的研究团队提出了一种自主因果分析智能体 Causal-Copilot。该实验室专注于因果推理与机器学习的交叉研究，
阅读全文
刚刚，Grok4跑分曝光：「人类最后考试」拿下45%，是Gemini 2.5两倍，但网友不信
作者：机器之心发布日期：2025-07-05 10:46:45
机器之心报道编辑：杨文、泽南马斯克搭帐篷熬夜开发有效果了？这么高跑分，还不发布。刚刚，Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称，Grok
阅读全文
ICCV 2025｜降低扩散模型中的时空冗余，上交大EEdit实现免训练图像编辑加速
作者：机器之心发布日期：2025-07-05 10:46:45
本论文共同第一作者闫泽轩和马跃分别是上海交通大学人工智能学院2025级研究生，以及香港科技大学2024级博士生。目前在上海交通大学EPIC Lab进行科研实习，接受张林峰助理教授指导，研究方向是高效模
阅读全文
ICML 2025 | 多智能体的ChatGPT时刻？上交MAS-GPT实现工作流一键生成
作者：机器之心发布日期：2025-07-05 10:46:45
本文第一作者叶锐，上海交通大学博士三年级，研究方向是大模型多智能体，联邦学习，博士导师陈思衡，上海交通大学人工智能学院副教授。OpenAI 将 “组织级智能 (Organizational AI)”
阅读全文
人机协同筛出2600万条数据，七项基准全部SOTA，昆仑万维开源奖励模型再迎新突破
作者：机器之心发布日期：2025-07-04 10:36:29
机器之心报道编辑：杜伟、泽南大语言模型（LLM）以生成能力强而著称，但如何能让它「听话」，是一门很深的学问。基于人类反馈的强化学习（RLHF）就是用来解决这个问题的，其中的奖励模型（Reward M
阅读全文
10分钟搞定Excel世锦赛难题！首个超越人类Excel Agent，网友：想给它磕一个
作者：机器之心发布日期：2025-07-04 10:36:29
机器之心报道编辑：杨文这个AI让打工人「磕头」致谢。前段时间，我们报道了 5 款大模型参加了今年山东高考的事儿，为了弄清楚各大模型在 9 个科目中的具体表现，我们对着测评明细表挨个儿分析，搞得狼狈又崩
阅读全文
Agent RL和智能体自我进化的关键一步: TaskCraft实现复杂智能体任务的自动生成
作者：机器之心发布日期：2025-07-04 10:36:29
近年来，基于智能体的强化学习（Agent + RL）与智能体优化（Agent Optimization）在学术界引发了广泛关注。然而，实现具备工具调用能力的端到端智能体训练，首要瓶颈在于高质量任务数据
阅读全文
扬言将杀死9个行业，21岁小哥又开发人生作弊器，曾被哥大、哈佛开除
作者：机器之心发布日期：2025-06-28 12:35:42
机器之心报道机器之心编辑部不知大家是否还记得 Roy Lee 这位网红小哥，他曾先后被哈佛大学和哥伦比亚大学开除，之后辍学创办公司，并成功获得 530 万美元的投资。如今，他的初创公司 Cluely
阅读全文
OpenAI转向谷歌TPU：宿敌也能变朋友？
作者：机器之心发布日期：2025-06-28 12:35:42
机器之心报道编辑：Panda据路透社等多家媒体报道，一位知情人士称，OpenAI 最近开始租用谷歌的 AI 芯片来支持 ChatGPT 及其其他产品。现目前，OpenAI 是英伟达 GPU 的最大买家
阅读全文