GPT-5.2已上线24小时:差评如潮!
机器之心报道编辑:杨文网友吐槽GPT-5.2「不通人性」。X 上充斥着对 GPT-5.2 的恶评。昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业
阅读全文机器之心报道编辑:杨文网友吐槽GPT-5.2「不通人性」。X 上充斥着对 GPT-5.2 的恶评。昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业
阅读全文机器之心报道编辑:Panda邹忌曾经有一个问题:吾与徐公孰美?而对于 REPA,也有一个类似的问题:全局信息与空间结构,哪个对表征对齐更重要?表征对齐(REPA)可通过将强大的预训练视觉编码器的表征蒸
阅读全文多语言大模型(MLLM)在面对多语言任务时,往往面临一个选择难题:是用原来的语言直接回答,还是翻译成高资源语言去推理?实际上,不同的语言在模型内部承载着不同的「特长」。比如英语可能逻辑性强,适合科学推
阅读全文机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源:其中有我们熟悉的 Yuke Zhu 的研究,也有
阅读全文机器之心报道编辑:+0随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能,公司内部正面临多重挑战。据《纽约时报》报道,Meta 新组建的顶尖 AI 团队与公司原有的核心业务部门之间,在资源分配、发
阅读全文尹博:NUS 计算机工程硕士生、LV Lab 实习生,研究方向是生成式 AI,及参数高效率微调(PEFT)。胡晓彬:NUS LV Lab Senior Research Fellow, 研究方向是生成
阅读全文机器之心发布作者:白铂 博士白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家2022 年底,ChatGPT 横空出世,其能力震惊了整个世界。2024 年底,DeepSeek 以极低
阅读全文机器之心报道机器之心编辑部不久前,NeurIPS 2025 顺利举办,作为人工智能学术界的顶级会议之一,其中不乏学术界大佬的工作和演讲。有一项荣誉的颁发显得格外厚重且众望所归 —— 由任少卿、何恺明、
阅读全文实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜
阅读全文机器之心报道编辑:冷猫、Panda「安静!吵到我用 TNT 了!」长期关注科技圈的朋友们都知道,罗永浩的锤子科技落幕已经七年。七年间,仍有无数锤科粉丝保留着旧手机备用,怀念手机圈当年的「锐利异类」,以
阅读全文机器之心报道编辑:Panda刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列:Devstral 2。该系列开源模型包含两个尺寸:Devstral 2 (12
阅读全文费森俞,上海创智学院 & 同济大学博士一年级学生,导师赵宪忠教授,研究方向为 VLA 强化学习后训练。王思尹,上海创智学院 & 复旦大学博士二年级学生,导师邱锡鹏教授,研究方向为多模态具身智能。为本文
阅读全文机器之心原创作者:吴昕翻车是真的,希望也是真的。香港中文大学的一处山间小道,流水小桥,树影斑驳,青苔攀附在陡峭连绵的石梯上。无人机视野下500 米的定向越野路线。一只人形机器人跨过三十度的小桥,走上一
阅读全文机器之心发布机器之心编辑部2025 年 12 月 19 日至 20 日,摩尔线程首届 MUSA 开发者大会(MUSA Developer Conference,简称 MDC 2025)将在北京中关村国
阅读全文随着多模态大模型(MLLMs)在各类视觉语言任务中展现出强大的理解与交互能力,如何高效地处理原生高分辨率图像以捕捉精细的视觉信息,已成为提升模型性能的关键方向。然而,主流的视觉编码范式往往难以兼顾性能
阅读全文Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程,将身份参考图、空间布局、姿态线稿等不同类型的控制信息全部整合在同一个画布中。用户在画布上放置或绘制的
阅读全文机器之心报道编辑:杜伟、Panda这届 ICLR 的烦心事还没有结束。最近一段时间,对于 ICLR 2026 来说,真可谓是一波未平、一波又起。先是第三方机构对审稿意见的系统性统计发现,其中有 21%
阅读全文机器之心报道编辑:泽南、陈陈「0 代码」计算机课在教啥东西?这就是现代的软件开发吗?谁也想不到,斯坦福大学计算机系今年最热门的课程,居然明牌不鼓励你写代码。近日,斯坦福大学新开设的课程《现代软件开发者
阅读全文本文的作者分别来自西安交通大学和东京科学大学。第一作者宋天乐是来自西安交通大学的博士生,研究方向聚焦于人机交互行为安全,生物特征识别,隐私保护。通讯作者为西安交通大学蔺琛皓教授。移动应用通过 Andr
阅读全文机器之心报道机器之心编辑部如今,强化学习(RL)已成为提升大语言模型(LLM)复杂推理与解题能力的关键技术范式,而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性,LLM 的
阅读全文机器之心报道编辑:杨文人类总是对可爱的小东西毫无抵抗力。最近社交平台冒出一堆萌娃与「汪星人」温馨互动的视频,简直把人萌化。不夸张地说,每一帧都精准击中老夫那颗尘封已久、半死不活的心。有小孩一本正经教训
阅读全文近日,由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for
阅读全文机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最
阅读全文机器之心报道编辑:Panda还记得《黑客帝国》里 Neo 通过脑机接口瞬间学会功夫的场景吗?现在,机器人离这一天也不远了。想象一下,你只需在电脑上输入一句提示词:「一个人在打太极」,AI 视频模型(比
阅读全文终身行人重识别旨在持续学习新增数据中不断涌现的新增行人鉴别性信息,同时保持对已知数据的识别能力,在公共安防、社区管理、运动分析等场景中具有重要的研究和应用价值。随着白天可见光图像和夜晚红外图像被不断采
阅读全文机器之心报道机器之心编辑部InfCode 正在定义 AI 编程的「工程时代」。自「造词大神」Andrej Karpathy 提出「Vibe Coding」这个概念后,它的热度就居高不下。只需一句提示词
阅读全文机器之心报道编辑:陈陈在 Agentic AI 时代,模型不再是独来独往的学霸,而是开始学会组队、一起想问题。多智能体系统(MAS,multi-agent systems)的发展让 AI 世界从一个人
阅读全文在 Text-to-Video / Image-to-Video 技术突飞猛进的今天,我们已经习惯了这样一个常识:视频生成的第一帧(First Frame)只是时间轴的起点,是后续动画的起始画面。但你
阅读全文机器之心报道编辑:泽南、陈陈最先进的 Agentic AI,现在是做什么工作的?在搞太空探索。上个月,蓝色起源「新格伦」重型运载火箭首次成功实现了一级回收,在与 SpaceX 的竞争中迈出了重要一步。
阅读全文机器之心报道编辑:杜伟、+0昨日,有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、
阅读全文