大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解
在大模型微调实践中,SFT(监督微调)几乎成为主流流程的一部分,被广泛应用于各类下游任务和专用场景。比如,在医疗领域,研究人员往往会用领域专属数据对大模型进行微调,从而显著提升模型在该领域特定任务上的
阅读全文在大模型微调实践中,SFT(监督微调)几乎成为主流流程的一部分,被广泛应用于各类下游任务和专用场景。比如,在医疗领域,研究人员往往会用领域专属数据对大模型进行微调,从而显著提升模型在该领域特定任务上的
阅读全文机器之心报道编辑:Panda最近,一则趣闻在社交媒体上流传:当诺贝尔奖委员会还在费力寻找新晋生理学或医学奖得主时,一位小红书网友似乎早已在美国落基山脉与他偶遇并聊了天。这件「让世界先一步找到你」的轶事
阅读全文机器之心报道编辑:PandaRich Sutton 曾说过:「AI 只能在可以自我验证的范围内创造和维持知识。」爱因斯坦与英费尔德在合著的《物理学的进化》中也写道:「提出一个问题往往比解决问题更重要,
阅读全文本文的主要作者来自香港大学、VAST、哈尔滨工业大学及浙江大学。本文的第一作者为香港大学博士生杨运涵。本文的通讯作者为香港大学刘希慧教授与VAST 公司首席科学家曹炎培博士。在3D内容创作领域,如何像
阅读全文尽管视觉语言模型(LVLMs)在图像与短视频理解中已取得显著进展,但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一
阅读全文机器之心报道编辑:张倩在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale?sc
阅读全文机器之心报道机器之心编辑部在技术飞速更新迭代的今天,每隔一段时间就会出现「XX 已死」的论调。「搜索已死」、「Prompt 已死」的余音未散,如今矛头又直指 RAG。向量数据库 Chroma 创始人兼
阅读全文本文一作曹嘉航,香港大学在读博士生,前北京人形机器人创新中心实习生;共同一作黄翊泽,上海交通大学在读本科生;通讯导师 Andrew F. Luo,香港大学助理教授。在机器人学习领域,提升基于生成式模型
阅读全文机器之心报道机器之心编辑部10 月 18 日,据新华社消息称,享誉世界的物理学家、诺贝尔物理学奖获得者,中国科学院院士,清华大学教授、清华大学高等研究院名誉院长杨振宁先生,因病在北京逝世,享年 103
阅读全文机器之心报道编辑:Panda、泽南给 AGI 画一条「及格线」,GPT-4 和 GPT-5 竟都是「差等生」?通用人工智能(Artificial General Intelligence,AGI)是目
阅读全文机器之心报道编辑:冷猫、+0打造科研界的 AlphaGo。今天,理论物理学家、物理学新视野奖获得者 Alex Lupsasca 有了一个新身份:OpenAI for Science 团队的首位学术研究
阅读全文近年来,多模态大语言模型(MLLMs)取得了令人瞩目的突破,在视觉理解、跨模态推理、图像描述等任务上表现出强大的能力。然而,随着这些模型的广泛部署,其潜在的安全风险也逐渐引起关注。研究表明,MLLMs
阅读全文本文的第一作者雷京迪是南洋理工大学博士生,其研究聚焦于大语言模型,尤其关注模型推理、后训练与对齐等方向。通讯作者 Soujanya Poria 为南洋理工大学电气与电子工程学院副教授。论文的其他合作者
阅读全文机器之心发布机器之心编辑部国内首个少样本通用具身操作基础模型发布,跨越视觉语言与机器人操作的鸿沟。具身智能领域终于要突破 “数据桎梏” 了吗?相较于自然语言、视觉领域,具身智能的数据天然稀缺。真实世界
阅读全文机器之心报道机器之心编辑部距离上次新品发布仅仅两周后,Anthropic 又出手了。最新消息,Anthropic 发布轻量级模型 Claude Haiku 4.5,主打「更便宜、更快速」。据 Anth
阅读全文机器之心报道编辑:Panda今天,谷歌有点忙。一方面,他们与耶鲁大学合作基于 Gemma 研发的 Cell2Sentence-Scale 27B (C2S-Scale) 首次预测了一种新的潜在癌症疗法
阅读全文如何让 AI 像人类一样从对世界的观察和互动中自然地学会理解世界?在今年的国际计算机视觉大会(ICCV 2025)上,来自浙江大学、香港中文大学、上海交通大学和上海人工智能实验室的研究人员联合提出了第
阅读全文机器之心报道编辑:杜伟算力紧缺长期困扰学术界,而腾讯青云奖学金的设立,为青年学者提供了有力支持,帮助他们将更多精力投入到真正有价值、有意义的科研探索。如果你要问:在当下的 AI 时代,高校科研群体面临
阅读全文机器之心报道编辑:冷猫先给各位读者看个视频:Prompt : Design and create a web os like mac os full functional features from
阅读全文无论是中文的粤语、闽南话、吴语,还是欧洲的荷兰比尔茨语方言、法国奥克语,亦或是非洲和南美的地方语言,方言都承载着独特的音系与文化记忆,是人类语言多样性的重要组成部分。然而,许多方言正在快速消失,语音技
阅读全文大家或许都有过这样的体验:看完一部喜欢的动漫,总会心血来潮地想去 “圣地巡礼”;刷到别人剪辑精美的旅行 vlog,也会忍不住收藏起来,想着哪天亲自走一遍同样的路线。旅行与影像的结合,总是能勾起人们的探
阅读全文机器之心原创作者:吴昕、杨文Ring-1T 已成长为可与闭源巨头正面对话的选手,也是开源体系下闭源级性能的又一次实证。蚂蚁,又双叒叕开源万亿大模型了!短短十余天,接连三弹。10 月 9 日凌晨,蚂蚁官
阅读全文机器之心报道编辑:+0、陈陈本文实测 12 种防御方法,几乎全军覆没。真是罕见,OpenAI、Anthropic、Google DeepMind 这三大竞争对手,居然联手发表了一篇论文,共同研究语言模
阅读全文本文的第一作者为斯坦福大学博士生 Jacky Kwok。共同通讯作者包括英伟达自动驾驶研究总监 Marco Pavone、斯坦福大学计算机系教授兼 DeepMind 科学家 Azalia Mirhos
阅读全文多模态大语言模型(MLLMs)已在视觉与语言模态融合的感知与推理任务中展现出强大能力。而上海人工智能实验室、上海交通大学、香港大学、香港中文大学的研究者们提出的的 OST-Bench, 则是从智能体探
阅读全文机器之心报道机器之心编辑部说出概念,SAM 3 就明白你在说什么,并在所有出现的位置精确描绘出边界。Meta 的「分割一切」再上新?9 月 12 日,一篇匿名论文「SAM 3: SEGMENT ANY
阅读全文机器之心报道编辑:冷猫人工智能真是日新月异。早上看到网友的评论:我们已经 0 天没有吸引注意的 AI 领域新突破了。记得三个月前,OpenAI 官宣了他们的推理模型在国际数学奥林匹克(IMO)竞赛中获
阅读全文本文第一作者刘子铭为新加坡国立大学三年级博士生,本科毕业于北京大学,研究方向为机器学习系统中的并行推理与训练效率优化。通信作者为上海创智学院冯思远老师和新加坡国立大学尤洋老师。共同作者来自于上海奇绩智
阅读全文在计算机视觉与图形学中,表面重建是一个长期未解的难题:给定一组多视角图像,能否重建出高精度、几何清晰、细节丰富的 3D 模型?近年来,NeRF、SDF 与 3D Gaussian Splatting
阅读全文机器之心报道编辑:杨文当前「AI 威胁就业」的论调,更多是基于技术趋势的预警,而非基于现实的既成事实,但这也绝非轻视 AI 长期影响的理由。最近,「AI 让人类失业」的论调甚嚣尘上,给本就焦虑的打工人
阅读全文