NextStep-1:一次在图像生成上自回归范式的探索
机器之心发布机器之心编辑部自回归模型,是 AIGC 领域一块迷人的基石。开发者们一直在探索它在视觉生成领域的边界,从经典的离散序列生成,到结合强大扩散模型的混合范式,每一步都凝聚了社区的智慧。这些工作
阅读全文机器之心发布机器之心编辑部自回归模型,是 AIGC 领域一块迷人的基石。开发者们一直在探索它在视觉生成领域的边界,从经典的离散序列生成,到结合强大扩散模型的混合范式,每一步都凝聚了社区的智慧。这些工作
阅读全文你有没有想过,未来的移动网络能像 “预知未来” 一样提前感知用户需求?在今年的 ACM KDD 2025 大会上,清华大学电子系团队联合中国移动发布了 UoMo,全球首个面向移动网络的通用流量预测模型
阅读全文摘自ARC PRIZE作者:ARC PRIZE TEAM机器之心编译还记得分层推理模型(Hierarchical Reasoning Model,HRM)吗?这项工作于 6 月份发布,当时引起了不小的
阅读全文在机器人操作任务中,预测性策略近年来在具身人工智能领域引起了广泛关注,因为它能够利用预测状态来提升机器人的操作性能。然而,让世界模型预测机器人与物体交互的精确未来状态仍然是一个公认的挑战,尤其是生成高
阅读全文当前计算机使用智能体(CUA)的发展,主要依赖于大量昂贵的人工标注数据 。这极大地限制了它们在缺少现成数据的新颖或专业软件中的应用能力 。为了打破这一瓶颈,来自上海交通大学和香港中文大学的学者们提出了
阅读全文机器之心报道编辑:泽南、杨文所有学LLM的人都要知道的内容。这可能是对于大语言模型(LLM)原理最清晰、易懂的解读。前段时间,Google DeepMind 的首席科学家兼研究总监 Denny Zho
阅读全文机器之心报道编辑:+0人类对 AI 安全的担忧由来已久。在图灵测试被提出以及达特茅斯会议正式定义「人工智能」之前,阿西莫夫就已经提出了「机器人学三定律」。再往前追溯,1889 年 William Gr
阅读全文本文作者杨磊,目前在大模型初创公司阶跃星辰担任后训练算法工程师,其研究领域包括生成模型和语言模型后训练。在这之前,他曾在旷视科技担任了六年的计算机视觉算法工程师,从事三维视觉、数据合成等方向。他于 2
阅读全文机器之心原创编辑:吴昕赫拉克利特曾说,人不能两次踏入同一条河流。全新高德地图让这句话彻底具象化——不止是千人千面,就连此刻与下一秒,它也会呈现出两幅不同的景象。蜕变 立秋这天,长江的江面像换了一身颜色
阅读全文机器之心报道机器之心编辑部前沿 AI 模型真的能做到博士级推理吗?前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经
阅读全文机器之心报道机器之心编辑部下载下来只有 241 MB。本周四,谷歌正式发布了 Gemma 3 的最新一款模型。Gemma 3 270M 是一款紧凑型、拥有 2.7 亿个参数的小体量语言模型,专为特定任
阅读全文当你的手机突然没信号时,电信工程师在做什么?想象一下这样的场景:某个周五晚上,你正在用手机追剧,突然网络断了。与此同时,成千上万的用户也遇到了同样的问题。电信运营商的监控中心瞬间被数百个告警信息淹没
阅读全文机器之心报道编辑:杜伟、杨文疯狂的七月已经落下了帷幕,如果用一个词来形容国产大模型,「开源」无疑是当之无愧的高频词汇。各大厂商你方唱罢我登场,昆仑万维、阿里、智谱、月之暗面、腾讯、阶跃星辰等众多玩家们
阅读全文机器之心报道编辑:Sia作为新一轮科技革命和产业变革的重要驱动力量,人工智能正从技术探索迈向规模化应用,成为中国经济社会高质量发展的新引擎。为推动智能算法从理论创新迈向实际落地,启元实验室于 2025
阅读全文机器之心报道编辑:Panda用过 DeepSeek-R1 等推理模型的人,大概都遇到过这种情况:一个稍微棘手的问题,模型像陷入沉思一样长篇大论地推下去,耗时耗算力,结果却未必靠谱。现在,我们或许有了解
阅读全文本文第一作者周鑫、共同第一作者梁定康,均为华中科技大学博士生,导师为白翔教授。合作者包括华中科技大学涂思凡,旷视科技丁宜康,迈驰智行陈习武、谭飞杨,香港大学赵恒爽助理教授。在复杂的城市场景中,HERM
阅读全文机器之心报道机器之心编辑部「新的风暴已经出现!」当我们谈论 AI Infra 的时候,我们在谈论什么?年初,DeepSeek 前脚带来模型在推理能力上的大幅提升,Manus 后脚就在全球范围内描绘了一
阅读全文机器之心报道编辑:+0,冷猫相信我们的读者都对 AI 顶会有非常大的关注和热情,有的读者最近可能刚从 NeurIPS rebuttal 脱身,又开始为下一篇做准备了。作为推动技术革新与思想碰撞的核心引
阅读全文本文作者为徐兴成博士,任上海人工智能实验室青年研究员,北京大学与英国牛津大学联合培养数学博士,上海市启明星项目(扬帆专项)获得者。研究方向:大模型后训练、强化学习与基础理论研究。强化学习(RL)是锻造
阅读全文机器之心报道作者:张倩、陈陈光看图,你能猜出这是哪儿吗?当同事出差回来扔到群里这么一张图,我们也是猜了半天,但毫无头绪。直到另一位同事把图扔给智谱的新模型 ——GLM-4.5V,这个谜团才解开。把照片
阅读全文宁波东方理工大学将于 11 月 8 日至 9 日组织召开 2025 甬江论坛。我们诚邀有意加盟东方理工的海内外优秀学者报名参加本次论坛,分享各自领域的最新研究成果,促进多学科学术交流。东方理工期待在
阅读全文机器之心报道编辑:冷猫随着推理大模型和思维链的出现与普及,大模型具备了「深度思考」的能力,不同任务的泛用性得到了很大的提高。借助思维链,大模型能够对任务进行深入分析,完成任务规划与拆解,从而胜任长周期
阅读全文本论文主要作者来自小红书 AIGC 团队(Dynamic-X-Lab),Dynamic‑X‑LAB 是一个专注于 AIGC 领域的研究团队,致力于推动姿态驱动的人像生成与视频动画技术。他们以高质量、高
阅读全文机器之心原创作者:张倩人类手部是自然进化的杰出产物,从早期灵长类的简单结构演变而来,兼具力量与灵活性。在「用进废退」原则的驱动下,拇指逐渐变长且肌肉发达,能够与其他手指精准对握,实现精细操作。手部由多
阅读全文为深入贯彻落实党中央、国务院关于加快人工智能产业创新发展的决策部署,工业和信息化部、科学技术部、深圳市人民政府共同主办了首届 “兴智杯” 全国人工智能创新应用大赛,以需求为牵引,推动了一批关键技术突破
阅读全文本文一作为陈骁,香港中文大学 MMLab - 上海人工智能实验室具身智能中心联培博士生,研究方向是三维计算机视觉和具身智能,导师为薛天帆教授。个人主页:xiao-chen.tech/。研究背景当人类走
阅读全文机器之心报道机器之心编辑部每次打开导航的,导航软件在一秒内给出一个最速路线的时候,你有没有好奇过它是怎么找到这条路的?假如不考虑堵车、红绿灯等交通影响因素,仅找到一条最短最快的路线,那不论如何也逃不掉
阅读全文机器之心发布机器之心编辑部通过使用控制变元(control variate)来校准每个客户端的本地梯度,Scaffold 已被广泛认为是缓解联邦学习中数据异质性影响的一种强大方案。但尽管 Scaffo
阅读全文机器之心报道机器之心编辑部o4 回归,你那可以了吗?等了好久,终于等到 GPT-5。但大家似乎对这个模型并不满意。可以使用 GPT-5 的小伙伴,现在打开页面,是这样的。以前的模型都消失了,原因在于,
阅读全文本本研究由上海AI Lab前沿探索中心石博天老师带领的数据前沿团队、浙江大学EagleLab和上海创智学院等单位联合完成。第一作者陈杨是浙江大学硕士生,研究方向为多模态大模型和推理,本工作完成于她在上
阅读全文