国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技
机器之心报道编辑:杨文自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。谷歌推出 Veo 3.1,通过首尾帧控制和多图参考解决了以往视频生成
阅读全文机器之心报道编辑:杨文自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。谷歌推出 Veo 3.1,通过首尾帧控制和多图参考解决了以往视频生成
阅读全文机器之心报道机器之心编辑部随着通用型(Generalist)机器人策略的发展,机器人能够通过自然语言指令在多种环境中完成各类任务,但这也带来了显著的挑战。一方面,真实世界评估成本极高,需要系统性地覆盖
阅读全文近日,在全球人工智能领域最具影响力的顶级学术会议 NeurIPS(神经信息处理系统大会)上, 清华大学和蚂蚁数科联合提出了一种名为 Dual-Flow 的新型对抗攻击生成框架。简单来说,Dual-Fl
阅读全文机器之心报道机器之心编辑部现在的大学生该选什么专业?未来一百年的大学会是什么样子?业界 AI 如此强势,学界还能做什么?谷歌在过去二十多年里做对了什么,又有哪些遗憾?在斯坦福大学工程学院百年庆典的收官
阅读全文机器之心报道编辑:张倩模型架构的重要性可能远超我们之前的认知。最近,约翰斯・霍普金斯大学的一项研究发现:1100 多个不同的神经网络,即使在完全不同的数据集上训练、用不同的初始化和超参数,最终学到的权
阅读全文本文第一作者陈羽田,香港中文大学 MMLab 博士二年级在读,研究方向为三维重建与生成,导师为薛天帆教授。个人主页:https://yutian10.github.io当古装剧中的长袍在武林高手凌空翻
阅读全文机器之心报道编辑:杨文网友吐槽GPT-5.2「不通人性」。X 上充斥着对 GPT-5.2 的恶评。昨天,OpenAI 十周年之际,拿出了最新的顶级模型 GPT-5.2 系列,官方号称是「迄今为止在专业
阅读全文机器之心报道编辑:Panda邹忌曾经有一个问题:吾与徐公孰美?而对于 REPA,也有一个类似的问题:全局信息与空间结构,哪个对表征对齐更重要?表征对齐(REPA)可通过将强大的预训练视觉编码器的表征蒸
阅读全文多语言大模型(MLLM)在面对多语言任务时,往往面临一个选择难题:是用原来的语言直接回答,还是翻译成高资源语言去推理?实际上,不同的语言在模型内部承载着不同的「特长」。比如英语可能逻辑性强,适合科学推
阅读全文机器之心发布机器之心编辑部在 Physical Intelligence 最新的成果 π0.6 论文里,他们介绍了 π0.6 迭代式强化学习的思路来源:其中有我们熟悉的 Yuke Zhu 的研究,也有
阅读全文机器之心报道编辑:+0随着扎克伯格将公司战略重心从「元宇宙」全面转向人工智能,公司内部正面临多重挑战。据《纽约时报》报道,Meta 新组建的顶尖 AI 团队与公司原有的核心业务部门之间,在资源分配、发
阅读全文尹博:NUS 计算机工程硕士生、LV Lab 实习生,研究方向是生成式 AI,及参数高效率微调(PEFT)。胡晓彬:NUS LV Lab Senior Research Fellow, 研究方向是生成
阅读全文机器之心发布作者:白铂 博士白铂 博士,华为 2012 实验室理论研究部主任 信息论首席科学家2022 年底,ChatGPT 横空出世,其能力震惊了整个世界。2024 年底,DeepSeek 以极低
阅读全文机器之心报道机器之心编辑部不久前,NeurIPS 2025 顺利举办,作为人工智能学术界的顶级会议之一,其中不乏学术界大佬的工作和演讲。有一项荣誉的颁发显得格外厚重且众望所归 —— 由任少卿、何恺明、
阅读全文实现通用机器人的类人灵巧操作能力,是机器人学领域长期以来的核心挑战之一。近年来,视觉 - 语言 - 动作 (Vision-Language-Action,VLA) 模型在机器人技能学习方面展现出显著潜
阅读全文机器之心报道编辑:冷猫、Panda「安静!吵到我用 TNT 了!」长期关注科技圈的朋友们都知道,罗永浩的锤子科技落幕已经七年。七年间,仍有无数锤科粉丝保留着旧手机备用,怀念手机圈当年的「锐利异类」,以
阅读全文机器之心报道编辑:Panda刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列:Devstral 2。该系列开源模型包含两个尺寸:Devstral 2 (12
阅读全文费森俞,上海创智学院 & 同济大学博士一年级学生,导师赵宪忠教授,研究方向为 VLA 强化学习后训练。王思尹,上海创智学院 & 复旦大学博士二年级学生,导师邱锡鹏教授,研究方向为多模态具身智能。为本文
阅读全文机器之心原创作者:吴昕翻车是真的,希望也是真的。香港中文大学的一处山间小道,流水小桥,树影斑驳,青苔攀附在陡峭连绵的石梯上。无人机视野下500 米的定向越野路线。一只人形机器人跨过三十度的小桥,走上一
阅读全文机器之心发布机器之心编辑部2025 年 12 月 19 日至 20 日,摩尔线程首届 MUSA 开发者大会(MUSA Developer Conference,简称 MDC 2025)将在北京中关村国
阅读全文随着多模态大模型(MLLMs)在各类视觉语言任务中展现出强大的理解与交互能力,如何高效地处理原生高分辨率图像以捕捉精细的视觉信息,已成为提升模型性能的关键方向。然而,主流的视觉编码范式往往难以兼顾性能
阅读全文Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程,将身份参考图、空间布局、姿态线稿等不同类型的控制信息全部整合在同一个画布中。用户在画布上放置或绘制的
阅读全文机器之心报道编辑:杜伟、Panda这届 ICLR 的烦心事还没有结束。最近一段时间,对于 ICLR 2026 来说,真可谓是一波未平、一波又起。先是第三方机构对审稿意见的系统性统计发现,其中有 21%
阅读全文机器之心报道编辑:泽南、陈陈「0 代码」计算机课在教啥东西?这就是现代的软件开发吗?谁也想不到,斯坦福大学计算机系今年最热门的课程,居然明牌不鼓励你写代码。近日,斯坦福大学新开设的课程《现代软件开发者
阅读全文本文的作者分别来自西安交通大学和东京科学大学。第一作者宋天乐是来自西安交通大学的博士生,研究方向聚焦于人机交互行为安全,生物特征识别,隐私保护。通讯作者为西安交通大学蔺琛皓教授。移动应用通过 Andr
阅读全文机器之心报道机器之心编辑部如今,强化学习(RL)已成为提升大语言模型(LLM)复杂推理与解题能力的关键技术范式,而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性,LLM 的
阅读全文机器之心报道编辑:杨文人类总是对可爱的小东西毫无抵抗力。最近社交平台冒出一堆萌娃与「汪星人」温馨互动的视频,简直把人萌化。不夸张地说,每一帧都精准击中老夫那颗尘封已久、半死不活的心。有小孩一本正经教训
阅读全文近日,由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for
阅读全文机器之心报道机器之心编辑部几个小时前,NVIDIA CUDA Toolkit 13.1 正式发布,英伟达官方表示:「这是 20 年来最大的一次更新。」这个自 2006 年 CUDA 平台诞生以来规模最
阅读全文机器之心报道编辑:Panda还记得《黑客帝国》里 Neo 通过脑机接口瞬间学会功夫的场景吗?现在,机器人离这一天也不远了。想象一下,你只需在电脑上输入一句提示词:「一个人在打太极」,AI 视频模型(比
阅读全文