第二代PPTAgent来了!中科院软件所开源首个本地通用幻灯片智能体,9B参数打平GPT-5
天下苦 PPT 久矣。体验过市面上各种 AI 生成 PPT 工具的人,往往都会遇到同样的痛点:排版崩坏、内容空洞、经不起推敲。 为什么会这样?因为目前的通用大语言模型(LLM)写 PPT,本质上是在对
阅读全文天下苦 PPT 久矣。体验过市面上各种 AI 生成 PPT 工具的人,往往都会遇到同样的痛点:排版崩坏、内容空洞、经不起推敲。 为什么会这样?因为目前的通用大语言模型(LLM)写 PPT,本质上是在对
阅读全文编辑|张倩大公司工作过的人应该都深有体会,在引入新工具方面,他们有着一种「集体性迟疑」。这种迟疑并非保守,而是组织记忆的产物。1999 年,好时巧克力强行提速引入新企业管理工具,导致供应链瘫痪;201
阅读全文机器之心编辑部近日,世界模型与空间智能前沿公司魔芯科技已完成 Pre-A + 轮近亿元融资。本轮融资由华为哈勃领投,老股东跟投。成立于 2021 年的魔芯科技从 3D AI 物体建模和制造出发,正逐步
阅读全文该论文通讯作者为上海交通大学数学科学学院 / 人工智能学院陈洛南教授与西北工业大学自动化学院张绍武教授;第一作者为闫金铃与张弛浩;研究人员还包括史际帆与黄伟填。从观测时间序列数据中准确识别因果关系,是
阅读全文编辑|+0最近科技圈最火的话题,非「养龙虾」莫属。OpenClaw 横空出世,GitHub 星标增速超过 Linux,大厂门口安装服务排起千人长队,闲鱼上「代装龙虾」的生意被炒到高价。「你养龙虾了吗」
阅读全文机器之心报道最近几年,大模型赛道好不热闹。叫得上名字的几乎数都数不过来:从 GPT、Llama、Gemma、Mistral,到 DeepSeek、Qwen、Kimi、GLM、MiniMax 等等,新模
阅读全文随着生成式 AI 迈入万亿参数时代,大语言模型(LLM)的推理与部署面临着前所未有的“显存墙”挑战。如何在超节点(SuperNode)复杂的异构存储架构下,实现海量张量的高效管理和调度,已成为大模型落
阅读全文机器之心编辑部每次打开 arXiv 都能看到的那个「康奈尔大学」标识,很有可能将成为历史了。最近,arXiv 发布了一个官方信息,称「经过与康奈尔大学数十年富有成效的合作,并在西蒙斯基金会的支持下,a
阅读全文编辑|杜伟过去两天,全球爆火的 Agent 私人助手 OpenClaw,接连更新了两个版本,让人直呼「开发团队是不睡觉了吗?」之所以如此爆火,很大程度上归功于 OpenClaw 的长期记忆能力,它能够
阅读全文近年来,多模态大模型(Multimodal Large Language Models, MLLMs)正在迅速改变人工智能的能力边界。从图像理解到视频分析,从语音对话到复杂推理,大模型正在逐步具备类似
阅读全文机器之心编辑部Meta 的 AI 计划,突然踩了刹车。据《纽约时报》、路透社、彭博社等多家媒体报道,Meta 正在开发的新一代基础大模型 Avocado(牛油果),原本计划在本月发布,但由于性能未达预
阅读全文机器之心编辑部如果有一天,大模型不再依赖人类语言训练,会发生什么?过去几年,大模型能力的飞跃几乎都建立在一个前提之上:海量文本数据。互联网、书籍、代码、论文,几乎所有人类留下的语言痕迹,都被当作训练数
阅读全文本文主要完成单位为上海人工智能实验室,主要作者谢文轩、谭鑫、陆超超、胡侠等,通讯作者为实验室青年研究员汪旭鸿。当长上下文成为负担:我们是否真的需要「把一切都塞进推理模型」?当前,随着大家对大模型推理能
阅读全文编辑 | 泽南AI 视频赛道的竞争,已经跨过了比拼谁生成视频更长、更逼真的初级阶段,正在迈向实时交互、模拟真实物理规律的技术分水岭。在这个重要节点上,一家成立不到三年的中国创业公司率先抢跑,还顺势拿下
阅读全文编辑|杨文最近,谷歌 NotebookLM 又出了个好玩好用的小功能:Cinematic Video Overviews(电影级视频概览)。与普通模板不同,这项功能可以根据我们上传的资料,自动生成定制
阅读全文论文第一作者为魏彤,清华大学在读博士生,研究方向为大模型智能体和强化学习,导师为清华大学兴军亮、史元春;共同一作为腾讯杨一君;合作者为北京大学卢宗青;通讯作者为叶德珩。基于可验证奖励的强化学习(Rei
阅读全文机器之心编辑部速度、质量、管线可用性,是 AI 3D 生成领域公认的不可能三角。三件事,从来没有同时成立过。直到现在。VAST 最新发布的 Tripo P1.0,首次在原生三维空间中实现概率生成,2
阅读全文机器之心发布一个月前我们发布了基于华为 openJiuwen 开源社区构建的 DeepAgent 和 DeepSearch 两款智能体双双霸榜 [DeepAgent与DeepSearch双双霸榜!答案
阅读全文最近,一个叫OpenClaw(小龙虾)的开源项目突然爆火,甚至出现线下排队安装的场面。很多人第一次直观地看到,AI不只是chatbot,而是可以真正“动手”操作电脑、完成复杂任务和个性化工作流的智能体
阅读全文如今,Test-Time Scaling(测试时扩展)已成为提升模型推理能力的关键路径。而在这一浪潮中,块扩散语言模型(Block Diffusion Language Models, BDLMs)
阅读全文机器之心编辑部谁能想到,OpenClaw 火到了今天,甚至出现了排队等待安装的盛况。一些大厂也开始入局,选择接入 OpenClaw。龙虾热已经发展为现象级,但问题是:究竟有多少行业能够真正将其投入使用
阅读全文机器之心编辑部在「龙虾热」蔓延全国的此刻,大家把越来越多的工作交给 AI。从写代码到数据分析,很多人开始尝试让 AI 接管完整流程。人工智能能力的跃升似乎正逼迫着人们直面「自我价值」的拷问:「AI 会
阅读全文随着大语言模型 Agent 开始在对话、问答与复杂交互环境中长期运行,“记忆该如何设计” 正在成为一个绕不开的核心问题。 论文标题:PlugMem: A Task-Agnostic Plugin Me
阅读全文一、引言在生成式 AI 浪潮中,文生图技术已实现跨越式发展,在视觉呈现上达到了前所未有的高度。然而,在生成图像中准确合成拼写正确、结构规范且风格协调的文字 —— 视觉文本渲染(Visual Text
阅读全文编辑|Sia硅谷投资圈惊呼,科技研究领域的谷歌地图来了!几乎一夜间,海外社交平台上的科技投资人、科学家都在聊它!这就像是科学研究领域的谷歌地图时刻。硅谷科技投资人 David Keel 的这句评价,直
阅读全文编辑|杜伟最近,Karpathy 玩 Vibe Coding 真真地上瘾了!上周末刚开源了「autoresearch」项目:给 AI Agent 提供一个规模虽小但真实可用的 LLM 训练环境,然后让
阅读全文机器之心编辑部2026 年伊始,AI 的进化逻辑正从「单一工具赋能」转向「场景深度共生」,当大模型在各领域持续突破,前沿科研与新材料研发领域,正迎来一场由 Agentic AI 驱动的效率革命。从传统
阅读全文本文第一作者廖海旭为新泽西理工学院数据科学系在读博士生,师从Prof. Shuai Zhang。论文标题:Theoretical Analysis of Contrastive Learning un
阅读全文编辑|冷猫这两年,大模型大厂之间堪比军备竞赛。不论开源还是闭源阵营,为了在指标上领先对手,都在疯狂地卷 Scaling Law,卷算力,卷参数量,已经达到了近乎离谱的程度。过去,GPT-2 只有约 1
阅读全文本文来自PRO会员通讯内容,文末关注「机器之心PRO会员」,查看更多专题解读。当前,LLM 评测的通用榜单和常用基准陆续暴露出区分度下降、评审口径波动与数据污染等问题,促使业界愈发重视 LLM 评测体
阅读全文