扎克伯格的豪赌初见成效?Meta新方法让LLM长上下文处理提速30倍
机器之心报道编辑:+0,冷猫经历了前段时间的鸡飞狗跳,扎克伯格的投资似乎终于初见成效。近期,Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架,旨
阅读全文机器之心报道编辑:+0,冷猫经历了前段时间的鸡飞狗跳,扎克伯格的投资似乎终于初见成效。近期,Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架,旨
阅读全文在多模态大模型的基座上,视觉 - 语言 - 动作(Visual-Language-Action, VLA)模型使用大量机器人操作数据进行预训练,有望实现通用的具身操作能力。然而,现有 VLA 基座模型
阅读全文机器之心报道作者:Youli谁率先让模型拥有「记忆」,谁就掌握主动权。「记忆」会是引爆新一轮 AI 浪潮的最后一块拼图吗?如果时间往前推半年或四五个月,业界对于这一问题可能都是疑惑、不解:彼时 Dee
阅读全文机器之心报道机器之心编辑部自 2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。随着模型规模迅速扩大,预训练
阅读全文近日,字节跳动 Seed 团队发布了最新的机器人研究成果——Robix,一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。标题:Robix: A Unified Model for Robo
阅读全文机器之心报道编辑:PandaAI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。大模型会有幻觉,
阅读全文机器之心发布机器之心编辑部最年轻的工程师,和团队一起将产品卖给 Fortune 500 的客户,从 0 带到 10。她,22 岁,成立自己的公司 —— Cybever, 以「用 AI 生成高精度 3D
阅读全文本文的主要作者来自北京航空航天大学、清华大学、香港大学和 VAST。本文的第一作者为北京航空航天大学硕士生黄泽桓。本文的通讯作者为北京航空航天大学盛律教授与 VAST 公司首席科学家曹炎培博士。在游戏
阅读全文机器之心报道机器之心编辑部以前,每当上线一个新模型,大家总要绞尽脑汁想个响亮又不撞车的名字。不得不说,有时候名字起得太出彩,甚至能把模型本身给卷下去。别人还没搞懂它能干嘛,名字已经在朋友圈刷屏了。不过
阅读全文机器之心发布机器之心编辑部在端侧 AI 这个热门赛道,华为盘古大模型扔下了一颗 “重磅炸弹” 。如今,云端大模型已经能侃侃而谈、答疑解惑。但如果这些 AI 大脑能被装进手机、摄像头甚至无人机,会带来怎
阅读全文本系列工作核心作者: 郭海洋(自动化所博士生)、 朱飞 (中科院香港院AI中心AP)、 曾繁虎 (自动化所硕士生)、 刘文卓 (自动化所博士生)、 赵宏博 (自动化所博士生)。通讯作者为自动化所博士生
阅读全文机器之心发布机器之心编辑部随着内容创作智能化需求的爆发,长时长、高质量数字人视频生成始终是行业痛点。近日,字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——In
阅读全文机器之心发布机器之心编辑部在阿联酋 2031 国家人工智能战略的驱动下,穆罕默德・本・扎耶德人工智能大学(MBZUAI) 正以 AI 专业学术全球排名前十的硬实力,重塑 AI 教育格局。这所由阿联酋总
阅读全文近日,快手与清华大学孙立峰团队联合发表论文《Towards User-level QoE: Large-scale Practice in Personalized Optimization of A
阅读全文机器之心发布RoboScience在具身智能的发展路径中,如何获得海量且高质量的数据是行业绕不开的核心问题。如果说大语言模型依赖于互联网规模的语料库,那么具身智能的成长同样需要规模化的交互经验。现实中
阅读全文机器之心报道机器之心编辑部宇树的上市进程,终于又向前迈进了一步。9 月 2 日晚间,杭州宇树科技股份有限公司(简称「宇树科技」)发布声明说,预计于今年四季度向证券交易所提交上市申请文件,立即引来了大量
阅读全文机器之心报道编辑:陈萍随着扩散语言模型(DLM)在各个领域的快速发展,其已成为自回归(AR)模型有力的替代方案。与 AR 模型相比,DLMs 的主要优势包括但不限于:高效的并行解码和灵活的生成顺序。尽
阅读全文语音分离领域针对具有挑战性的 “鸡尾酒会问题”,随着深度神经网络 (DNN) 的发展,该领域取得了革命性的进展。语音分离可以用于独立应用,在复杂的声学环境中提高语音清晰度。此外,它还可以作为其他语音处
阅读全文机器之心原创编辑:张倩、陈陈国内外开发者:亲测,美团新开源的模型速度超快!当 AI 真的变得像水和电一样普及之后,模型强不强已经不是大家唯一关心的问题了。从年初的 Claude 3.7 Sonnet、
阅读全文机器之心报道编辑:杜伟、+0这几天,一篇关于向量嵌入(Vector Embeddings)局限性的论文在 AlphaXiv 上爆火,热度飙升到了近 9000。要理解这篇论文的重要性,我们先简单回顾一下
阅读全文机器之心报道机器之心编辑部谷歌回归搜索老本行,这一次,它要让 AI 能像人一样「看见」网页。这是谷歌前不久在 Gemini API 全面上线的 URL Context 功能(5 月 28 日已在 Go
阅读全文覆盖桌面、移动和 Web,7B 模型超越同类开源选手,32B 模型挑战 GPT-4o 与 Claude 3.7,通义实验室全新 Mobile-Agent-v3 现已开源。一眼看到实力:关键成绩速览。备
阅读全文机器之心报道机器之心编辑部清华大学、北京中关村学院、无问芯穹联合北大、伯克利等机构重磅开源RLinf:首个面向具身智能的“渲训推一体化”大规模强化学习框架。人工智能正在经历从 “感知” 到 “行动”
阅读全文机器之心报道编辑:冷猫GRPO 就像一个树节点,从这里开始开枝散叶。大语言模型的发展真是日新月异。从 DeepSeek 横空出世以来,其在大模型后训练的创新 GRPO 一跃成为强化学习黄金范式。GRP
阅读全文欢迎关注中国科学院自动化研究所 & 北京中关村学院 & 芝加哥大学 & 西湖大学 & 腾讯带来的科研智能体方面的最新综述调研。当前基于大语言模型(LLM)的智能体构建通过推动自主科学研究推动 AI4S
阅读全文机器之心报道编辑:Panda记忆,你有我有,LLM 不一定有,但它们正在有。前些天,谷歌宣布 Gemini 具备了记忆能力。此前,它已经凭借长达 100 万 token 甚至更高的上下文长度,在「短期
阅读全文机器之心报道编辑:PandaLLM 似乎可以扮演任何角色。使用提示词,你可以让它变身经验丰富的老师、资深程序员、提示词优化专家、推理游戏侦探…… 但你是否想过:LLM 是否存在某种身份认同?近日,哥伦
阅读全文你有没有想过,AI 不仅能记住过去的一切,还能预见未知的未来?想象一下,让 AI 预测下周的股价、下个月的票房冠军、甚至下届世界杯的赢家……这听起来像科幻片,但如今,它已经成为现实中一场「极限挑战」。
阅读全文机器之心报道编辑:泽南、杨文他说:2027年AGI就来。23 岁被 OpenAI 开除,利用自己的「内部消息」打造了一支规模达 15 亿美元的基金,今年这支基金的表现还比华尔街高出 700%。如此跌宕
阅读全文机器之心报道机器之心编辑部不敢相信,希望是我的幻觉。AI 的普及引发了全球范围内关于其对劳动市场潜在影响的辩论。历史上,技术总会以不同的方式影响着人们的工作和生活,有的工作被取代,有的工作被增强。近几
阅读全文