GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能
如何让万亿级基础大模型能够高效、低成本地服务于大规模工业级应用,并且让能够随着模型规模的提升(Scaling)而得到持续的性能增长?这一直是众多企业困扰良久的难题。在线广告推荐系统是互联网平台的核心服
阅读全文如何让万亿级基础大模型能够高效、低成本地服务于大规模工业级应用,并且让能够随着模型规模的提升(Scaling)而得到持续的性能增长?这一直是众多企业困扰良久的难题。在线广告推荐系统是互联网平台的核心服
阅读全文机器之心报道机器之心编辑部前段时间,幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。论文地址:https://arxiv.org/pdf/2502.11089从论文的署名信
阅读全文选自hrishbh.com作者:Hrishbh Dalal编译:Panda、蛋酱没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?近日,技术博主 Hrishbh Dalal 的实践表明
阅读全文机器之心报道编辑:泽南12.98 万元标配激光雷达 + 端到端智驾,通义千问 + DeepSeek 双模型智能座舱。进入 2025 年,「智能化」成为了各家车企的主要竞争方向,不论是高阶智能驾驶还是
阅读全文兰宇时,MMLab@NTU博士生,导师为 Chen Change Loy。本科毕业于北京邮电大学,目前主要研究兴趣为基于神经渲染的 3D 生成模型、3D 重建与编辑。尽管 3D 内容生成技术取得了显著
阅读全文机器之心发布机器之心编辑部在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。北大博士瑞晨曾经不得已搁置的想法,也
阅读全文机器之心报道机器之心编辑部最近几天,一个叫「Manus」的通用 AI Agent 产品刷屏网络。它能完成复杂的文件处理、数据分析、代码编写等多种任务。刚上线不久,大家纷纷在线求购邀请码,都想亲自上手一
阅读全文机器之心报道编辑:凯文、杜伟随着推理模型 Deepseek R1 的爆火,Zoom 研究团队将认知科学中的思维链注入进 AI 推理领域,开创性地提出 Chain of Draft(CoD)技术框架,重
阅读全文近年来,人工智能在视觉和自然语言处理方面取得了惊人的泛化能力,但在机器人操作领域,端到端方法往往需要大量昂贵的本域数据,且难以在不同硬件平台与开放场景下推广。为此,HAMSTER(Hierarchic
阅读全文一线 AI 洞察,智者深度思考深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗
阅读全文机器之心报道编辑:佳琪、蛋酱半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择
阅读全文机器之心报道机器之心编辑部一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等
阅读全文随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。传统上,困惑度(Perplexity, PPL)被视为衡量模型语言理解与生成质量的标准指标——困惑
阅读全文研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研
阅读全文机器之心报道编辑:杨文、泽南从来没见过人类做出这样的决策……太优美了。又有谷歌大模型核心成员出来创业了。3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Re
阅读全文机器之心报道机器之心编辑部思维链引发的战争。众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。但随着近期 AI 技术的突破、双方的分歧
阅读全文该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool
阅读全文本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人
阅读全文机器之心报道机器之心编辑部在这篇文章中,我们记录了 Manus 的实际使用感受,并介绍了 Manus 的开源复刻版本。昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。它可以完成从文件
阅读全文机器之心报道编辑:杜伟法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。一出手就是号称「世界上最好的 OCR 模型」!新产品 Mistral OCR 是一种光学字符识别 AP
阅读全文机器之心报道编辑:泽南他回来了。谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。据外媒 The Information 本周四报道,拉里・佩奇成立了名
阅读全文随着生成式人工智能技术(AIGC)的突破,文本到图像模型在故事可视化领域展现出巨大潜力,但在多角色场景中仍面临角色一致性差、布局控制难、动态叙事不足等挑战。为此,北京大学、上海人工智能实验室、南洋理工
阅读全文复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouS
阅读全文机器之心报道编辑:Panda事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,
阅读全文论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接:https://www.researchga
阅读全文机器之心发布 机器之心编辑部2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:
阅读全文机器之心报道编辑:泽南、杜伟价格低了点,功耗高了点,性能和原来差不多?昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。我们知道,最近英伟达 RTX 50 系显
阅读全文机器之心发布机器之心编辑部真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。为了解决这一问题,近日字节跳动 ByteDanc
阅读全文AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,
阅读全文机器之心报道 编辑:张倩、佳琪在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性?这是一项新研究得出的结论。这项研究来自 Copyleaks——
阅读全文