全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    GPT4规模大模型落地,Meta提ExFM框架:万亿参数基础大模型的工业级落地成为可能

    作者:机器之心发布日期:2025-03-12 14:15:41

    如何让万亿级基础大模型能够高效、低成本地服务于大规模工业级应用,并且让能够随着模型规模的提升(Scaling)而得到持续的性能增长?这一直是众多企业困扰良久的难题。在线广告推荐系统是互联网平台的核心服

    阅读全文
  • 文章封面

    从「大模型」到「具身智能」,安克深耕前沿技术的另一面藏在这里

    作者:机器之心发布日期:2025-03-11 11:51:57

    机器之心报道机器之心编辑部前段时间,幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。论文地址:https://arxiv.org/pdf/2502.11089从论文的署名信

    阅读全文
  • 文章封面

    使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

    作者:机器之心发布日期:2025-03-11 11:51:57

    选自hrishbh.com作者:Hrishbh Dalal编译:Panda、蛋酱没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?近日,技术博主 Hrishbh Dalal 的实践表明

    阅读全文
  • 文章封面

    12万级标配激光雷达:零跑把高阶智驾做到了极致

    作者:机器之心发布日期:2025-03-11 11:51:57

    机器之心报道编辑:泽南12.98 万元标配激光雷达 + 端到端智驾,通义千问 + DeepSeek 双模型智能座舱。进入 2025 年,「智能化」成为了各家车企的主要竞争方向,不论是高阶智能驾驶还是

    阅读全文
  • 文章封面

    ICLR 2025 | 原生3D+流匹配,现有SOTA被GaussianAnything超越

    作者:机器之心发布日期:2025-03-11 11:51:57

    兰宇时,MMLab@NTU博士生,导师为 Chen Change Loy。本科毕业于北京邮电大学,目前主要研究兴趣为基于神经渲染的 3D 生成模型、3D 重建与编辑。尽管 3D 内容生成技术取得了显著

    阅读全文
  • 文章封面

    “专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?

    作者:机器之心发布日期:2025-03-10 18:08:25

    机器之心发布机器之心编辑部在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。北大博士瑞晨曾经不得已搁置的想法,也

    阅读全文
  • 文章封面

    Manus被破解了?曝出系统提示词和背后大模型,CTO也回复了

    作者:机器之心发布日期:2025-03-10 18:08:25

    机器之心报道机器之心编辑部最近几天,一个叫「Manus」的通用 AI Agent 产品刷屏网络。它能完成复杂的文件处理、数据分析、代码编写等多种任务。刚上线不久,大家纷纷在线求购邀请码,都想亲自上手一

    阅读全文
  • 文章封面

    全新CoD颠覆推理范式,准确率接近但token消耗成倍降低

    作者:机器之心发布日期:2025-03-10 18:08:25

    机器之心报道编辑:凯文、杜伟随着推理模型 Deepseek R1 的爆火,Zoom 研究团队将认知科学中的思维链注入进 AI 推理领域,开创性地提出 Chain of Draft(CoD)技术框架,重

    阅读全文
  • 文章封面

    机器人泛化能力大幅提升:HAMSTER层次化方法和VLA尺度轨迹预测,显著提升开放世界任务成功率

    作者:机器之心发布日期:2025-03-10 18:08:25

    近年来,人工智能在视觉和自然语言处理方面取得了惊人的泛化能力,但在机器人操作领域,端到端方法往往需要大量昂贵的本域数据,且难以在不同硬件平台与开放场景下推广。为此,HAMSTER(Hierarchic

    阅读全文
  • 文章封面

    上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

    作者:机器之心发布日期:2025-03-09 12:08:30

    一线 AI 洞察,智者深度思考深入产业变革,共创 AI 未来DeepSeek-R1 等模型通过展示思维链(CoT)让用户一窥大模型的「思考过程」,然而,模型展示的思考过程真的代表了模型的内在推理机制吗

    阅读全文
  • 文章封面

    Claude玩宝可梦,卡关就「装死」重启,大模型:逃避可耻但有用

    作者:机器之心发布日期:2025-03-09 12:08:30

    机器之心报道编辑:佳琪、蛋酱半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。它现在已经聪明到有点吓人了,玩游戏卡关的时候,为了自救,它选择

    阅读全文
  • 文章封面

    GPT-4o举步维艰、Claude 3.7险胜,《超级马里奥》成为了检验大模型的新试金石?

    作者:机器之心发布日期:2025-03-09 12:08:30

    机器之心报道机器之心编辑部一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。例如,在 Atari 游戏、围棋(如 AlphaGo)或《星际争霸》等

    阅读全文
  • 文章封面

    长文本有了专属困惑度!北大、MIT、阿里推出LongPPL新指标

    作者:机器之心发布日期:2025-03-09 12:08:30

    随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。传统上,困惑度(Perplexity, PPL)被视为衡量模型语言理解与生成质量的标准指标——困惑

    阅读全文
  • 文章封面

    7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!

    作者:机器之心发布日期:2025-03-08 12:18:44

    研究团队构成:香港科技大学、中国科学院软件研究所、西安电子科技大学和重庆大学。团队核心成员:香港科技大学的研究助理教授曹嘉伦,主要研究领域包括 AI&SE、人工智能测试、形式化验证等;中国科学院软件研

    阅读全文
  • 文章封面

    目标超级智能,前DeepMind科学家离职创业,获1.3亿刀融资

    作者:机器之心发布日期:2025-03-08 12:18:44

    机器之心报道编辑:杨文、泽南从来没见过人类做出这样的决策……太优美了。又有谷歌大模型核心成员出来创业了。3 月 8 日,两名前谷歌 DeepMind 研究人员在社交平台 X 上宣布,成立一家名为 Re

    阅读全文
  • 文章封面

    微软甩开OpenAI自研大模型,还计划用DeepSeek

    作者:机器之心发布日期:2025-03-08 12:18:44

    机器之心报道机器之心编辑部思维链引发的战争。众所周知,微软是 OpenAI 的主要支持者,为其投入了巨资,而且在自家系统与服务中广泛部署了 GPT 系列大模型。但随着近期 AI 技术的突破、双方的分歧

    阅读全文
  • 文章封面

    ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

    作者:机器之心发布日期:2025-03-08 12:18:44

    该文章的第一作者安照崇,目前在哥本哈根大学攻读博士学位,导师为 Serge Belongie。他硕士毕业于苏黎世联邦理工学院(ETH Zurich),在硕士期间,他跟随导师 Luc Van Gool

    阅读全文
  • 文章封面

    攻破OpenAI o1/o3、DeepSeek R1防线,安全推理过程反成大模型「阿喀琉斯之踵」

    作者:机器之心发布日期:2025-03-08 12:18:44

    本文共同第一作者是杜克大学计算进化智能中心的博士生郭士霆、张健一,导师为陈怡然教授。在通往 AGI 的道路上,大型推理模型(LRMs)正以前所未有的速度迭代进化:OpenAI 的 o 系列模型凭借类人

    阅读全文
  • 文章封面

    不吹不黑,拿到邀请码一手实测Manus,还有人0天就复刻出了开源版

    作者:机器之心发布日期:2025-03-07 12:37:07

    机器之心报道机器之心编辑部在这篇文章中,我们记录了 Manus 的实际使用感受,并介绍了 Manus 的开源复刻版本。昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。它可以完成从文件

    阅读全文
  • 文章封面

    千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷

    作者:机器之心发布日期:2025-03-07 12:37:07

    机器之心报道编辑:杜伟法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。一出手就是号称「世界上最好的 OCR 模型」!新产品 Mistral OCR 是一种光学字符识别 AP

    阅读全文
  • 文章封面

    谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造

    作者:机器之心发布日期:2025-03-07 12:37:07

    机器之心报道编辑:泽南他回来了。谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。据外媒 The Information 本周四报道,拉里・佩奇成立了名

    阅读全文
  • 文章封面

    CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

    作者:机器之心发布日期:2025-03-07 12:37:07

    随着生成式人工智能技术(AIGC)的突破,文本到图像模型在故事可视化领域展现出巨大潜力,但在多角色场景中仍面临角色一致性差、布局控制难、动态叙事不足等挑战。为此,北京大学、上海人工智能实验室、南洋理工

    阅读全文
  • 文章封面

    DeepSeek的MLA,任意大模型都能轻松迁移了

    作者:机器之心发布日期:2025-03-06 20:23:39

    复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个NoPE外推HeadScale、注意力分块外推LongHeads、多视觉专家大模型MouS

    阅读全文
  • 文章封面

    强化学习成帮凶,对抗攻击LLM有了新方法

    作者:机器之心发布日期:2025-03-06 20:23:39

    机器之心报道编辑:Panda事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围棋棋手,还能帮助 DeepSeek-R1 获得强大的推理能力,

    阅读全文
  • 文章封面

    从自我进化视角出发,全面解析LLM的推理能力技术演进路径

    作者:机器之心发布日期:2025-03-06 20:23:39

    论文标题:A Survey on LLM Complex Reasoning through the Lens of Self-Evolution论文链接:https://www.researchga

    阅读全文
  • 文章封面

    当开源创新遇上推理革命:SGLang如何炼就DeepSeek最强开源推理引擎?

    作者:机器之心发布日期:2025-03-06 20:23:39

    机器之心发布 机器之心编辑部2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社区。与此同时,一个隐藏在超大规模模型身后的技术命题浮出水面:

    阅读全文
  • 文章封面

    英伟达RTX 5070评测解禁:老黄承诺4090级性能?不存在的

    作者:机器之心发布日期:2025-03-05 18:02:45

    机器之心报道编辑:泽南、杜伟价格低了点,功耗高了点,性能和原来差不多?昨晚,英伟达 GeForce RTX 5070 显卡正式解禁,各种评测开始进入人们的视线。我们知道,最近英伟达 RTX 50 系显

    阅读全文
  • 文章封面

    大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC

    作者:机器之心发布日期:2025-03-05 18:02:45

    机器之心发布机器之心编辑部真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。为了解决这一问题,近日字节跳动 ByteDanc

    阅读全文
  • 文章封面

    大模型推理新范式!清华&蚂蚁:用编程思维来思考,用自然语言来表达

    作者:机器之心发布日期:2025-03-05 18:02:45

    AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,

    阅读全文
  • 文章封面

    DeepSeek R1与OpenAI模型文风相似度高达74.2%?新研究质疑DeepSeek训练数据

    作者:机器之心发布日期:2025-03-04 12:52:19

    机器之心报道 编辑:张倩、佳琪在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性?这是一项新研究得出的结论。这项研究来自 Copyleaks——

    阅读全文
上一页下一页