纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
纯蒸馏 SFT 的推理模型性能对标一众 SFT + RL 模型。作者丨郭海惟编辑丨陈彩娴a-m-team 又发新论文了。这个团队上周刚刚在 Hugging Face 低调开源了32B稠密模型,但在多项
阅读全文纯蒸馏 SFT 的推理模型性能对标一众 SFT + RL 模型。作者丨郭海惟编辑丨陈彩娴a-m-team 又发新论文了。这个团队上周刚刚在 Hugging Face 低调开源了32B稠密模型,但在多项
阅读全文面壁智能完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。近日,面壁智能完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。本轮融资的完成,将
阅读全文5月25日,与前沿专家们,共同探讨灵巧手的应用与未来。在人工智能向「具身化」演进的大趋势下,灵巧手作为连接智能系统与物理世界的核心载体,正成为机器人、自动化、医疗等领域的焦点突破方向。近年来,仿生设计
阅读全文RoBridge 在显著降低训练成本的同时,显著提升开放式任务的操作鲁棒性,为破解机器人「知行合一」难题提供了可扩展的技术路径。作者丨梁小丹、林倞由中山大学、鹏城实验室、拓元智慧等单位携手推出的分层推
阅读全文Coding 是培育大模型最好的场景。作者丨梁丙鉴编辑丨马晓宁为甲方提供标准的产品,在使用过程中不断迭代,如此循环往复,是软件行业一种看起来可行的商业模式。但一项功能的迭代动辄两三个月,随着各种长尾的
阅读全文V3 的成本下降密码, 是软硬协同设计。作者丨郑佳美、洪雨欣编辑丨陈彩娴就在刚刚,DeepSeek团队发布最新论文《洞察 DeepSeek-V3:规模的挑战和对AI架构硬件的思考》。论文链接:http
阅读全文具身智能要落地一定得有ImageNet时刻吗?想认真地聊聊具身智能,文中会概述具身智能的发展线条,以及近期对”智能“的一些感想,但其中的判断、猜测很多缺乏实据,特别欢迎指出问题和讨论。关心具身智能技术
阅读全文资源有限、专注后训练也能实现强推理。作者丨郑佳美编辑丨陈彩娴在大模型竞速进入推理能力深水区的 2025 年,一支神秘的团队悄然登场。他们不是来自一线大厂的 AI Lab,也没有高调预热和融资造势,而是
阅读全文长思维链是深度思考的一种实现,但未必是最理想的。作者丨陈彩娴R1 之后,长思维链成为研究下一代基础模型中 “推理”(Reasoning)能力的热门方向。一方面,R1 证明了大模型深度思考的可行性;与此
阅读全文图为:阶跃AI生成坚定理解生成一体化的多模态路线,发力智能终端 Agent。作者丨王悦编辑丨陈彩娴DeepSeek “掀桌”三个月后,国内大模型的竞争格局大致可划分为三大阵营:一是以大厂为代表的资源派
阅读全文未来机器人的操作重心将超越单纯的 pick and place,更注重「pick」后任务。作者丨吴华秀编辑丨陈彩娴五年前,在浙大控制科学与工程学院一间会议室里,刚从剑桥微软研究院回国的叶琦,向课题组描
阅读全文Fidji Simo 曾任 Facebook 副总裁,具有丰富的社交网络产品经验。作者丨郑佳美编辑丨马晓宁刚刚,OpenAI 搞了个大动作。CEO Sam Altman 发文称原 Instacart
阅读全文北京大学智能学院介绍北京大学于2002年创办了我国第一个智能科学系,2003年在国内率先设立智能科学与技术本科专业,2007年增列硕士、博士点,在人工智能领域形成全球最早的本、硕、博完整人才培养体系,
阅读全文智能体,不是生成力,而是行动力。作者丨郑佳美编辑丨马晓宁在 Pokee.ai 内测之前,我们就先感受了一把这款 Agent 的能力。“你发给我一个邮件就行,我的 Agent 能自动生成日程表。”在跟朱
阅读全文院校介绍格里菲斯大学(Griffith University)创立于1971年,是澳大利亚昆士兰州的一所知名综合性大学。主校区位于布里斯班和黄金海岸地区。格里菲斯大学以其在环境科学、医学、工程、商业、
阅读全文试验性收入不是经常性收入,AI Coding 泡沫有多大?作者丨梁丙鉴编辑丨马晓宁自2022年12月 ChatGPT 作为现象级产品问世以来,“AI 改变世界” 的技术叙事已持续30个月,但实际落地的
阅读全文VLA 技术正从实验室走向产业深水区。2025年,全球具身智能产业规模突破百亿美元,以视觉-语言-动作(VLA)为核心的技术正加速渗透机器人、自动驾驶、工业自动化等领域。海内外团队的 VLA 成果频频
阅读全文MARFT 微调后的大语言模型多智能体系统性能优于未经微调的系统性能和单智能体 PPO 方法,这在数学任务上得到验证并提升显著。作者丨廖俊威、温睦宁 近期,基于大型语言模型(LLM)的多智能体系统(L
阅读全文万台机器人比万卡集群成本更低 。作者丨赖文昕编辑丨陈彩娴不久前,首届“人形机器人半程马拉松”在北京亦庄举办,为本就热度满满的具身智能行业再添了一把火。一共 20 支队伍组成的“钢铁生命竞赛”,让此前集
阅读全文Qwen这波,能处。作者丨洪雨欣编辑丨陈彩娴4月29日,通义App与通义网页版全面上线阿里新一代通义千问开源模型 Qwen3。用户可以第一时间在通义 App 和网页版中的专属智能体 “千问大模型”,以
阅读全文中国 00 后创业者发布「PPT 界的 Cursor」。作者丨朱可轩编辑丨陈彩娴受到姥爷影响,如果给人生写两个关键词,严訸首当其冲想到的是「工程」和「生意」。从小未曾想过长大要「进厂打工」,他创业的种
阅读全文北京深谋科技有限公司近日发布了一款业界罕见的高精度压电式六维力传感器,名曰 “弹起” ,特别适配服务机器人、人形机器人、航空航天、医疗、工业自动化等对环境高动态交互和多维力控制要求极高的场景。该产品具
阅读全文岳翔宇博士是香港中文大学多媒体实验室(MMLab),和信息工程系的助理教授。他于加州大学伯克利分校获得电子计算机博士学位,在 Berkeley AI Research 师从美国工程院院士,Cadenc
阅读全文Scaling Law 走到尽头了吗?扩散模型会成为主流吗?通用 Agent 还有多久会来?作者丨郑佳美、梁丙鉴编辑丨马晓宁自 GPT-4 发布至今已有两年,但对大语言模型的研究并没有放缓,我们仍处在
阅读全文从数据流芯片切入,走异于英伟达的道路是国内机会点所在。作者丨朱可轩编辑丨陈彩娴近期,上海交通大学与 AI Infra 创企魔形智能联合研究团队在由 IEEE 计算机协会主办的 HPCA 2025(In
阅读全文Benchmark 不是一家「平凡」资本。作者丨梁丙鉴编辑丨陈彩娴近日,据媒体报道,Manus背后的中国AI初创企业Monica近日完成了一轮7500万美元融资,由硅谷知名风投Benchmark领投,
阅读全文视觉导航不复杂,VLN却不容易。作者丨赖文昕编辑丨陈彩娴2018 年 6 月,在澳大利亚机器人视觉研究中心(ACRV)做博士后研究员的吴琦和博士生 Peter Anderson 首次将 VL(视觉-语
阅读全文预测蛋白质结构仅需几分钟。作者丨洪雨欣编辑丨陈彩娴近日,Google DeepMind 创始人、诺奖得主Demis Hassabis在接受《60 Minutes》的采访时提到,DeepMind 的蛋白
阅读全文基座模型天花板,困住强化学习。作者丨郑佳美、梁丙鉴编辑丨马晓宁清华和上交的最新论文中,上演了一场 “学术打假” 的戏码。文中研究者们对当前 “纯 RL 有利于提升模型推理能力” 的主流观点提出了相反的
阅读全文需求整合、定制芯片和分布式训练将影响英伟达领先地位。作者丨朱可轩编辑丨陈彩娴大模型浪潮来袭后,2023 年英伟达数据中心的 GPU 出货量总计约 376 万台,较之上一年的 264 万台增长 100
阅读全文