Karpathy点赞NUS新研究:RL微调不稳定的关键根源,指向BF16精度本身
RL 微调训练时一切正常,为什么一上线就像换了个模型?这篇被 Andrej Karpathy 点赞的 NUS 研究给出一个极其反直觉的答案:不是模型退化,是你用的 BF16 在悄悄放大误差。这个现象不
阅读全文RL 微调训练时一切正常,为什么一上线就像换了个模型?这篇被 Andrej Karpathy 点赞的 NUS 研究给出一个极其反直觉的答案:不是模型退化,是你用的 BF16 在悄悄放大误差。这个现象不
阅读全文©作者 | 曾爽单位 | 西安交通大学硕士研究方向 | 具身智能、自动驾驶摘要精确的车道级拓扑图是高级别自动驾驶系统的关键基石,它为车辆的全局路径规划和决策提供了结构化信息。然而,现有方法在处理现实世
阅读全文/** * @brief Standard C++20 coroutine-based Task implementation * @tparam T The result type of the
阅读全文最近出现了一篇题为《远程劳动力指数:衡量AI对远程工作的自动化》(Remote Labor Index: Measuring AI Automation of Remote Work)的重磅研究。这篇
阅读全文1808 年,歌德创作出了经典诗剧《浮士德》,主角浮士德博士掌握了哲学、神学、法学和医学,懂得世上所有的知识,却还是无法理解生命本身,从而陷入绝望。这时,魔鬼梅菲斯特来到他身边,表示愿意提供最为极致的
阅读全文阿里云提供的 “OpenAI 兼容接口”主要是为了支持标准 OpenAI API 调用。但是并不是完全兼容:尤其是当我们使用下面的方式期待模型产生结构化输出时:from pydantic import
阅读全文GPT-5、Claude Opus 4……Agent 技术真的能干活儿了。2025 年 8 月,OpenAI 发布的 GPT-5,可不仅仅是个能说会道的 AI。它在编码、推理方面的能力都有了很大提升,
阅读全文在 LangGraph 中基于结构化数据源构建在 LangGraph 中构建不同的 agent 系统 | Image by author如果你刚开始搭建不同的 agentic 系统,一个有趣的切入点是
阅读全文整理 | 褚杏娟 马斯克和奥特曼又吵起来了,起因是奥特曼发了一条推特:“一个分为三幕的故事(A tale in three acts)”。推特中,他展示了自己在 2018 年 7 月 11 日预订了一
阅读全文作者|冬梅审校|蔡芳芳采访嘉宾|费良宏、付晓岩、沈剑、武艳军、杨凌云(采访不分先后,按拼音首字母排序)过去十年,架构师被誉为互联网企业的“定海神针”,他们以宏观视角统筹系统、以前瞻眼光塑造技术蓝图,是
阅读全文一纸公告,炸了整个学术圈。尤其是 AI 社区。这周末,arXiv 宣布了一项史无前例的新规:从即日起,所有投稿至 arXiv 计算机科学分类(CS)的综述性文章(review/survey)和立场性文
阅读全文新智元报道 编辑:桃子 好困【新智元导读】AI第三种Scaling范式来临!多模态原生世界模型Emu3.5出世,340亿参数,基于790年长视频数据完成训练。即生3D世界,每张图片推理速度飙升2
阅读全文新智元报道 编辑:KingHZ【新智元导读】英特尔再次出击!面对GPU的AI算力霸权,这家芯片巨头正意图重振AI雄风,AI芯片战场硝烟再起。英伟达的长峰期维持了GPU的AI算力霸权,也把替代路线
阅读全文新智元报道 编辑:元宇【新智元导读】当你发现自己刷到的视频、帖子是「AI制造」时,当身边的人用一种「AI腔调」和你说话时,你是不是想要迅速滑走,或者直接拉黑?加州大学伯克利分校等机构的权威研究证
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文美团,这家外卖公司,又开源了!刚刚,美团发布了 LongCat-Flash-Omni,一个 560B 参数(激活 27B)的开源全模态 MoE 模型。模型在多个基准测试中拿下了 SOTA,甚至在部分指
阅读全文作者|亚当·莱文编辑|李婧滢本文首发于巴伦APPMeta Platforms的股价在上周四公司发布最新财报后大跌11%,且下跌势头持续至上周末。这并不是因为营收表现不佳,实际上公司第三季度营收同比增长
阅读全文机器之心报道编辑:杜伟2025 年被广泛视为 AI 走向深度应用的关键元年,在这一年里,以多模态生成、Agent 为代表的 AI 技术不断探索更多样、更高效、更贴合用户需求的应用形态。其中重要性愈加凸
阅读全文机器之心报道编辑:+0、杨文马斯克、奥特曼「冤家路窄」。奥特曼和马斯克又在 X 上吵起来了。前两天,奥特曼在 X 上发了三张图片,并配文「一个分为三幕的故事」。图片显示,2018 年 7 月,奥特曼支
阅读全文本文第一作者是阿里巴巴达摩院研究实习生孙雨,他的主要研究兴趣方向是Medical Reasoning LM。本文通讯作者是阿里巴巴达摩院资深专家徐挺洋博士。 在人工智能领域,推理语言模型(RLM)虽然
阅读全文生境科技(Sengine Technology)宣布完成Pre-A与Pre-A+轮近亿元人民币融资,本轮投资方包括南山战新投、余杭国投、深圳担保集团等国资平台,力合科创、大米创投、临芯投资等市场化机构
阅读全文图片来源:unsplashZ Highlights当基础设施提供商同时成为最强劲的竞争对手时,初创企业唯一能构建防御性的路径,是在“数据的围墙花园”中播种。我看到,真正的护城河不在于模型本身,而在于那
阅读全文Apple Intelligence 终于来了~ 苹果憋了这么久,终于在交出了自己在这个AI大时代的答卷: Apple Intelligence。 https://www.apple.com/ap
阅读全文过去一周,我把主流 AI 浏览器都体验了个遍。OpenAI 的 Atlas、Perplexity 的 Comet、Browser Company 的 Dia,再加上 Edge Copilot,市面上最
阅读全文一水 鹭羽 发自 凹非寺量子位 | 公众号 QbitAI用外卖的打法做AI模型?美团这是跟“又快又稳”杠上了(doge)。两个月哐哐发了多款模型后,美团依旧动作不停——最新开源LongCat-Flas
阅读全文梦瑶 发自 凹非寺量子位 | 公众号 QbitAI如果我不说,你能分清哪个是马斯克本人的声音吗?大NO特NO!!!其实这俩都不是。。。这段堪比“本尊”的语音,就出自语音AI公司Cartesia刚刚发布
阅读全文PixelCraft团队 投稿量子位 | 公众号 QbitAI多模态大模型(MLLM)在自然图像上已取得显著进展,但当问题落在图表、几何草图、科研绘图等结构化图像上时,细小的感知误差会迅速放大为推理偏
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI为了让更多从业者感受智能浪潮的跃迁,也为了给予更多同行同路人掌声与鼓舞,我们将正式启动「2025人工智能年度榜单」评选报名。本次评选将从企业、产品、人物
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!斯坦福、卡内基梅隆大学的一项研究证
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!“AI不是工具,是会用工具的工人。
阅读全文