Adam获时间检验奖!清华揭示保辛动力学本质,提出全新RAD优化器
新智元报道 编辑:LRST【新智元导读】Adam优化器是深度学习中常用的优化算法,但其性能背后的理论解释一直不完善。近日,来自清华大学的团队提出了RAD优化器,扩展了Adam的理论基础,提升了训
阅读全文新智元报道 编辑:LRST【新智元导读】Adam优化器是深度学习中常用的优化算法,但其性能背后的理论解释一直不完善。近日,来自清华大学的团队提出了RAD优化器,扩展了Adam的理论基础,提升了训
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】国产大模型Vidu Q1横空出世,荣登全球视频生成榜首!支持1080p高清画质,好莱坞级首尾帧运镜,细节逼真到爆。更惊艳的是,性价比仅是同行1/1
阅读全文新智元报道 编辑:定慧 英智【新智元导读】AI会无脑附和吗?Anthropic研究发现,Claude能根据场景切换人格:谈恋爱时化身情感导师,聊历史时秒变严谨学者。一些对话中,它强烈支持用户价值
阅读全文新智元报道 编辑:定慧【新智元导读】DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoughtology)。这份长达1
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】全球首个行动浏览器Fellou重磅发布,不仅能自动填表单、管理标签页,还能跨网站执行繁琐任务。只需一句话,Fellou帮你全搞定。得益于自由开放的
阅读全文新智元报道 编辑:犀牛 好困【新智元导读】一句话看懂:o3以深度推理与工具调用能力领跑复杂任务,GPT-4.1超长上下文与精准指令执行适合API开发,而o4-mini则堪称日常任务的「性价比之王
阅读全文新智元报道 编辑:英智【新智元导读】采样多就一定准吗?研究人员用实验告诉你:是的,而且超乎想象!基于采样的搜索不仅能在并行处理中大展身手,还通过隐式扩展让验证更精准。先让模型生成多个候选答案,再
阅读全文新智元报道 编辑:KingHZ 桃子【新智元导读】o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。满血o3更强了
阅读全文新智元报道 编辑:定慧【新智元导读】还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没
阅读全文新智元报道 编辑:LRS【新智元导读】Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】「一位顶尖科学家,有数千亿美元的资源,却仍然能把Meta搞砸了!」最近,圈内对LeCun的埋怨和批评,似乎越来越压不住了。有人批评说,Meta之
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】OpenAI首席财务官Sarah Friar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agnent)。除Ope
阅读全文新智元报道 编辑:LRST【新智元导读】Hyper-RAG利用超图同时捕捉原始数据中的低阶和高阶关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。大语言模型
阅读全文新智元报道 编辑:编辑部 ZJH【新智元导读】公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Cla
阅读全文新智元报道 编辑:桃子【新智元导读】陈立武上任即掀改革风暴,通过扁平化管理,强化技术导向,誓言重振这家硅谷传奇。同时,网络芯片专家Sachin Katti被任命为AI与技术双料首席,肩负对抗英伟
阅读全文新智元报道 编辑:英智【新智元导读】一股由ChatGPT引爆的AI玩偶热潮正在席卷全球社交媒体!从领英到TikTok,人人都在将自己变成可爱玩偶,搭配个性配饰,装进精美包装盒。你准备好了吗?Op
阅读全文新智元报道 编辑:编辑部 NZYH【新智元导读】满血版o3和o4-mini深夜登场,首次将图像推理融入思维链,还会自主调用工具,60秒内破解复杂难题。尤其是,o3以十倍o1算力刷新编程、数学、视
阅读全文新智元报道 编辑:定慧【新智元导读】谷歌推出全新DolphinGemma大模型,基于30年海豚研究数据训练的AI模型正试图破解海豚的语言密码。仅有400M参数的轻量级模型能在普通Pixel手机上
阅读全文新智元报道 编辑:KingHZ【新智元导读】不止GPT-4o可以制作吉卜力风格图像!更多工具都可以制作吉卜力风图像。甚至2分钟之内,还能用照片生成吉卜力风格动画:蒙娜丽莎给你说Hello。创建吉
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】MIT物理学大牛Max Tegmark团队,再出重磅力作。他们发现:AI能够在没有任何先验知识的情况下,完全独立地提出哈密顿物理量,或拉
阅读全文新智元报道 编辑:犀牛 定慧【新智元导读】Anthropic推出Claude两大重磅功能:Research与Google Workspace集成!Research功能让Claude快速检索网络与
阅读全文新智元报道 编辑:LRST 好困【新智元导读】港中文和清华团队推出Video-R1模型,首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集,Video-R
阅读全文新智元报道 编辑:编辑部 YZNH【新智元导读】国内最大MCP中文社区上线了,支付宝、MiniMax明星服务在魔搭MCP广场独家首发,还有近1500款MCP服务全领域覆盖,再次降低AI开发门槛。
阅读全文新智元报道 编辑:英智 好困【新智元导读】英伟达宣布了一项开创性计划,在美国制造AI超级计算机,通过与台积电、富士康等巨头合作,打造价值5000亿美元的AI基础设施。英伟达周一抛出重磅消息,宣布
阅读全文新智元报道 编辑:KingHZ【新智元导读】开源语音模型Orpheus让LLM涌现出人类情感!在A100 40GB显卡上,30亿参数模型的流式推理速度甚至超过了音频播放速度。甚至可以zero-s
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】AI辅助人类,完成了首个非平凡研究数学证明,破解了50年未解的数学难题!在南大校友的研究中,这个难题中q=3的情况,由o3-mini-h
阅读全文新智元报道 编辑:犀牛 定慧【新智元导读】研究发现,推理模型(如DeepSeek-R1、o1)遇到「缺失前提」(MiP)的问题时,这些模型往往表现失常:回答长度激增、计算资源浪费。本文基于马里兰
阅读全文新智元报道 编辑:编辑部 HXs【新智元导读】Figure公司通过强化学习,成功实现机器人的自然步态。利用高效物理模拟器,仅用几小时完成相当于多年训练的数据,训练出的策略无需额外调整即可「零样本
阅读全文新智元报道 编辑:桃子 犀牛【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用
阅读全文新智元报道 编辑:英智【新智元导读】从编程到论文,AI无处不在! 一项针对百万条学生对话的分析显示,AI不仅能调试代码,还能润色文章,甚至生成学习资料。但这背后,学术诚信的边界在哪里?如今,AI
阅读全文