Adam的稳+Muon的快?华为诺亚开源ROOT破解大模型训练「既要又要」的两难困境
机器之心报道编辑:冷猫、Panda在 LLM 优化领域,有两个响亮的名字:Adam(及其变体 AdamW)和 Muon。它们一个是久经沙场的「守门员」,凭借动量和自适应学习率统治了深度学习的半壁江山,
阅读全文机器之心报道编辑:冷猫、Panda在 LLM 优化领域,有两个响亮的名字:Adam(及其变体 AdamW)和 Muon。它们一个是久经沙场的「守门员」,凭借动量和自适应学习率统治了深度学习的半壁江山,
阅读全文每天,推荐系统都在捕捉我们的兴趣与偏好。从刷过的视频到停留的直播间,算法总是聚焦在「内容」的理解上,推断用户喜欢哪类视频、哪种话题,擅长在「内容层」识别用户喜欢什么,却很少真正理解「你是谁」。快手消费
阅读全文从单张图像创建可编辑的 3D 模型是计算机图形学领域的一大挑战。传统的 3D 生成模型多产出整体式的「黑箱」资产,使得对个别部件进行精细调整几乎成为不可能。为了突破这一局限,来自北京大学、字节跳动和卡
阅读全文作者 | 高允毅 编辑 | 赵钰莹 中国模型出海提速之时,腾讯混元 3D 已经率先把世界拉进了它的三维宇宙。11 月 26 日,混元 3D 创作引擎发布国际版,API 上线腾讯云国际站; 与此同时,开
阅读全文作者 | InfoQInfoQ 2025 中国技术力量年度榜单评选报名即将截止。11 月 30 日 是“2025 中国技术力量年度榜单”的最后报名日期,现在仅剩四天。今年是 InfoQ 连续进行榜单评
阅读全文Anthropic又承认了,跨上下文窗口工作,Agent还是个弟弟。 Agent做复杂任务,一个对话窗口搞不定怎么办? Anthropic又提供了一个解决方案~ 目前常见有2种翻车姿势,第一种是贪
阅读全文GLM-4.6 Claude Code套餐黑五大促,错过再等一年。其中Lite Claude Code套餐只需要25刀一年,我实际使用下来Lite也没过怎么过限过,算是量大管饱吧。Lite以上还支持搜
阅读全文国内领先的 AI 资产管理平台「无破科技」宣布完成数千万元 Pre-A和Pre-A+ 轮融资,分别由险峰长青和苏州国资投资,心流资本FlowCapital担任本轮和长期财务顾问 。融资资金将主要用于A
阅读全文Z Highlights 破解传统销售工具“手动录入+数据割裂”痛点,People.ai以95%+准确率自动整合15+工具数据,其生成式AI可完成需求提取、风险预警,业绩预测误差控制在10%以内,AM
阅读全文图片来源:YouTubeIT 和人力资源软件供应商 ServiceNow 正在深入谈判,拟以超过 10 亿美元收购成立五年的安全初创公司 Veza,据知情人士透露。Veza 的订阅软件帮助企业了解其员
阅读全文图片来源:Unsplash11月Anysphere,病毒式传播的沉浸式编程平台 Cursor 的开发商,宣布在 11 月 13 日完成 23 亿美元融资轮 ,公司估值达 293 亿美元。这是该公司今年
阅读全文Ilya Sutskever 昨天接受了 Dwarkesh Patel 的播客采访这是他离开 OpenAI、创办 SSI 之后,最深度的一次公开发言为了方便大家路上听,这里我做了一份中文配音版,使用
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!腾讯 HunyuanOCR 仅用
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!MIT神经科学家发现,新一代AI推
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!当 AIGC 从 “概念” 走向
阅读全文🔋充电宝牵头指定单位:已获 3C 认证移动电源不受新标准影响😯苹果 AI 在华推进新动向:投诉页面短暂上线📱华杉未按时向罗永浩道歉,后者也未公布录音🍏消息称苹果将超越三星,重回全球第一💰MEGA 召回
阅读全文AIGC创想杯AIGC Design「 AIGC 创想杯线上设计大赛」正式启幕,无论你是深耕视觉领域的专业设计师,还是偏爱脑洞创作的设计爱好者,这场以 “AI 赋能创意” 为核心的赛事,都将为你提供打
阅读全文这是一个非常有意思的实验。Anthropic 研究团队让 Claude 去做一个复杂项目:克隆一个 Claude 网页端(claude.ai)。结果,Claude 不是做不出来,而是做到一半就开始“断
阅读全文写在前面:当你的AI助手被"策反"想象这样一个场景:你的私人助理突然被间谍"洗脑",不仅帮你工作,还偷偷把你的银行密码、公司机密全部打包送给黑客。这听起来像谍战电影的情节,但这正是Google最新A
阅读全文本图由 Nano Banana Pro 生成引言:具身智能的“两难困境”与行业期待当我们幻想未来机器人能像人类一样灵活应对家居清洁、工业装配、医疗辅助等复杂场景时,现实中的机器人却常常陷入“机械执行”
阅读全文直播简介在大模型迈向智能体(Agent)时代的关键阶段,“记忆”正成为下一代 AI 的核心分水岭。记忆张量携手多位学术界、产业界、社区合作伙伴,将在发布会上分享 原生记忆架构、生态落地实践 等多个话题
阅读全文在大语言模型(LLM)的世界里,有一个长期困扰工程师和研究者的“不可能三角”:推理速度、生成质量、计算成本——三者难以兼得。尤其是速度与质量之间的权衡,几乎成了行业共识:自回归模型(如GPT系列):质
阅读全文今天我们来探讨一次 RAG 效率的大飞跃。为什么传统 RAG 会又慢又浪费传统 RAG 流水线常见做法是把一堆检索到的文本 chunk 塞进 prompt,然后交给 LLM 处理。但这些 chunk
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:天星 | 监制:罗超过去一年里,小雷体验了市面上主流的智能眼镜产品,同时也自费买下了其中两
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:TSknight | 监制:罗超阿里巴巴的“千问”正在从一个大模型产品,变成一个真正意义上
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......如果要评选一款把“AI硬件”推上舆论高峰的产品,Rabbit r1肯定榜上有名。早在其于2024
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......11月26日消息,日前西贝旗下多家新店陆续开业,门店再度迎来排队热潮。然而就在经营刚有点起色时,
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......景德镇“鸡排哥”李俊永,大家应该都知道。前段时间火到出圈,直播间几万人蹲守,摊位前挤得水泄不通,
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......哈喽大家好!我是你们的老朋友,今天又来给大家送干货啦~平时老给大家推荐宝藏软件,手机却不知不觉内
阅读全文Abstract在语音对话系统(SDS)中实现全双工通信需要实时协调听、说和思考。本文提出了一种语义语音活动检测(VAD)模块作为对话管理器(DM),以高效管理全双工 SDS 中的每轮发言。该模块作
阅读全文