聊聊大模型推理系统之 Nemotron Elastic:告别重复训练!NVIDIA用“一模型多尺寸”重构推理型LLM研发范式
大语言模型(LLM)正变得越来越“重”:从Llama-3.1的 8B、70B 到 405B 参数,每个尺寸都要从头训练,动辄消耗数万亿 tokens。如果能用一个模型覆盖多尺寸部署需求,不仅能大幅降低
阅读全文大语言模型(LLM)正变得越来越“重”:从Llama-3.1的 8B、70B 到 405B 参数,每个尺寸都要从头训练,动辄消耗数万亿 tokens。如果能用一个模型覆盖多尺寸部署需求,不仅能大幅降低
阅读全文当黄浦江畔的科创浪潮与云原生技术革新交汇,当算力竞赛告别 "硬件堆砌" 的粗放时代,转而深耕效率提升的精细化道路 —— 上海,这座锚定中国数字经济未来的先锋城市,正迎来一场由开源力量驱动的算力效率协同
阅读全文“你要视 AI 为人。”👦🏻 播客采访:Koji🥷 整理编辑:十字路口🧑🎨 排版: NCon中国的创业者和 VC 对 toB 普遍感到“生理性恐惧”,但是本周「十字路口」的嘉宾张帆却选择逆流而上。张
阅读全文今年华为开了很多发布会,推出了不少「又新又怪」的产品——「阔折叠」Pura X、「折叠电脑」MateBook Fold、「一目双镜」Pura 80 Ultra 等等……但今天发布的华为 Mate 80
阅读全文克雷西 比尔 发自 凹非寺量子位 | 公众号 QbitAI华为新一代SoC芯片,上车Mate 80系列!刚刚,华为年度旗舰Mate 80系列和折叠屏旗舰Mate X7,携全新麒麟9030系列芯片正式亮
阅读全文Henry 发自 凹非寺量子位 | 公众号 QbitAI全球首个自驾+机器人统一基座模型开源了!针对自驾与具身操作场景的知识迁移难题,小米汽车陈龙团队提出并开源了全球首个打通这两大领域的跨具身(X -
阅读全文MEET组委会 发自 凹非寺量子位|公众号 QbitAI2025年,我们正迈入一个由人工智能重塑一切的新时代。12月10日,量子位MEET2026智能未来大会将带你聚焦这一年里最受关注的前沿技术与产业
阅读全文你有没有过这种体验,想买个东西,先去小红书找了二三十篇笔记,B 站看了十几个测评,然后上什么值得买看了下优惠的渠道,最后,人已经麻到不想买了。今天,OpenAI 给了一个新的统一入口,让 ChatGP
阅读全文AI红队测试入门教程:从理论到实战导论:AI安全的新范式大型语言模型(LLM)的普及,将网络安全带入了一个全新的领域。传统的网络安全攻防,焦点在于代码和网络基础设施的确定性缺陷,例如SQL注入或缓冲
阅读全文老实讲,我本来以为最近已经够热闹了—— 一觉醒来,我们family群里又开始对opus刷屏。“怎么又来?能不能让我们这些普通人缓缓?”但打开数据一看,我是真的愣了一下。Anthropic 这次不光把性
阅读全文作者 | 木子、高允毅 AI 编程之王又易主了。昨晚,Anthropic 悄悄按下发布键,Claude Opus 4.5 直接在 编码、Agent、电脑操作 等多项“硬核能力”上全面登顶评测榜,超过
阅读全文作者 | AICon 全球人工智能开发与应用大会 策划 | 罗燕珊 编辑 | 宇琪 大模型与智能体的崛起正在重塑生产力的底层逻辑。AI 不仅提升了个体的工作效率,也在重构组织的协作方式和运营模式,催生
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!单张 GPU 也能同时运行多个大模
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!在“AI一日如一年”的快速变化面前
阅读全文专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!跨越“应用鸿沟”,AI价值的最终试
阅读全文11月29日(本周六),模力方舟 AI 沙龙 · 深圳站重磅开启!这次别只围观 AI 浪潮,一起冲进主战场,这场只讲干货的 AI 实战沙龙等你来!🎁 「AI × 算力 / 模型 / 应用」全面展开:百
阅读全文点击👇🏻可关注,文章来自🙋♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 以下内容作者是 claude-opus-4.5 ” 今日趋势今天的GitHub趋势明显集中在AI应用工具、智能代理框架、
阅读全文机器之心报道机器之心编辑部当 ChatGPT 在 2022 年底横空出世时,整个科技行业都被这股突如其来的对话式 AI 浪潮震得措手不及。而彼时的谷歌,这家在 AI 领域深耕十余年的巨头,却显得格外沉
阅读全文机器之心发布机器之心编辑部2025 年,AIGC 热度再冲新高:从社交头像、电商海报到影视分镜,AI 生成内容已全面渗透日常创作。在这股浪潮中,Nano Banana、Qwen Edit 等通用图像编
阅读全文机器之心报道机器之心编辑部AI 能否被学术会议、期刊的审稿人用于论文评审?目前,即使是在 AI 领域也尚未形成统一规范。目前全球的几大顶级会议里,ICLR 的规则是使用大模型必须进行披露,CVPR 则
阅读全文在推荐系统迈向多模态的今天,如何兼顾数据隐私与个性化图文理解?悉尼科技大学龙国栋教授团队联合香港理工大学杨强教授、张成奇教授团队,提出全新框架 FedVLR。该工作解决了联邦环境下多模态融合的异质性难
阅读全文我的 Max 才刚退没第三天:Claude 就又用 Opus 4.5 来掏我钱包了……有多强?都在图里了👆相比 Opus 4.1 价格也是暴跌至 1/3(代表用量消耗会变慢):并收获全面好评:循环还在
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这几天 Nano Banana Pro太刷屏了。模型即产品已经成了大多数人的共识。但是,其实想让模型做好一个垂域场景,SOTA模型其实只是一个半成品
阅读全文这两年,写代码这件事变了。GitHub Copilot、Cursor、Devin 一路登场,工程师开始习惯“打一段话,几千行代码自己长出来”。写得出东西,变得前所未有地容易。但很快大家发现,真正拖住上
阅读全文San Diego @ NeurIPS 2025今年我们决定用一个更轻松的方式,把做 RL、做 Agents和做大模型的朋友们聚在一起。这一次,我们依旧将把来自 OpenAI、Anthropic、De
阅读全文图片来源:Techcrunch产品演示总能吸引眼球,但软件开发实则更常涉及调试、质量保证和检测这类工作。这些枯燥却关键的环节保障着软件正常运行。随着开发者寻求更多工作负载的自动化,这些工作正逐渐交由A
阅读全文图片来源:SierraSierra,这家位于旧金山、成立仅 21 个月的初创企业,专注于为企业打造客服 AI 代理,周五宣布其年度经常性收入(ARR)已达到 1 亿美元。该公司的迅猛增长表明,跨行业的
阅读全文