LLM权重量化导论
在这里插入图片描述大型语言模型(llm)以其广泛的计算需求而闻名。通常,模型的大小是通过将参数的数量(大小)乘以这些值的精度(数据类型)来计算的。但是,为了节省内存,可以通过称为量化的过程使用精度较
阅读全文AI 领域迄今最大规模的用户行为实录,刚刚发布了。这是全球模型聚合平台 OpenRouter 联合硅谷顶级风投 a16z 发布的一份报告,基于全球 100 万亿次真实 API 调用、覆盖 300+款
阅读全文赵何娟丨钛媒体集团创始人&CEO12月8日,钛媒体2025T-EDGE年度大会暨AI全球对话开启于今天,「赵何娟 Talk」(Jany Talk)进行了一场意义非凡的对话,因为一位特别嘉宾——被誉为“
阅读全文机器之心报道编辑:杜伟、Panda这届 ICLR 的烦心事还没有结束。最近一段时间,对于 ICLR 2026 来说,真可谓是一波未平、一波又起。先是第三方机构对审稿意见的系统性统计发现,其中有 21%
阅读全文机器之心报道编辑:泽南、陈陈「0 代码」计算机课在教啥东西?这就是现代的软件开发吗?谁也想不到,斯坦福大学计算机系今年最热门的课程,居然明牌不鼓励你写代码。近日,斯坦福大学新开设的课程《现代软件开发者
阅读全文本文的作者分别来自西安交通大学和东京科学大学。第一作者宋天乐是来自西安交通大学的博士生,研究方向聚焦于人机交互行为安全,生物特征识别,隐私保护。通讯作者为西安交通大学蔺琛皓教授。移动应用通过 Andr
阅读全文引言强化学习(Reinforcement Learning, RL)已经成为提升大语言模型(Large Language Models, LLM)推理能力的核心技术之一。现代 RL 训练流程使模型能
阅读全文国内最强的图片生成模型 SeeDream 已经更新到 4.5 版本,我很好奇,4.5 到底有啥提升,强到什么程度!可能有人还不知道 SeeDream 是什么?它就是豆包和即梦背后的图片生成模型。豆包上
阅读全文参与到成千上万个优秀游戏的创作中去。👦🏻 播客采访:Koji🥷 整理编辑:十字路口🧑🎨 排版: NCon🚥 本周「十字路口」的嘉宾是恶少。在游戏行业,恶少曾经可谓站在行业巅峰,作为最早的策划,他参与
阅读全文没想到在华为 Mate 80 系列、三星首款三折叠接连发布的一周里,最火的会是搭载豆包手机助手技术预览版的中兴 nubia M153。发售即售罄就不说了,首批工程机在二手平台上普遍加价数百元转卖。相比
阅读全文整理 | 褚杏娟 “谷歌刚把免费版 Gemini API 的每日请求次数从 250 降到了 20,我的 n8n 自动化脚本现在基本都用不了了。这对任何开发小型项目的人来说都是个打击。”网友 Nilva
阅读全文整理 | 冬梅 黄仁勋回顾了英伟达最惊险、也最具决定性的创业阶段——从错误的早期战略、濒临破产的现金流,到押上公司未来的技术重构与一次性量产的豪赌。昨天,英伟达正式推出 CUDA Toolkit 13
阅读全文henry 发自 凹非寺量子位 | 公众号 QbitAI平时一看机器人比赛,就说遥操,遥操。今儿个,鼓励“自力更生的”,来了!就在这周末刚刚收官的ATEC2025线下挑战赛,主办方不仅鼓励机器人自主完
阅读全文鹭羽 发自 凹非寺量子位 | 公众号 QbitAIScaling Laws不死!前有llya暴论Scaling遇到瓶颈,后脚哈萨比斯就隔空力挺Scaling Law:Scaling有用,而且AGI必须
阅读全文闻乐 发自 凹非寺量子位 | 公众号 QbitAI英伟达小模型持续获胜。ARC-AGI 2最新成绩,4B小模型NVARC以27.64%的公开榜成绩力压GPT-5 Pro 18.3%登顶榜首。且每任务成
阅读全文MEET组委会 发自 凹非寺量子位 | 公众号 QbitAI抓紧,真的只剩一周时间了!因为AI圈一年一度绝对不容错过的盛宴马上就要来了——MEET2026智能未来大会。而且现在大会的内容已经可以剧透,
阅读全文新智元报道 编辑:桃子 定慧【新智元导读】周末的一场顶级赛事,彻底撕碎了实验室的「滤镜」!全球13支精英战队的机器人上演连环翻车:过吊桥卡腿、爬阶梯摔跤,堪称一场机器人的「荒野求生」。周末两天,
阅读全文新智元报道 编辑:艾伦【新智元导读】这个冬天,OpenAI感到格外寒冷而难熬。今年OpenAI概念股涨了74%,而谷歌概念股涨了146%,是OpenAI的两倍。昔日「救世主」OpenAI跌落神坛
阅读全文新智元报道 编辑:元宇【新智元导读】在AI的浪潮下,学术研究正在被商业机构加速「量产化」,包装成明码标价的「入学筹码」。这不仅稀释了学术研究的含金量,挤占了学术资源,也可能导致学术通胀、学历贬值
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文从 GPT-4o 的惊艳亮相到 Gemini 的持续迭代,AI不仅能理解文本,更能看懂图像、听辨声音、创作视频,实现跨模态的联合理解与生成。这一前沿领域的核心,正是统一多模态基础模型(Unified
阅读全文近日,来自新加坡管理大学(SMU)、罗切斯特大学(UR)、伦敦大学学院(UCL)、新加坡国立大学(NUS)、香港中文大学(CUHK)、斯坦福大学(Stanford)等顶尖科研机构的研究团队联袂发布了最
阅读全文最近,Google Research 发布了一篇 Blog《Titans + MIRAS:帮助人工智能拥有长期记忆》。它们允许 AI 模型在运行过程中更新其核心内存,从而更快地工作并处理海量上下文。这
阅读全文苹果年度APP出炉。 整体AI味儿有点浓。 不是为了AI而AI,用AI解决了一个具体的、真实的问题成了年度标配。 iPhone年度应用Tiimo,一个给ADHD人群用的AI规划工具。 【ADHD
阅读全文作者|王兆洋邮箱|wangzhaoyang@pingwest.com没有人不想成为上帝。但又成为不了,怎么办呢?人们就自己创造条件。抖音快手上,你滑动手指决定内容生死;《我的世界》里,你搭建规则创造文
阅读全文进入 2025 年,生成式 AI 正在从“概念验证”走向“规模化落地”,技术与应用的节奏明显加快。这个趋势在 Y Combinator 的 Demo Day 上体现得尤为清晰:在最新的 F25 批次中
阅读全文人工智能、大模型、极客精神,这些词离人们印象中的“潮汕”很远。传统大家族、经商头脑,乃至手打牛肉丸和牛肉火锅,似乎都更声名在外。 “潮汕”与“科技”,向来不常被联系到一起。然而在
阅读全文图片来源:Unsplash导语投资人正在急切地寻找下一个百亿级估值的引爆点。如果说过去两年,有一家公司一个刺激大家神经,那无疑是Mercor,它重新定义了LLM时代的数据基础设施。这家成立不到三年、团
阅读全文图片来源:parloa据知情人士透露,开发客户服务人工智能的德国初创公司Parloa正在寻求新一轮融资,估值将较今年5月大幅提升。这家在德国和纽约设有办公室的公司,已与包括General Cataly
阅读全文