LLM幻觉,竟因知识「以大欺小」!华人团队祭出对数线性定律与CoDA策略
新智元报道 编辑:KingHZ【新智元导读】来自UIUC等大学的华人团队,从LLM的基础机制出发,揭示、预测并减少幻觉!通过实验,研究人员揭示了LLM的知识如何相互影响,总结了幻觉的对数线性定律
阅读全文新智元报道 编辑:KingHZ【新智元导读】来自UIUC等大学的华人团队,从LLM的基础机制出发,揭示、预测并减少幻觉!通过实验,研究人员揭示了LLM的知识如何相互影响,总结了幻觉的对数线性定律
阅读全文新智元报道 编辑:编辑部 JNY【新智元导读】原生多模态Llama 4终于问世,开源王座一夜易主!首批共有两款模型Scout和Maverick,前者业界首款支持1000万上下文单H100可跑,后
阅读全文新智元报道 编辑:英智【新智元导读】大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率
阅读全文新智元报道 编辑:英智【新智元导读】最新研究发现,LLM在面对人格测试时,会像人一样「塑造形象」,提升外向性和宜人性得分。AI的讨好倾向,可能导致错误的回复,需要引起警惕。你是否想过,LLM也有
阅读全文新智元报道 编辑:Aeneas 犀牛【新智元导读】刚刚,奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要
阅读全文新智元报道 编辑:英智 定慧【新智元导读】就在刚刚,Higgsfiled AI推出Motion Controls AI视频生成,在模仿电影级别的动作捕捉删上取得了新进展!不论是是360度环绕拍摄
阅读全文新智元报道 编辑:定慧【新智元导读】在刚刚结束的GTC大会上,黄仁勋公布了英伟达面向未来AI工厂的GPU路线图,从Ampere、Hopper,到Blackwell、Rubin和Feynman,每
阅读全文新智元报道 编辑:编辑部 HNZ【新智元导读】前OpenAI研究员Daniel Kokotajlo团队发布了「AI 2027」预测报告,描绘了一个超人AI崛起的未来:从2025年最贵AI诞生,到
阅读全文新智元报道 编辑:编辑部 ZNH【新智元导读】英特尔与台积电,已经初步达成协议,成立一家合资企业,来运营英特尔的晶圆制造工厂。此后,台积电将持有新公司20%的股份。英特尔的财务危机,要终结了?而
阅读全文新智元报道 编辑:定慧【新智元导读】Meta AI研究副总裁Pineau亲自发帖声称将于5月30日离职,她主导了Llama开源系列及PyTorch项目。此举正逢扎克伯格重金投入AI及LlamaC
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】之前靠AI作弊神器横扫大厂offer的小哥,最近有新后续了:创业成功,月入22.85万美元,走上人生巅峰。与此同时,大厂的面试官们可是被
阅读全文新智元报道 编辑:定慧 英智【新智元导读】谷歌DeepMind研发的DreamerV3实现重大突破:无需任何人类数据,通过强化学习与「世界模型」,自主完成《我的世界》中极具挑战的钻石收集任务。该
阅读全文新智元报道 编辑:LRST【新智元导读】通过完全启用并发多块执行,支持任意专家数量(MAX_EXPERT_NUMBER==256),并积极利用共享内存(5kB LDS)和寄存器(52 VGPRs
阅读全文新智元报道 编辑:编辑部 HYZ【新智元导读】ATEC2025科技精英赛来袭!这是一场由顶尖高校等联手举办的全球科技盛会。21万美金高额奖池,商业级机器人硬件体验,还有与权威学者、产业大咖面对面
阅读全文新智元报道 编辑:桃子 好困【新智元导读】DeepMind内部研究要「封箱」了!为保谷歌在AI竞赛领先优势,生成式AI相关论文设定6个月禁发期。不仅如此,创新成果不发,Gemini短板不提。De
阅读全文新智元报道 编辑:LRST【新智元导读】4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用
阅读全文新智元报道 编辑:编辑部 JNZ【新智元导读】GPT-4o,登顶王座名副其实!新出炉的图像竞技场中,它以ELO评分并列冠军。而ChatGPT在一小时内,新增用户直接破了百万,全网的病毒式传播还没
阅读全文新智元报道 编辑:桃子【新智元导读】未来十年,全球机器人市场规模将飙升至380亿美金。这一次,孙正义又将目光投向更大的赛道,斥资1万亿豪赌美国AI工业园区,让人形机器人干活。报道称,在「星际之门
阅读全文新智元报道 编辑:编辑部【新智元导读】LLM正推动推荐系统革新,以用户表征为「软提示」的范式开辟了高效推荐新路径。在此趋势下,淘天团队发布了首个基于用户表征的个性化问答基准UQABench,系统
阅读全文新智元报道 编辑:桃子 好困【新智元导读】短短几个月,国产黑马再次拿下新一轮超5亿元融资,引爆具身智能赛道。从「抓糖豆」到「全流程叠衣」技术飞跃,杭州创业沃土孕育的这颗新星,正以软硬全栈技术路线
阅读全文新智元报道 编辑:编辑部 HXs【新智元导读】两家期刊实验表明,250美元报酬,能加快评审速度而不降低质量。但专家警告,现金激励可能悄然改变科研生态,这将为学术评审带来新生,还是埋下隐患?AI在
阅读全文新智元报道 编辑:LRS 好困【新智元导读】SANA-Sprint是一个高效的蒸馏扩散模型,专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏(sCM)和潜空间对抗蒸馏(LADD)的混合
阅读全文新智元报道 编辑:编辑部 NZYH【新智元导读】2025中关村论坛人工智能主题日,高能不断。清华系团队全新Vidu Q1视频生成可控性再创新高,炫目demo惊艳全场。图灵奖得主Joseph Si
阅读全文新智元报道 编辑:KingHZ【新智元导读】给AI一张全新的照片,它能以相当高的准确率还猜出照片在哪个城市拍摄的。在新研究中,表现最好的AI模型,猜出图片所在城市的正确率比人类高62.6%!以后
阅读全文新智元报道 编辑:英智【新智元导读】医学变革风暴来袭!ECgMPL模型如同医学领域的超级侦探,从细胞和组织微观图像里精准揪出癌症踪迹,诊断子宫内膜癌准确率近100%,远超医生平均水平。逆天!新型
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】就在刚刚,2025中关村论坛上智源研究院发布了两大重磅:首个跨本体具身大小脑协作框架RoboOS,以及开源具身大脑RoboBrain!从此,单机
阅读全文新智元报道 编辑:定慧【新智元导读】AI频频刷新基准测试纪录,却算不清「strawberry」里到底有几个字母r,在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起,例如由一名高中生开发
阅读全文新智元报道 编辑:LRS【新智元导读】史上最大的基因组AI模型Evo 2使用超过12.8万个基因组数据训练,包含9.3万亿个核苷酸,能预测突变效应、设计 DNA 序列,并通过可视化工具展示学习到
阅读全文新智元报道 编辑:Aeneas 桃子【新智元导读】刚刚,出门问问2024年报正式发布!过去一年,集团AIGC纯软件产品收入突破2.2亿元,同比增长88.5%,高毛利驱动总收入达3.9亿元。这家「
阅读全文新智元报道 编辑:LRST【新智元导读】「思维链劫持」(H-CoT)的攻击方法,成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明,这些模
阅读全文