3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成
新智元报道 编辑:LRST【新智元导读】Time-R1通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使3B小模型实现全
阅读全文新智元报道 编辑:LRST【新智元导读】Time-R1通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使3B小模型实现全
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:KingHZ 犀牛【新智元导读】注意力机制的「平方枷锁」,再次被撬开!一招Fenwick树分段,用掩码矩阵,让注意力焕发对数级效率。更厉害的是,它无缝对接线性注意力家族,Mam
阅读全文新智元报道 编辑:KingHZ【新智元导读】仅用6小时,Claude 4就让研究者了解了如何制造神经毒气——这不是小说情节,而是真实事件。更令人担忧的是,Anthropic自身也无法完全评估风险
阅读全文新智元报道 编辑:犀牛【新智元导读】AI正在颠覆医疗领域!哈佛、斯坦福等顶尖学术医疗中心的研究表明,OpenAI的o1-preview在诊断推理任务中全面超越人类医生。从新英格兰医学杂志的临床病
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:编辑部 XZH【新智元导读】豆包的一句话P图功能,又进化了!各种高考祝福、网络梗图、大片级精修、设计师草稿,无不是信手拈来。此刻,AI P图再次迎来降维打击,只要用自然语言,就
阅读全文新智元报道 编辑:KingHZ【新智元导读】RNN太老,Transformer太慢?谷歌掀翻Transformer王座,用「注意力偏向+保留门」取代传统遗忘机制,重新定义了AI架构设计。全新模型
阅读全文新智元报道 编辑:LRS【新智元导读】20万次模拟实验,耗资5000美元,证实大模型在多轮对话中的表现明显低于单轮对话!一旦模型的第一轮答案出现偏差,不要试图纠正,而是新开一个对话!ChatGP
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:编辑部 YZNH【新智元导读】刚刚,AI顶流春晚智源大会来了!深度学习和强化学习两大巨头齐聚,图灵奖得主、顶尖专家出席,2025 AI未来的发展路径,在一场场精彩的思想碰撞中被
阅读全文新智元报道 编辑:英智【新智元导读】AI让每个人都能成为创作者!谷歌CEO劈柴震撼发声,称AI是人类历史上影响最深远的技术。他畅谈从文字到电影制作,AI如何释放全球80亿人的认知潜能,彻底改变创
阅读全文新智元报道 编辑:peter东 英智【新智元导读】近日,一项发表在《自然·人类行为》的研究指出:在线辩论中,当大语言模型能够根据对手的特征个性化其论点时,它们比人类更具说服力。作为人类,我们认为
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:KingHZ 桃子【新智元导读】RL后训练已成为大模型性能突破的「杀手锏」,而算力浪费和集群效率低成为一大难题。这次,华为团队祭出两大黑科技直接破局。不仅在CloudMatri
阅读全文新智元报道 编辑:定慧 好困【新智元导读】科学家用AI重构《死海古卷》时间线,震撼圈内!最新研究显示,《但以理书》《传道书》部分古卷实际成书更早,甚至揭示了圣经作者线索。AI模型Enoch结合碳
阅读全文新智元报道 编辑:Aeneas 定慧【新智元导读】清华与蚂蚁联合开源AReaL-boba²,实现全异步强化学习训练系统,有效解耦模型生成与训练流程,GPU利用率大幅提升。14B模型在多个代码基准
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:桃子 犀牛【新智元导读】数据枯竭正成为AI发展的新瓶颈!CMU团队提出革命性方案SRT:让LLM实现无需人类标注的自我进化!SRT初期就能迭代提升数学与推理能力,甚至性能逼近传
阅读全文新智元报道 编辑:KingHZ【新智元导读】原生1bit大模型BitNet b1.58 2B4T再升级!微软公布BitNet v2,性能几乎0损失,而占用内存和计算成本显著降低。最近,微软亚研院
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】本想练练手合成点数据,没想到却一不小心干翻了PyTorch专家内核!斯坦福华人团队用纯CUDA-C写出的AI生成内核,瞬间惊艳圈内并登上Hack
阅读全文新智元报道 编辑:英智【新智元导读】OpenAI的o3推理模型席卷AI界,算力暴增10倍,能力突飞猛进!但专家警告:最多一年,推理模型可能一年内撞上算力资源极限。OpenAI还能否带来惊喜?最多
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:编辑部 YZNH【新智元导读】快手、京东、小红书、金铲铲……超5万爆款手机应用,刚刚涌进了你的电脑桌面?这个时代的PC流量,还是一片亟待掘金的蓝海。现在,这个月活5亿的巨大市场
阅读全文新智元报道 编辑:KingHZ【新智元导读】英伟达赚麻了!AI推理全面爆发,芯片巨头2026财年Q1营收达441亿美元,净利润飙升至188亿美元,双双远超市场预期!英伟达狂赚不止,再次交出了亮眼
阅读全文新智元报道 编辑:LRST 好困【新智元导读】EfficientLLM项目聚焦LLM效率,提出三轴分类法和六大指标,实验包揽全架构、多模态、微调技术,可为研究人员提供效率与性能平衡的参考。近年来
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元将迎来十岁生日!值此,新智元诚邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。「新智元」星舰搭载了数
阅读全文新智元报道 编辑:Aeneas 犀牛【新智元导读】就在刚刚,全球首款实时摄像头重磅诞生!从此,AI视频生成的「实时性」和「沉浸感」被重新定义,全行业都有了颠覆性方案。就在今天,AI视频领域,再次
阅读全文新智元报道 编辑:定慧 好困【新智元导读】面对谷歌、OpenAI等劲敌猛攻及Llama 4翻车、人才流失困境,小扎决定重组Meta GenAI团队,设AI产品、AGI基础和FAIR三大架构。小扎
阅读全文