7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法
新智元报道 编辑:LRST 好困【新智元导读】通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。在大
阅读全文新智元报道 编辑:LRST 好困【新智元导读】通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。在大
阅读全文新智元报道 编辑:编辑部 ZJX【新智元导读】就在刚刚,美国政府曝光了各界对「AI行动计划」的全部政策建议。OpenAI措辞激烈地表示,DeepSeek让我们看到,必须马上锁死中国AI,必须限制
阅读全文新智元报道 编辑:编辑部 NXs【新智元导读】一项来自清华大学和上海交通大学的研究颠覆了对可验证奖励强化学习(RLVR)的认知。RLVR被认为是打造自我进化大模型的关键,但实验表明,它可能只是提
阅读全文新智元报道 编辑:英智 好困【新智元导读】全球首个去中心化强化学习训练的32B模型震撼发布!无需授权,就能用自家异构计算资源参与其中,让编码、数学与科学领域的推理性能迈向新高度。最近,全球第一个
阅读全文新智元报道 编辑:编辑部 YNZH【新智元导读】百度文心大模型X1 Turbo正式发布了。这个基于4.5 Turbo的深度思考模型,效果领先DeepSeek-R1、V3,且价格仅为R1的25%!
阅读全文新智元报道 编辑:Aeneas【新智元导读】外媒记者发现:哥大退学哥的「Cheat Everything」作弊神器,实测翻车了!不仅反应慢,回答几乎没法用,还会造成工作会议中诡异的麦克风问题。其
阅读全文新智元报道 编辑:LRST【新智元导读】香港中文大学(深圳)的研究团队发布TASTE-Rob数据集,含100856个精准匹配语言指令的交互视频,助力机器人通过模仿学习提升操作泛化能力。团队还开发
阅读全文新智元报道 编辑:编辑部 YZH【新智元导读】昆仑万维Skywork-R1V 2.0版本,开源了!这一次,它的多模态推理实现了再进化,成为最强高考数理解题利器,直接就是985水平。而团队也大方公
阅读全文新智元报道 编辑:犀牛【新智元导读】英特尔再次掀起裁员风暴!计划裁员超20%,这是新任CEO陈立武上任后的首次重大重组。面对AI领域落后英伟达、连续三年营收下滑的困境,英特尔试图通过精简管理、重
阅读全文新智元报道 编辑:LRST 好困【新智元导读】通过蒙特卡洛树搜索筛选高难度样本,ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力,无需知识蒸馏,为高效训练提供了新思路。在大
阅读全文新智元报道 编辑:编辑部 ZXH【新智元导读】美国Z世代表示:因为ChatGPT,大学文凭已经变成一张废纸!纯属浪费时间浪费金钱。刚刚出炉的调查显示,同意此观点的年轻人已经达到了49%。而哥大退
阅读全文新智元报道 编辑:桃子 好困【新智元导读】一年一度ICLR 2025杰出论文开奖!普林斯顿、UBC、中科大NUS等团队的论文拔得头筹,还有Meta团队「分割一切」SAM 2摘得荣誉提名。刚刚,I
阅读全文新智元报道 编辑:LRST【新智元导读】Adam优化器是深度学习中常用的优化算法,但其性能背后的理论解释一直不完善。近日,来自清华大学的团队提出了RAD优化器,扩展了Adam的理论基础,提升了训
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】国产大模型Vidu Q1横空出世,荣登全球视频生成榜首!支持1080p高清画质,好莱坞级首尾帧运镜,细节逼真到爆。更惊艳的是,性价比仅是同行1/1
阅读全文新智元报道 编辑:定慧 英智【新智元导读】AI会无脑附和吗?Anthropic研究发现,Claude能根据场景切换人格:谈恋爱时化身情感导师,聊历史时秒变严谨学者。一些对话中,它强烈支持用户价值
阅读全文新智元报道 编辑:定慧【新智元导读】DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoughtology)。这份长达1
阅读全文新智元报道 编辑:编辑部 HNYZ【新智元导读】全球首个行动浏览器Fellou重磅发布,不仅能自动填表单、管理标签页,还能跨网站执行繁琐任务。只需一句话,Fellou帮你全搞定。得益于自由开放的
阅读全文新智元报道 编辑:犀牛 好困【新智元导读】一句话看懂:o3以深度推理与工具调用能力领跑复杂任务,GPT-4.1超长上下文与精准指令执行适合API开发,而o4-mini则堪称日常任务的「性价比之王
阅读全文新智元报道 编辑:英智【新智元导读】采样多就一定准吗?研究人员用实验告诉你:是的,而且超乎想象!基于采样的搜索不仅能在并行处理中大展身手,还通过隐式扩展让验证更精准。先让模型生成多个候选答案,再
阅读全文新智元报道 编辑:KingHZ 桃子【新智元导读】o3编码直逼全球TOP 200人类选手,却存在一个致命问题:幻觉率高达33%,是o1的两倍。Ai2科学家直指,RL过度优化成硬伤。满血o3更强了
阅读全文新智元报道 编辑:定慧【新智元导读】还在用搜索和规则训练AI游戏?现在直接「看回放」学打宝可梦了!德州大学奥斯汀分校的研究团队用Transformer和离线强化学习打造出一个智能体,不靠规则、没
阅读全文新智元报道 编辑:LRS【新智元导读】Nemotron-H模型混合了Transformer和Mamba架构,使长文本推理速度提升3倍,同时还能保持高性能,开源版本包括8B和56B尺寸。训练过程采
阅读全文新智元报道 编辑:Aeneas 好困【新智元导读】「一位顶尖科学家,有数千亿美元的资源,却仍然能把Meta搞砸了!」最近,圈内对LeCun的埋怨和批评,似乎越来越压不住了。有人批评说,Meta之
阅读全文新智元报道 编辑:Aeneas KingHZ【新智元导读】OpenAI首席财务官Sarah Friar探讨了通往AGI的发展路径,目前OpenAI已到达第三阶段:智能体(Agnent)。除Ope
阅读全文新智元报道 编辑:LRST【新智元导读】Hyper-RAG利用超图同时捕捉原始数据中的低阶和高阶关联信息,最大限度地减少知识结构化带来的信息丢失,从而减少大型语言模型(LLM)的幻觉。大语言模型
阅读全文新智元报道 编辑:编辑部 ZJH【新智元导读】公考行测中的逻辑推理题,是不少考生的噩梦,这次,CMU团队就此为基础,打造了一套逻辑谜题挑战。实测后发现,o1、Gemini-2.5 Pro、Cla
阅读全文新智元报道 编辑:桃子【新智元导读】陈立武上任即掀改革风暴,通过扁平化管理,强化技术导向,誓言重振这家硅谷传奇。同时,网络芯片专家Sachin Katti被任命为AI与技术双料首席,肩负对抗英伟
阅读全文新智元报道 编辑:英智【新智元导读】一股由ChatGPT引爆的AI玩偶热潮正在席卷全球社交媒体!从领英到TikTok,人人都在将自己变成可爱玩偶,搭配个性配饰,装进精美包装盒。你准备好了吗?Op
阅读全文新智元报道 编辑:编辑部 NZYH【新智元导读】满血版o3和o4-mini深夜登场,首次将图像推理融入思维链,还会自主调用工具,60秒内破解复杂难题。尤其是,o3以十倍o1算力刷新编程、数学、视
阅读全文新智元报道 编辑:定慧【新智元导读】谷歌推出全新DolphinGemma大模型,基于30年海豚研究数据训练的AI模型正试图破解海豚的语言密码。仅有400M参数的轻量级模型能在普通Pixel手机上
阅读全文