吴恩达发布论文自动审阅器,ICLR上达到接近人类水平
机器之心报道机器之心编辑部AI 能否被学术会议、期刊的审稿人用于论文评审?目前,即使是在 AI 领域也尚未形成统一规范。目前全球的几大顶级会议里,ICLR 的规则是使用大模型必须进行披露,CVPR 则
阅读全文机器之心报道机器之心编辑部AI 能否被学术会议、期刊的审稿人用于论文评审?目前,即使是在 AI 领域也尚未形成统一规范。目前全球的几大顶级会议里,ICLR 的规则是使用大模型必须进行披露,CVPR 则
阅读全文在推荐系统迈向多模态的今天,如何兼顾数据隐私与个性化图文理解?悉尼科技大学龙国栋教授团队联合香港理工大学杨强教授、张成奇教授团队,提出全新框架 FedVLR。该工作解决了联邦环境下多模态融合的异质性难
阅读全文我的 Max 才刚退没第三天:Claude 就又用 Opus 4.5 来掏我钱包了……有多强?都在图里了👆相比 Opus 4.1 价格也是暴跌至 1/3(代表用量消耗会变慢):并收获全面好评:循环还在
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这几天 Nano Banana Pro太刷屏了。模型即产品已经成了大多数人的共识。但是,其实想让模型做好一个垂域场景,SOTA模型其实只是一个半成品
阅读全文这两年,写代码这件事变了。GitHub Copilot、Cursor、Devin 一路登场,工程师开始习惯“打一段话,几千行代码自己长出来”。写得出东西,变得前所未有地容易。但很快大家发现,真正拖住上
阅读全文San Diego @ NeurIPS 2025今年我们决定用一个更轻松的方式,把做 RL、做 Agents和做大模型的朋友们聚在一起。这一次,我们依旧将把来自 OpenAI、Anthropic、De
阅读全文图片来源:Techcrunch产品演示总能吸引眼球,但软件开发实则更常涉及调试、质量保证和检测这类工作。这些枯燥却关键的环节保障着软件正常运行。随着开发者寻求更多工作负载的自动化,这些工作正逐渐交由A
阅读全文图片来源:SierraSierra,这家位于旧金山、成立仅 21 个月的初创企业,专注于为企业打造客服 AI 代理,周五宣布其年度经常性收入(ARR)已达到 1 亿美元。该公司的迅猛增长表明,跨行业的
阅读全文如果告诉你,仅仅改变提示词(Prompt)的结构,就能让大模型在复杂推理任务上的表现暴涨 60%,你相信吗?几天前,来自伊利诺伊大学香槟分校(UIUC)、华盛顿大学(UW)、普林斯顿和哈佛的研究团队发
阅读全文NeurIPS 2025在星光与海风之外,我们也为现场的小伙伴准备了更“走心”的相遇方式——一场轻松惬意的滨海美式晚宴,以及一份贴心的冬日温暖伴手礼。无论你是来聊研究、交换灵感,还是想和同行随性聊两句
阅读全文近年来,多模态大语言模型在视频理解领域展现出巨大潜力。然而,现有评估基准仍存在明显短板——要么忽视音频或视觉单一模态,要么以逻辑不一致的方式整合双模态,难以全面衡量模型的真实推理能力。为填补这一空白,
阅读全文作者|郭海惟邮箱|guohaiwei@pingwest.com我问Articuler创始人Jason,如果用一句话定义你的公司,你会怎么说?他说,“职业社交里面的Tinder”。我反问,“(定语里)没
阅读全文这是一个具身智能界期待已久的时刻:人工智能正在从屏幕中的“能言善辩”,迈向物理世界的“知行合一”。2025 年 12 月 12 日,中国·上海。GDPS 2025全球开发者先锋大会暨国际具身智能技能大
阅读全文文章转载于新智元全球编码王座,一夜易主。果不其然,Anthropic深夜放出了Claude Opus 4.5,堪称全球最顶尖的模型。它不仅编程强,而且智能体和计算机使用(computer use)能力
阅读全文新智元报道 编辑:桃子 好困【新智元导读】AI的下一站真的要来了。12月12日,魔都即将上演一场「硅基」大赛,六大赛道全面开战。是骡子是马,物理世界里见真章!这是一个具身智能界期待已久的时刻:人
阅读全文新智元报道 编辑:艾伦【新智元导读】最新研究发现,只要把恶意指令写成一首诗,就能让Gemini和DeepSeek等顶尖模型突破安全限制。这项针对25个主流模型的测试显示,面对「诗歌攻击」,百亿美
阅读全文新智元报道 编辑:元宇【新智元导读】AI训练背后,正在上演一场新的「华尔街迁徙」!前银行家纷纷化身AI导师,用自己的专业知识帮助OpenAI、xAI、Scale AI等AI公司训练模型,华尔街精
阅读全文新智元报道 【新智元导读】2025年9月7日,新智元十周年!十年求索,奇点共盟。值此,新智元在上地AI家邀你加入,共同见证ASI降临。2015年9月7日—2025年9月7日,新智元星舰远航十年。
阅读全文今天,Anthropic 发布了 Claude Opus 4.5,目前编程能力最强的大模型SWE-bench 对比图更多成绩成绩:• SWE-bench Verified:80.9%(GPT-5.1
阅读全文文|新能超克作者|胡珈萌编辑|李程程本文首发于钛媒体APP芯片,已愈发成为地缘政治中最紧绷的那根弦。全球半导体光刻机领域的霸主、荷兰ASML公司,正陷入一场国际舆论风暴。这一切都源于一本名为《世界上最
阅读全文Opus 4.5 新王登顶!加量还降价!价格只有原来 Opus 4.1 的 1/3。定价为 $5 (输入) / $25 (输出) 每百万 token。Opus 4.5(红框标注的电话)在大多数测试中表
阅读全文🛍OpenAI 推出 ChatGPT「购物研究」功能📱高通确认与苹果互传文件功能将登陆更多 Android 机型🏇Claude Opus 4.5 正式推出🎤豆包输入法官宣上线,主打 AI 语音识别💻联
阅读全文历史性对决!硅基生命「上岗」大考,上海设下终极考场。这是一个具身智能界期待已久的时刻:人工智能正在从屏幕中的“能言善辩”,迈向物理世界的“知行合一”。2025 年 12 月 12 日,中国·上海。GD
阅读全文这一次,Anthropic 没让人失望。你方唱罢我登场,神仙打架太疯狂。今天,让我们把聚光灯给到:Anthropic!就在刚刚,Anthropic 放出了他们憋了三个月的大招 —— Claude Op
阅读全文它是最近 AI 圈的顶流,但我发现,它被严重低估了。当所有人都在用 Nano Banana Pro 生成网红图时,我用它干了件正经事:搞科研。结果?它画的方法图,直接把我过去三年的手搓水平按在地上摩擦
阅读全文“这款模型在 Python 错误修复上表现惊艳,但在 Java 功能实现上却惨不忍睹”,“同一个模型在 Web 开发场景游刃有余,面对基础设施代码却束手无策”——这些开发者社区的常见吐槽,折射出现有代
阅读全文提及小米在AI领域的布局,「MiMo」系列绝对是绕不开的关键方向。业内已经逐渐意识到:这是小米在 AI × 终端 × 机器人 × 智能汽车 四条线交汇处的核心战略资产。小米MiMo系列此前推出的MiM
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:定西 | 监制:罗超豆包已成为小雷日常生活中使用频率最高的AI应用,无论是各类疑难问题解答
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......说起全屋智能,相信大多数人首先想到的应该会是小米、华为等互联网品牌,或是 Aqara、欧瑞博等专
阅读全文