谷歌Agent深夜颠覆数学界!陶哲轩联手,解决300年难题或迎"AlphaGo时刻"
今天凌晨,Google DeepMind 重磅推出了耗时一年半研究的智能体—— 「AlphaEvolve」,一个由 Gemini 驱动的通用科学智能体。不止能解决 300 年数学难题,还用于发现新算法
阅读全文今天凌晨,Google DeepMind 重磅推出了耗时一年半研究的智能体—— 「AlphaEvolve」,一个由 Gemini 驱动的通用科学智能体。不止能解决 300 年数学难题,还用于发现新算法
阅读全文(红杉 AI 峰会2025 主题演讲:AI万亿美元机遇)最近,第三届红杉资本 AI 峰会刚刚在旧金山落幕。150 位全球顶尖 AI 创始人齐聚红杉资本会场。窗帘落下,与外界隔绝整整 6 小时——最先映
阅读全文为了让大模型(LLM)的行为更符合人类预期,一系列训练时对齐方法(例如 RLHF 和 DPO)通过微调模型参数来实现偏好优化。然而,这种“训练时对齐”模式不仅耗时耗力,而且一旦偏好发生变化(比如安全标
阅读全文最近,夸克在 AI 圈里的存在感很强。两个月前,夸克推出集多种 AI 工具于一身的 —— 「AI 超级框」,凭一个框,冲上国内 AI 应用榜第一,连港澳台和新加坡的榜单也冲上去了。说实话,在我印象里它
阅读全文今儿刷 x,看到了一张逆天的图:这张图的内容已经是违法的地步了。我当下是这种:这个帖子底下还有这样的:这样的:总之,就是各种不对劲。至于不对劲的地方,你要细品~~当然,上面的这种情况,排除“PS”,还
阅读全文Cursor,大家都知道吧。以黑马之姿,迅速改写 AI 编程的市场格局,崛起速度更是惊人。据传 Cursor 的 ARR 已从 2024 年底的 1 亿美元,在短短数月内突破 3 亿美元大关,用户数超
阅读全文家人们,本人自以为每天混在 AI 圈里,已经见过很多 AI 的“大世面”了!结果,最近又刷到了非常震惊的事情——AI 替我花钱全球最大的两个支付科技公司 Visa 和万事达卡(Mastercard )
阅读全文今天的文章是关于龙虾、孕妇和禁售芯片。难不成孕妇边吃龙虾边打游戏有助于宝宝发育?是不是很莫名其妙,这三个压根都不挨啊。不跟你开玩笑,今天看到了 Anthropic 官方发的一篇博客。这三个关键词都是博
阅读全文人工智能浪潮之巅,巨头布局落子如飞。最新消息曝光,OpenAI 正计划进行其史上最大手笔的收购——斥资约 30 亿美元(折合人民币约 217 亿元)拿下 AI 编程领域的当红新贵 Windsurf !
阅读全文最近有一个词非常火,叫做“AI 平权”“为什么要实现 AI 平权?”“AI 平权对普通人的意义是什么?”“怎么样才能实现 AI 平权”对于普通人来说想做自己的 app、小程序或者是网站在以前必须要找专
阅读全文家人们,不知道有没有人与我一样,在日常工作中已经全力倚仗 AI 工作了!难的、复杂的,我需要 AI 多帮帮我,简单的、容易的,那 AI 一定干的又快又好我也可以全权委托。表面上看(实际上也是)极大地提
阅读全文刚刚,Qwen3 开源了。强的离谱,DeepSeek 这次真的要坐不住了。先贴一张图。从这些主流的学术测试结果来看,Qwen3 全面超越了DeepSeek R1。注意我用的词——“全面”。这不只是在一
阅读全文最近在看 Agent 方向的论文和产品,已经被各种进展看花了眼。但我发现,真正能超越 demo,能在 B 端场景扎实落地的却寥寥无几。前两天跟阶跃的朋友聊起来,朋友说阶跃的多模态模型,已经在诸多智能终
阅读全文聊到中国的 AI 企业,大家可能会想到很多名字,而 2024 年中国 AI 行业的一大趋势是集体“出海”。但如果问,出海最成功的是哪家企业?海外收入最高的是哪家企业?答案可能会让不少人有些意外——昆仑
阅读全文好久没有露面的刘强东,最近跑去送了外卖,被人给抓拍到了:而且还和“兄弟”王兴一起自拍:前两天还在上演激烈的商战,突然大和解了么。。别误会,第二张照片是网友用 GPT-4o 生成的。不止如此,还有陈奕迅
阅读全文本文提出 LUFFY 强化学习方法,一种结合离线专家示范与在线强化学习的推理训练范式,打破了“模仿学习只学不练、强化学习只练不学”的传统壁垒。LUFFY 通过将高质量专家示范制定为一种离策略指引,并引
阅读全文家人们,OpenAI 又上新了!今天凌晨,OpenAI 宣布,已在 API 服务中正式推出 gpt-image-1 模型的调用,gpt-image-1 的开放将让开发者和企业能够直接集成 OpenAI
阅读全文ICLR 是专注于表征学习的人工智能领域顶级会议,由深度学习巨头 Bengio 和 LeCun 牵头举办,与 NeurIPS 、ICML 并称为机器学习三大顶会。今天,ICLR 大会官方发布了今年的
阅读全文最近,我撞见了一个 DeepSeek 又“认真”又“拧巴”的怪异场景。一切都从一个幼儿园级别的计数问题开始:"Strawberry" 中有几个字母'r'?面对这个问题,DeepSeek 展现了它的“深
阅读全文就在昨天,深耕语音、认知智能几十年的科大讯飞,发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1,而且我注意到一条官方发布的信息——基于全国产算力训练,在模型参数量比业界同
阅读全文为了提高多模态大语言模型(MLLMs)的性能,近期一些方法尝试通过基于图像的数学任务、图表分析任务以及逻辑谜题任务来激活纯推理能力,而另一些方法则专注于通过传统的检测任务(如目标检测、计数和分割)来提
阅读全文Fellou: 世界首个 Agentic Browser —— 超越浏览,直达行动 Beyond Browsing, Into Action每天,全球 30 亿用户被困在“点击-切换-填写”的循环中,
阅读全文今天凌晨,OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台,称 o3 的智能达到和接近天才水平。而且还有人说,OpenAI 这次又重回王座。当然,从官方放出来的榜单结果看,
阅读全文在今天凌晨的线上发布会上,OpenAI 一次推出两款全新模型 o3 与 o4‑mini ,并宣布它们立即向 ChatGPT Plus、Pro 与 Team 订阅者开放,引入了可直接“用图片思考”的多模
阅读全文家人们!最近奶茶发现一篇看起来非常有意思的论文!你们有没有想过,咱们的大脑一辈子到底能“装”下多少知识?最近,加州理工学院算出了人类学习的“终极天花板”——就算你是个卷王之王,24 小时不眠不休、过目
阅读全文我发现,AI 领域的竞争越来越多元化了。以前,大家往往比拼模型的参数规模、模型效果;后来,大家开始卷价格;就在今天,智谱 AI 这位老哥,突然开源了一个速度起飞的推理模型,直接把“速度”这张牌打成了王
阅读全文最近,谷歌不管是大模型,还是产品,上新的动作都有点频繁。。。昨天,他们又宣布把 Deep Research 背后调用的模型升级到了最强的 Gemini 2.5 Pro。Gemini 2.5 Pro,就
阅读全文大家假期休息了吗, 反正小扎的 Meta 是没有闲着。周六(4 月 5 日)发布了"羊驼"家族的全新版本 Llama 4 Scout 和 Llama 4 Maverick,以及两款未来会发布的 Lla
阅读全文尽管大型语言模型 在众多任务中展现出卓越的性能,但我们对其内部推理机制的理解仍然十分有限。Anthropic 研究团队提出:若我们无法深入了解 AI 如何 “得出结论” ,便难以有效评估其可靠性。为了
阅读全文加州大学圣地亚哥分校认知科学系最新的研究表明,OpenAI 的 GPT-4.5 在图灵测试中表现出色,让大量人类参与者误以为其为真人,73% 的时间被判定为人类——表现优于人类。大语言模型终于通过图灵
阅读全文