Qwen3 终于来了!全面超越 DeepSeek R1,原生支持 MCP
刚刚,Qwen3 开源了。强的离谱,DeepSeek 这次真的要坐不住了。先贴一张图。从这些主流的学术测试结果来看,Qwen3 全面超越了DeepSeek R1。注意我用的词——“全面”。这不只是在一
阅读全文刚刚,Qwen3 开源了。强的离谱,DeepSeek 这次真的要坐不住了。先贴一张图。从这些主流的学术测试结果来看,Qwen3 全面超越了DeepSeek R1。注意我用的词——“全面”。这不只是在一
阅读全文最近在看 Agent 方向的论文和产品,已经被各种进展看花了眼。但我发现,真正能超越 demo,能在 B 端场景扎实落地的却寥寥无几。前两天跟阶跃的朋友聊起来,朋友说阶跃的多模态模型,已经在诸多智能终
阅读全文聊到中国的 AI 企业,大家可能会想到很多名字,而 2024 年中国 AI 行业的一大趋势是集体“出海”。但如果问,出海最成功的是哪家企业?海外收入最高的是哪家企业?答案可能会让不少人有些意外——昆仑
阅读全文好久没有露面的刘强东,最近跑去送了外卖,被人给抓拍到了:而且还和“兄弟”王兴一起自拍:前两天还在上演激烈的商战,突然大和解了么。。别误会,第二张照片是网友用 GPT-4o 生成的。不止如此,还有陈奕迅
阅读全文本文提出 LUFFY 强化学习方法,一种结合离线专家示范与在线强化学习的推理训练范式,打破了“模仿学习只学不练、强化学习只练不学”的传统壁垒。LUFFY 通过将高质量专家示范制定为一种离策略指引,并引
阅读全文家人们,OpenAI 又上新了!今天凌晨,OpenAI 宣布,已在 API 服务中正式推出 gpt-image-1 模型的调用,gpt-image-1 的开放将让开发者和企业能够直接集成 OpenAI
阅读全文ICLR 是专注于表征学习的人工智能领域顶级会议,由深度学习巨头 Bengio 和 LeCun 牵头举办,与 NeurIPS 、ICML 并称为机器学习三大顶会。今天,ICLR 大会官方发布了今年的
阅读全文最近,我撞见了一个 DeepSeek 又“认真”又“拧巴”的怪异场景。一切都从一个幼儿园级别的计数问题开始:"Strawberry" 中有几个字母'r'?面对这个问题,DeepSeek 展现了它的“深
阅读全文就在昨天,深耕语音、认知智能几十年的科大讯飞,发布了全新升级的讯飞星火推理模型 X1。不仅效果上比肩 DeepSeek-R1,而且我注意到一条官方发布的信息——基于全国产算力训练,在模型参数量比业界同
阅读全文为了提高多模态大语言模型(MLLMs)的性能,近期一些方法尝试通过基于图像的数学任务、图表分析任务以及逻辑谜题任务来激活纯推理能力,而另一些方法则专注于通过传统的检测任务(如目标检测、计数和分割)来提
阅读全文Fellou: 世界首个 Agentic Browser —— 超越浏览,直达行动 Beyond Browsing, Into Action每天,全球 30 亿用户被困在“点击-切换-填写”的循环中,
阅读全文今天凌晨,OpenAI 发布了 o3 满血版和 o4‑mini。奥特曼亲自为新模型站台,称 o3 的智能达到和接近天才水平。而且还有人说,OpenAI 这次又重回王座。当然,从官方放出来的榜单结果看,
阅读全文在今天凌晨的线上发布会上,OpenAI 一次推出两款全新模型 o3 与 o4‑mini ,并宣布它们立即向 ChatGPT Plus、Pro 与 Team 订阅者开放,引入了可直接“用图片思考”的多模
阅读全文家人们!最近奶茶发现一篇看起来非常有意思的论文!你们有没有想过,咱们的大脑一辈子到底能“装”下多少知识?最近,加州理工学院算出了人类学习的“终极天花板”——就算你是个卷王之王,24 小时不眠不休、过目
阅读全文我发现,AI 领域的竞争越来越多元化了。以前,大家往往比拼模型的参数规模、模型效果;后来,大家开始卷价格;就在今天,智谱 AI 这位老哥,突然开源了一个速度起飞的推理模型,直接把“速度”这张牌打成了王
阅读全文最近,谷歌不管是大模型,还是产品,上新的动作都有点频繁。。。昨天,他们又宣布把 Deep Research 背后调用的模型升级到了最强的 Gemini 2.5 Pro。Gemini 2.5 Pro,就
阅读全文大家假期休息了吗, 反正小扎的 Meta 是没有闲着。周六(4 月 5 日)发布了"羊驼"家族的全新版本 Llama 4 Scout 和 Llama 4 Maverick,以及两款未来会发布的 Lla
阅读全文尽管大型语言模型 在众多任务中展现出卓越的性能,但我们对其内部推理机制的理解仍然十分有限。Anthropic 研究团队提出:若我们无法深入了解 AI 如何 “得出结论” ,便难以有效评估其可靠性。为了
阅读全文加州大学圣地亚哥分校认知科学系最新的研究表明,OpenAI 的 GPT-4.5 在图灵测试中表现出色,让大量人类参与者误以为其为真人,73% 的时间被判定为人类——表现优于人类。大语言模型终于通过图灵
阅读全文这两年,大家的目光几乎被“大模型”三个字牢牢吸住了,谁超越了谁、榜单排名第一,少有人关注模型之外的东西。直到 Deepseek 用非常低的成本训练出能和 OpenAI 媲美的模型,这一下子“打醒”了很
阅读全文大家好,我是小瑶,今天是你们的 AI 前排吃瓜 + 技术解读博主。昨天人在百度科技园,参加了百度 AI DAY 活动,不仅吃到了「文小言」的一手大瓜,还非常荣幸的采访到了语音技术大牛——百度语音首席架
阅读全文大家好,我是小瑶,你们的 AI 前排吃瓜 + 深度解读博主,今天人在中关村论坛——还记得之前眼馋 OpenAI 那个死贵死贵的 Deep Research 吗?一个月 200 美刀,还得翻山越岭才能用
阅读全文这周谷歌 Gemini 2.5 Pro 和 Deepseek V3-0324 相继发布,成为了这两天讨论最多的两个模型。但是,这俩模型发布的风格却迥然不同。Gemini 2.5 Pro ,以一种“屠榜
阅读全文这两年,AI 领域最激动人心的进展莫过于大型语言模型(LLM)的崛起,LLM 展现了惊人的理解和生成能力。在此基础上,一个更宏伟的构想应运而生:构建多智能体系统(Multi-Agent System,
阅读全文昨天,DeepSeek 在毫无预告的情况下,悄悄上线了 DeepSeek-V3-0324——看似“小版本更新”的模型,经过一天的发酵,已经引发了一波地震。但我没想到的是,就在刚刚,发生了一波真的地震—
阅读全文AI 圈的“顶流”Andrej Karpathy 在 X 上发了一条动态,彻底炸了锅。这位前特斯拉 AI 负责人、OpenAI 联合创始人,用一贯的轻松语气提出一个新概念:“有一种新的编程方式我称之为
阅读全文今天,笔者受邀来到了百度科技园,参加百度 AI 开放日活动——这次主角是“秒哒”。Manus 一码难求和复现热潮还没过,没想到,百度秒哒来踢馆了!而且宣布,这次是正式全量上线。去年 11 月在百度世界
阅读全文最近在推特上刷到一条视频,特别火爆,彻底把我看呆了。请看视频效果——Prompt: 在 blender 中创建一个龙站在一堆金币旁边的场景。确保照明活泼有趣,整体效果精致。使用适当的材质,使最终渲染效
阅读全文最近刷信息流的时候,被一个东西笑喷了——“母猪产后护理难,问腾讯元宝”没错,就是那个腾讯的 AI 产品——元宝。。。它的广告就这么直白地刷在农村的墙上,还是这么接地气儿的标语。好家伙,以后养猪都不用叫
阅读全文等了好久,谷歌终于开放了 Gemini 2.0 的原生绘图能力。其实,Gemini 2.0 系列模型早在2024 年 12 月 就正式发布了,是谷歌首次支持原生多模态输出的版本(文本、图像、音频),但
阅读全文