Qwen3满血版上线,第一件事就是把搜索按钮干掉了。
Qwen3-max满血版终于发布了!我打开chat.qwen.ai,准备玩一下新模型,一眼看到搜索按钮不见了。我第一反应:这是Bug吧?结果查了下,这是他们故意删的,因为模型能力已经不需要了。说实话,
阅读全文Qwen3-max满血版终于发布了!我打开chat.qwen.ai,准备玩一下新模型,一眼看到搜索按钮不见了。我第一反应:这是Bug吧?结果查了下,这是他们故意删的,因为模型能力已经不需要了。说实话,
阅读全文Kimi K2.5今天下午发布并开源了,万众期待的多模态能力终于来了。我录了一段15秒的屏幕操作视频。视频是一个很酷的博客网站 https://flo-bit.dev/,我随便点了点。然后我把这段操作
阅读全文2026年了,Anthropic终于想通了。Claude Code 的命令行界面只适用于很多极客用户,上周推出了桌面版cowork。但是其实还有个很重要的插件,可能被大多数人错过了。他们同时还推出了V
阅读全文Skills这玩意儿,现在是真的太多了。我刚刚在看了一眼,号称全网最全的Skills聚合平台,SkillsMP,已经8万多个skills了。Skills很强,但是到底哪些Skills好用呢? 然后这张
阅读全文Agent的沙箱(sandbox)大乱斗, Anthropic、Google、字节... 方案有什么区别? 给Agent一个隔离环境,太重要了,想必大家用国产模型接cc,肯定遇到过 rm -rf 当
阅读全文这2天是不是密集且雷同的被一些新闻轰炸了。比如:2天复刻anthropic的cowork。用几百个智能体并发,2周从0写一个浏览器。long running下 researcher是会最先被替代的。.
阅读全文Browser Use表示最近要发布他们的manus : BU.app,但他们提前把驱动BU的Agent内核开源了。它的核心设计理念,简单到近乎是一种嘲讽。作者Gregor Zunic直接在x上骑脸输
阅读全文Anthropic 又有钱了。今天新闻估值3500亿,融超250亿。周末他们组了个局,拉了几个哈佛、伯克利的学生,聊了一个很现实的话题: 在这个啥都可以AI一键生成的时代,我们到底还在学什么呢?看完全
阅读全文用数百Agent并发,连续跑数周,耗费数万亿token,我们能收获什么? Cursor做了一个很有意思的实验,做了个让很多Agent并发工作很长时间,分享了他们发现的经验。 最开始,尝试用一个去中
阅读全文前两天,看到个大新闻。Google宣布Gemini将联手沃尔玛,搞了个大动作,用户可以通过对话,让AI帮你买东西,最后用Google Pay支付。然后X都在说,这是AI Agent的落地时刻。但,我只
阅读全文动态上下文,最近一个月这个词出现的越来越频繁。过去,我们追求long context,128k,1M 2M。所有的RAG、Memory系统,都在往Prompt塞更多的东西。Cursor分享了一篇博客,
阅读全文早上,苹果Google官宣的新闻刷频了。下一代苹果基础模型,将直接基于Gemini构建。初代iphone发布,是17年前,Google也是苹果的盟友,提供地图,youtube。17年后,当Apple
阅读全文Google最近这篇论文有点火。一个很简单的提升大模型准确率的方法。 这么多年了,竟然没人发论文。非常离谱,就是重复提示词。 中文来说,就是 重要的话,说三遍。从 <Query> -> <Query>
阅读全文Anthropic万字长文,把很多Agent没法落地的真正原因说明白了。 他们分享了内部踩坑无数后,总结的一套Eval方法论,讲透了4件事情。 所有的Agent系统,在交付之前,一定要把Eval体
阅读全文最近被CC刷频了,Vibe Coding,Skills太强了。CC刷频了,Vibe Coding太强了。先说个暴论:不懂代码的人,才最喜欢 Vibe Coding。LinkedIn 上出现了一个新的职
阅读全文30B的小模型,竟然在重量级Agent benchmark上,干翻了万亿参数的Kimi K2T?早上刷到 MiroThinker v1.5 开源的消息,参数规模的神话喊了这么久,难道行业共识正在被悄然
阅读全文A社的新年小课堂开课了。工程师 Thariq Shihipar ,提出了一个主要观点。最强大的 Agent 工具,不是无数个定制的 API,而是 Bash 和文件系统。基于Unix思想构建Agent的
阅读全文Google Cloud刚发布了2026年的Agent趋势报告,有49页PDF。他们认为与其谈什么时候AGI,其实可以看一下,能改变业务的转折点已经在发生了,它就是Agentic AI。报告总结了26
阅读全文opencode也火了~主要是因为这个开源插件,真的太强了~https://github.com/code-yeongyu/oh-my-opencode/tree/devopencode是一个开源的C
阅读全文最近发现个很有意思的Agent Memory项目-Hindsight,主要是性能很强~开源上有很多Memory项目,Memo0、langmem...,但是一开始吸引我的,是Hindsight有个很有意
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~Claude Skills在中文社区彻底火了(仅中文社区)。Anthropic 10月底推出这个功能,12月底爆发。原因很具体,它解决了一个很真实的
阅读全文2025:在参差不齐的智力中,重塑世界 最近很多大佬的年度总结都出来了,比如 karpahty ... ,结合最近的思考,基本都是围绕几个关键变化。 karpathy 说, 我们不是在培养一个持续
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这段时间,除了Gemini外,飞书多维表格的这个AI功能,已经成为我做内容最高频使用的工具了。👉 模板链接:https://xurl.run/Ze9
阅读全文170+次搜索,50次反思,100多家企业的详细信息。这是昨天晚上,我给智谱新开源的GLM-4.7布置的一个任务,深度调研过去一年Agent哪些行业/企业赚到钱了(通过融资来筛选),第二天,它给我的答
阅读全文今年3月,Manus刷屏了。全球首款通用AI智能体,能自己上网、自己写代码、自己交付完整任务。当时所有人都在说,Agent元年来了,通用智能体要颠覆一切。但是25年要过去了,大家发现没有?聊通用智能体
阅读全文智谱、MiniMax 都在IPO,争夺 全球大模型第一股,你们怎么看? 再不上市,就来不及了, “六小虎”的故事,正在变成“美腾米字巴”。 六小虎已经变成流浪猫。 > 内容转载@Trisim
阅读全文看到网友说:“AI智能体在2025年注定失败?”好像还真不是危言耸听。CMU最新研究显示,即便是Claude Sonnet 3.5这类顶尖模型驱动的智能体,在真实任务中的完成率也仅24%,长对话的To
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今年3月份的时候,晚点对数字生命卡兹克做了一期访谈。卡神说自己做内容,80%的时间不是在写,是在找选题。为了提高效率,他开发了一套自动化系统,每天抓
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~元旦了,Langchain的年末总结来了,调研了1000多位一线人士。结论很简单:Agent已经过了炒概念的阶段,大家在意的不是要不要做,而是怎么做
阅读全文