25年用智能体发顶会可太容易了!
看到网友说:“AI智能体在2025年注定失败?”好像还真不是危言耸听。CMU最新研究显示,即便是Claude Sonnet 3.5这类顶尖模型驱动的智能体,在真实任务中的完成率也仅24%,长对话的To
阅读全文看到网友说:“AI智能体在2025年注定失败?”好像还真不是危言耸听。CMU最新研究显示,即便是Claude Sonnet 3.5这类顶尖模型驱动的智能体,在真实任务中的完成率也仅24%,长对话的To
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今年3月份的时候,晚点对数字生命卡兹克做了一期访谈。卡神说自己做内容,80%的时间不是在写,是在找选题。为了提高效率,他开发了一套自动化系统,每天抓
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~元旦了,Langchain的年末总结来了,调研了1000多位一线人士。结论很简单:Agent已经过了炒概念的阶段,大家在意的不是要不要做,而是怎么做
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~早上起来刷到一个新闻,瞬间懵了~国内最大AI数字员工公司冲刺IPO!年入2.4亿,要做企业Agent第一股。数字员工这个词,在国内特别的火,甚至我之
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~有个很有意思的AI产品,朱啸虎投了,种子轮数百万美金,高瓴也跟了。上周似乎投了一大波流?很多自媒体都在发体验,我上半年就玩过了,体验还不错,还是开源
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~上周是智谱的多模态开源周,从GLM 4.6v到Autoglm...看到官方的博客,第一眼比较吸引我的,不是模型本身,是他们给的一个使用场景 - 图文
阅读全文我逆向了ChatGPT的Memory系统,发现它比想象中简单太多了 ChatGPT的Memory多好用不多说了,昨天,有个国外的老哥逆向了一波,发现了它由4层架构构成。 没有向量数据库,没有对历史
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今天,彭博社爆料,Meta将在明年春季发布牛油果大模型。并且这个闭源模型,是从开源模型中蒸馏来的,其中就包含了千问模型。我们可以很清晰的看到,一个新
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~Anthropic 分享了一些最新的insight。一个暴论:别再造 Agent 了,开始造 Skills 吧。早期的时候,他们发现,不同领域的 A
阅读全文智谱AutoGLM开源了,但手机Agent的真正战场才刚开始。 他们的GUI Agent,是怎么应对豆包手机被各大APP封杀的问题呢? 首先,值得说的是,他们开源的是完整解决方案,模型MIT协议,
阅读全文苹果年度APP出炉。 整体AI味儿有点浓。 不是为了AI而AI,用AI解决了一个具体的、真实的问题成了年度标配。 iPhone年度应用Tiimo,一个给ADHD人群用的AI规划工具。 【ADHD
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~之前咱们分享过,Gartner预测,到2027年底,超过40%的Agentic AI项目将被取消。为什么很多在Demo阶段表现很惊艳,到企业实践里就
阅读全文AI Agent在国内,可能真的不存在。 IT之家今天发了个有意思的资讯,豆包和中兴搞了个联名工程机,结果刚登微信,喜提账号冻结提醒。 https://www.ithome.com/0/902/0
阅读全文Anthropic收购了Bun,Agent 时代,基础设施才是真正的护城河 Bun是一个零收入,720万月下载量,还有4年runway的开源项目。 Claude Code用的就是Bun的单文件可执
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~DeepSeek 昨晚更新并开源了 V3.2 正式版,同时带来了长思考增强版 V3.2-Speciale。这次更新最大的亮点在于 Agent 能力的
阅读全文为什么所有Memory项目都说自己是SOTA? 如何让AI记住过去,从而理解未来? Memory System 似乎变成了一个新的爆发赛道。 最近有很多项目在横评这些系统,今天简单点评梳理一下。
阅读全文前几天刷到条有意思的视频,“AI智能体在2025年注定失败?”看完才发现,还真不是危言耸听。CMU最新研究显示,即便是Claude Sonnet 3.5这类顶尖模型驱动的智能体,在真实任务中的完成率也
阅读全文Anthropic又承认了,跨上下文窗口工作,Agent还是个弟弟。 Agent做复杂任务,一个对话窗口搞不定怎么办? Anthropic又提供了一个解决方案~ 目前常见有2种翻车姿势,第一种是贪
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~llya Sutskever 终于露面了,而且是一场 90 多分钟的深度访谈!达瓦卡什太牛逼了,今年采访到了Rich Sutton,Karpathy
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这几天 Nano Banana Pro太刷屏了。模型即产品已经成了大多数人的共识。但是,其实想让模型做好一个垂域场景,SOTA模型其实只是一个半成品
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这几天,蚂蚁的灵光真是杀疯了,作为行业首个全模态助手。用了灵光一现,这个名字,真的很妙,离普通人真的非常的近。市场对这个新概念非常买单,上线24小时
阅读全文Nano Banana Pro 好玩。 这几天,奥特曼的日子可能不太好过,专业角度客观分析一下Gemini3 和 Nano Banana Pro。 先说 Nano Banana Pro 把,生成的
阅读全文前几天刷到条有意思的视频,“AI智能体在2025年注定失败?”看完才发现,还真不是危言耸听。CMU最新研究显示,即便是Claude Sonnet 3.5这类顶尖模型驱动的智能体,在真实任务中的完成率也
阅读全文似乎Agent有了一个新范式? 上半年,Manus拉起了一个Todolist的风潮。 但是上周我测试的K2T ,包括这2天有点热闹的开源模型MiroThinker v1.0,他们都有一个新的共性。
阅读全文Agent,源神启动~ 字节整了个原神Agent,Google也发了个游戏Agent SIMA 2。 好像很牛,所以仔细瞧了瞧,到底是如何做到让Agent自己玩游戏的呢? 核心设计好像就再3点
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~前几天,openai发了一个关于 self-evolve 自进化 智能体怎么做的博客。核心思路其实很简单,分三步,代码也开源了。Agent跑任务,输
阅读全文Google、OpenAI 在 谁更像人 上边杠上了 GPT-5.1 发布, Google 马上给Gemini Live 整了波大更新。 他们都在做更拟人。 OpenAI 加了个全新的对话风格设
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近Lovart上线了个功能,名字朴实无华,Layered Image Editing ,中文叫编辑元素?我们很少分享多模态相关的内容,但是这个功能
阅读全文