全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    NotebookLM 是谷歌今年最能打的产品之一,9月的访问量快破亿了。 他的产品设计师 Jason Spielman 最近分享了产品从零到一的过程,有几个点挺有意思的,给大家分享一下。 NotebookLM最开始设计只想解决一个事情,在一个空间里完成从输入到输出的全流程。 过去,我们会打开很多的标签页,然后在切换到一个工具做笔记,又建立一个文档干点别的。来回切换,很恼火。 做好这个事情,其实不是很简单。 NotebookLM的成品是一个三面板结构:来源 + Chat + 输出。 背后经历了上千次的迭代。整个结构,会根据任务而随时调整。这是AI原生时代最不同的地方,界面要根据上下文主动调整,静态页面可能不够用了。 在读资料的时候,来源面板会放大。当写东西的时候,输出面板又会放大。而Chat面板始终在中间,连接输入和输出。 界面跟着人的思路走,而不是让你去适应界面。 最后,让它破圈的还是音频功能。基于自己的资料 + 一键生成 + 非屏幕时间消费。 听的时候可以随时插话提问。把被动的听变成了对话。 但是整个功能是后续才上的,Jason 的建议是,不要等产品完美再上线,尽早上线快速迭代。用户反馈比完美主义有用。 最后,从零设计 AI Native产品,不要停留在旧产品上加入口。这是 NotebookLM 和其他 AI 工具的本质区别。

    作者:探索AGI发布日期:2025-10-28 11:50:00

    NotebookLM 是谷歌今年最能打的产品之一,9月的访问量快破亿了。 他的产品设计师 Jason Spielman 最近分享了产品从零到一的过程,有几个点挺有意思的,给大家分享一下。 Note

    阅读全文
  • 文章封面

    Langchain 、 Manus 组了一个研讨会:Agent越智能,死得越快!

    作者:探索AGI发布日期:2025-10-27 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近,Langchain 的工程师 Lance Martin 和 Manus 的创始人Peak 季逸超 进行了一次关于Agent的研讨会,信息量有点

    阅读全文
  • 文章封面

    AI 没有带来上四休三,反而让硅谷卷到 996。 最近在Armin Ronacher的播客听到一些有意思的悖论:AI本应该让我们工作更少,但现实是我们比以往工作得更多了。 我在自己的工作模式中也观察到了同样的现象。这种工作量的增加并非是事情变多了,而是一种持续工作的心理强迫。 996起源于阿里,现在在硅谷发扬。他们的理由是要保持竞争力,在AI快速发展的今天,人有可以持续运行的工具,所以必须更努力才能跟上节奏。 回顾过去,从油灯到电灯,再到如今的大模型,技术进步确实改变了工作的本质。 灯让人们可以将工作干到深夜,随之而来的是一种微妙的转变,可以工作变成了应该工作。这就是进步的本质:新获得的奢侈品迅速变成必需品。 科技圈都再说,无限工具加无限杠杆等于无限潜能。 但这种心态很恐怖。过去,疲劳是休息的信号,而现在,疲劳成了软弱的标志。 我们成了自己的监工,从醒来到入睡都必须利用每一个可用时刻。 我们内化了无限潜能的说法,在追求自由的伪装下剥削自己。 这归根结底是一个关于文化的故事。工具本身不要求工作,是人、是系统在要求。机器不在乎你睡不睡觉。让我们彻夜难眠的,是我们自己讲述的关于生产力意味着什么的故事。 就像电灯延长了白天一样,AI正在延长工作时间。

    作者:探索AGI发布日期:2025-10-24 11:50:00

    AI 没有带来上四休三,反而让硅谷卷到 996。 最近在Armin Ronacher的播客听到一些有意思的悖论:AI本应该让我们工作更少,但现实是我们比以往工作得更多了。 我在自己的工作模式中

    阅读全文
  • 文章封面

    从DeepSeek OCR到AI炒股大赛,是时候停止对DeepSeek的猛吹了 Alpha Arena 最出圈大概是20号左右,那时候各种营销DeepSeek来自幻方,量化是基本功。 到今天,收益基本归0了,但是没人再说了。 首先如果真的看过这个榜,就知道这特么就是个赌博。 Prompt极其简单,一些数据都不对,比如DOGE的MACD全是0,只提供3分钟和4个小时的数据,MACD、RSI的指标很滞后。 做的越多错的越多,离谱的像Gemini基本是分钟级别交易,亏得差不多了,整体就是在赌AI模型的运势。 这2天又出来了,GPT反买,别墅靠大海,的说法。但是仔细看GPT的反思,即使在巨额亏损,仍清晰说自己为什么持仓,风险参数是什么,仓位逻辑是什么。 你能理解他为什么错,反而DeepSeek的持仓理由永远都是,计划未变,仓位不懂。(即使市场剧烈波动)。 在回到DeepSeek-OCR,也是被吹的很离谱,甚至很多人再说它还原的多精确。 如果从OCR角度来看,那确实不太对,它真的比不过专业的OCR模型精度,比如百度新出的。越复杂的文档的效果越差,甚至中文的效果明显比英文差。 DeepSeek OCR 说是通过视觉token压缩文本信息,比如将1万字的5000个token压缩到512个视觉token。 但是需要注意的是,解码精度很高,不代表,信息丢失的少。 就像你眯着眼睛看,内容断断续续的,能看清楚很多东西,但是可能不一定会比连续的summary好。 最后,叠个甲,我爱国产模型,但是在猛吹背后,也可以认真审视真正的价值与局限。

    作者:探索AGI发布日期:2025-10-23 11:50:00

    从DeepSeek OCR到AI炒股大赛,是时候停止对DeepSeek的猛吹了 Alpha Arena 最出圈大概是20号左右,那时候各种营销DeepSeek来自幻方,量化是基本功。 到今天,收

    阅读全文
  • 文章封面

    2025年10月21日,OpenAI、Google、Anthropic 相互狙击,同一天发布了三款产品。 Google致力于广度(让所有人都能创造),OpenAI致力于深度(融入所有生活场景),Anthropic选择了精度。 最终还是Google的股价以微跌买单。 OpenAI推出自己的AI 浏览器 - Altas,目前仅限于macOS, 所有用户均可下载,但是Agent模式面向付费用户。 交互上有点抄袭似Dia,还做了个骚操作,迁移Chrome数据,送7天会员~ Google的AI Studio大更新,宣传是轻松100倍构建应用,但是大家万众期待的Gemini 3 呢? 它解决的是AI想法如何快速变成现实的问题。 新界面可以通过模型选择器、功能模块等,让构建应用像搭积木一样容易,最重要的是可以一键部署,快速迭代。 愿景是一个由Gemini驱动的AI应用网络,年底前建成一百万个应用。 Claude Code(网页版)推出,一个基于云的AI编程工具,可在浏览器中直接执行代码任务。 目前仅面向Pro和Max付费用户的研究预览版,每个任务都在隔离环境中运行,可以联通GitHub, 支持移动端,随时随地可编程。 可以看出来现在巨头们在竞争的 AI 三大基本盘,交互、创造和专业执行。

    作者:探索AGI发布日期:2025-10-22 11:50:00

    2025年10月21日,OpenAI、Google、Anthropic 相互狙击,同一天发布了三款产品。 Google致力于广度(让所有人都能创造),OpenAI致力于深度(融入所有生活场景),An

    阅读全文
  • 文章封面

    前2天,Anthropic 又出了一期《Build more effective agents》的播客。 Multi-Agent 研究工程师 Erik Schluntz 分享了他们在构建高效 AI Agent 方面最新的思考和实践,系统讲述从 「工作流」 -> 「单一 Agent」 -> 「Agent 工作流」 -> 「多智能体系统」的演变过程,还给出了大量一线实践指南。 地址在:https://www.youtube.com/watch?v=uhJJgc-0iTQ Q: 为什么 Claude 擅长执行复杂的智能体任务? 在训练的时候,Claude 就被赋予大量开放式、多步骤的长期任务,允许模型探索环境,通过强化学习,不断练习。 并且,Claude将,编程作为核心能力,结果是一个顶级的编码智能体,几乎可以胜任任何其他工作。 Q: Claude Skill 解决了什么痛点? claude.md 文件对于 Claude 而言,像是一个操作手册;Skill 就是给了模型一个完整的工具箱和资料库。 Q: 智能体的架构模式是如何演变的? 从 串联提示 演变为鲁棒的 串联智能体循环。 过去,将多个Prompt像流水线一样串联起来。 Step 1 -> Step 2 -> Step 3。 任何步骤失败,整个流程会崩溃。 现在,工作流中的每一步,都是一个独立的、闭环的智能体循环。在进入下一步之前,当前步骤的智能体会不断尝试、验证、修正,直到产出正确结果,再将成品传递给下一步。 Q: 常见陷阱与最佳实践 过度设计,第一天就试图构建一个复杂的多智能体系统。导致效率低下、难以调试和维护。这是最常见的一个问题。 一定要从简单开始,只在绝对必要时,才增加复杂性。 其次,工具设计应面向UI,而非API。模型是工具的用户,工具的设计应追求一次交互,信息完备的最佳用户体验。 Q: 未来 6-12 个月,我们将看到什么? 1. 自我验证与闭环测试 智能体将能利用Computer Use能力,自行验证工作成果。 2. Computer Use能力普及化 Claude 将能直接在你使用的任何软件中工作,打破复制粘贴的壁垒。

    作者:探索AGI发布日期:2025-10-21 11:50:00

    前2天,Anthropic 又出了一期《Build more effective agents》的播客。 Multi-Agent 研究工程师 Erik Schluntz 分享了他们在构建高效 AI

    阅读全文
  • 文章封面

    Claude Skills到底是什么?和MCP、RAG、FunctionCaling的本质区别是? 一个暴论:AI Agent的未来,一半靠模型,另一半靠工程。 A社这次不止增加了这个概念,还开源了一个仓库,https://github.com/anthropics/skills,里面包含了所有20个左右的官方Skill的源码示例,这才是真正的灵魂。 一个Skill = 任务说明书 SKILL.md + 工具代码 (scripts) + 专业知识 (references) + 素材资源 (assets)。 它把完成一个特定任务所需的一切都打包好了,本质上就是一种代码和资源的组织方式,一种约定优于配置的理念。 精髓是:为上下文窗口减负这部分是Claude Skills设计的精髓,也是它和简单RAG/MCP/FunctionCalling的最大区别。它就是一套精心设计,为了节省上下文窗口而设计的分层加载策略。 Claude Skills与MCP的关系,它俩不是替代关系,而是正交的、可以组合的。MCP负责连接,Skills负责驱动。一个解决通信标准,一个解决能力封装。 这套东西,有什么用?既然这玩意儿本质上就是一堆文件夹和代码,我们能从中得到什么?最大的价值是:Anthropic把他们在生产环境中打磨出的一套Agent能力管理的设计模式开源了。我们完全可以把这个模式借鉴过来,用在自己的Agent体系里,不管你用的是Qwen、Deepseek,还是别的模型。 当你的Agent能力越来越多时,怎么管理?一个几千行的System Prompt?一个包含几十个工具函数的大杂烩文件?这些都很难维护。 而Skills提供了一种解耦的、模块化的方案。你团队里的Agent不再是依赖一个巨大的、难以维护的system_prompt.txt,而是一个由几十个标准化的Skill文件夹组成的能力库,每个Skill都可以独立版本控制、测试和迭代。 所以说呀,Claude Skills本身不是什么黑科技。它最大的启示还是:AI Agent的未来,一半靠模型,另一半靠工程。

    作者:探索AGI发布日期:2025-10-20 11:50:00

    Claude Skills到底是什么?和MCP、RAG、FunctionCaling的本质区别是? 一个暴论:AI Agent的未来,一半靠模型,另一半靠工程。 A社这次不止增加了这个概念,还开源

    阅读全文
  • 文章封面

    超100家YC疯抢的 FDE 模式,正成为AI Agent的 PMF 范式!

    作者:探索AGI发布日期:2025-10-17 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近硅谷在发生一件很有意思的事:很多的VC都在招聘一个叫 FDE(Forward Deployed Engineer)的岗位。这是一个诞生于情报部门

    阅读全文
  • 文章封面

    Google开源了一个能操作电脑的智能体

    作者:探索AGI发布日期:2025-10-16 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~前两天,谷歌悄咪咪开源了一个叫 computer-use-preview 的项目。可以让AI直接操控你电脑的Agent框架, 对标broswer_u

    阅读全文
  • 文章封面

    硅谷顶级团队闭门会,让Agent活下来的共识,95%的AI Agent都死了

    作者:探索AGI发布日期:2025-10-15 11:53:06

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这周,旧金山一场600多人参加的AI技术大会上,Uber、WisdomAI、EvenUp... 等企业的大佬们,畅谈AI。一个核心的insight是

    阅读全文
  • 文章封面

    谷歌揭秘:Multi-Agent 推理时扩展才是未来。

    作者:探索AGI发布日期:2025-10-14 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~谷歌 DeepMind 和 MIT 联合发了一篇论文,名叫 TUMIX(Tool-Use Mixture)。大概就是说,Multi-Agent 才是

    阅读全文
  • 文章封面

    Chrome已死,AI浏览器当立!认知革命比技术成熟来得更快。

    作者:探索AGI发布日期:2025-10-13 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~过去分享了好几篇AI浏览器相关的,围绕为啥那么Agent需要AI浏览器,Agent Infra。Chrome过时了,AI Agent需要自己的浏览器

    阅读全文
  • 文章封面

    2025年,AI Agent注定失败?!

    作者:探索AGI发布日期:2025-10-11 11:50:00

    前几天刷到条有意思的视频,“AI智能体在2025年注定失败?”看完才发现,还真不是危言耸听。CMU最新研究显示,即便是Claude Sonnet 3.5这类顶尖模型驱动的智能体,在真实任务中的完成率也

    阅读全文
  • 文章封面

    Google封神,计算机视觉的GPT3时刻来了!

    作者:探索AGI发布日期:2025-10-11 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~在ChatGPT(或者GPT3)之前,我们要给翻译、摘要、问答训练各种Bert、Seq2Seq模型。GPT-3 出来后,用一个统一的模型通过Prom

    阅读全文
  • 文章封面

    Anthropic:怎么才能控制模型的行为,做好Agents?

    作者:探索AGI发布日期:2025-10-10 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~Anthropic 最近又发了一篇关于 AI Agents 的博客,过去几个月已经连续好几篇了。我觉得他们关于Agents的内容整体都挺好的,写的也

    阅读全文
  • 文章封面

    国庆假期AI圈彻底打疯了,谷歌Gemini 3.0 Pro泄露,血战Claude 4.5!

    作者:探索AGI发布日期:2025-10-09 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~国庆各种新闻满天飞,大佬们都不过节的。。。今天快速梳理了一下所有的新闻,给家人们补补课。Anthropic、OpenAI、Google假期前后,御三

    阅读全文
  • 文章封面

    Anthropic又推出了一个新Agent~

    作者:探索AGI发布日期:2025-09-29 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~Anthropic 又悄悄地给 Claude 塞进了一个新功能 —— Imagine。这可能是他们面向软件开发未来形态的探索,让AI实时生成可交互的

    阅读全文
  • 文章封面

    Claude Code + Kimi,3个小时,净省¥199 !

    作者:探索AGI发布日期:2025-09-28 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~我戒掉了一款用了2年的付费软件。就是那个能把 Markdown 排版后无损复制到公众号的 mdnice。倒不是因为它不好用,而是因为我只用了一个下午

    阅读全文
  • 文章封面

    Agent能自己“复盘”和“进化”,这个开源框架牛了!

    作者:探索AGI发布日期:2025-09-26 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~昨天分享 Agent Infra,一个好的 Infra 已经可以让Agent自动进化了。然后,我去搜索了一下相关的开源框架,然后还真找到了一个。 仔

    阅读全文
  • 文章封面

    阿里AgentBay揭秘,Agent Infra才是真护城河!

    作者:探索AGI发布日期:2025-09-25 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~过去半年,几乎10个创业者有8个在做各种各样的Agent,但是Agent Infra绝对是被大多数人忽视的一个板块。月初,给家人们以 AutoGLM

    阅读全文
  • 文章封面

    云栖大会阿里掀桌子了!Qwen3-Max、VL、Omini、Agent ... 统统发布!

    作者:探索AGI发布日期:2025-09-24 14:00:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~人在云栖大会,一上来,阿里云智能首席技术官周靖人就介绍了 千问多款新模型发布,一款模型升级。今天给家人们分享一下,阿里今天发布&开源的那些大模型全家

    阅读全文
  • 文章封面

    OpenAI 万字报告: 不要再卷Agent了~

    作者:探索AGI发布日期:2025-09-23 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~周末,终于刷完了,OpenAI的《How People Use ChatGPT》。很多数据,比较违背大多数人惯性思维,今天从不同的角度,给大家分享一

    阅读全文
  • 文章封面

    谷歌开源新Deep Research范式,教Agent学会真正的思考。

    作者:探索AGI发布日期:2025-09-22 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~周末,谷歌发了一个博客,讲Deep Research 的。 重新定义过去的一些Agent常见范式,全是技巧,很值得一看。现在的AI Agent,能力

    阅读全文
  • 文章封面

    Chrome已死,Agent当立。 AI Chrome正式发布~

    作者:探索AGI发布日期:2025-09-19 14:13:36

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今天,谷歌正式官宣,为Chrome浏览器全面植入Gemini AI,一口气发布了10项更新。今天想跟大家聊一下,谷歌这次拿出了什么?以及当Chrom

    阅读全文
  • 文章封面

    Shopify分享了他们做Agent的万字踩坑经验

    作者:探索AGI发布日期:2025-09-18 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近,Shopify 分享了他们构建生产级 AI 助手 Sidekick 的万字长文,信息量爆炸。很值得一看。最早他们类似 Anthropic 总结

    阅读全文
  • 文章封面

    AI Agent的淘宝来了,120行代码,3天赚了1200刀。

    作者:探索AGI发布日期:2025-09-16 20:47:26

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~家人们,别再卷大模型了,真正傻白甜的赛道是——让AI替你打工,还给你交租!我抱着薅羊毛的心态把一段只有120行的n8n工作流扔进了一个名不见经传的新

    阅读全文
  • 文章封面

    Agent又笨又傻?Anthropic官方揭秘:你要这样做!

    作者:探索AGI发布日期:2025-09-15 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~前2天,Anthropic发了一篇比较干的长文博客。谈了一套Agent工具构建与优化的方法。如果,你也遇到过,给Agent辛辛苦苦构建一堆工具,结果

    阅读全文
  • 文章封面

    一文看懂Agent下半场, Agent Infra 成为新的护城河!

    作者:探索AGI发布日期:2025-09-12 12:00:20

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~前阵子,智谱AutoGLM还是挺刷屏的,它的核心理念是,给每个人配一个云端分身,7x24小时的帮大家干活~今天想给家人们详细挖掘一下Agent In

    阅读全文
  • 文章封面

    让Agents更聪明,3招搞定记忆管理~

    作者:探索AGI发布日期:2025-09-09 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~关于Agent的记忆,大多数人印象中,后台可能就是一个RAG罢了。但是到底有哪些细节和值得注意的地方呢? 今天深度分析一个还不错的开源项目,探索关于

    阅读全文
  • 文章封面

    OpenAI谈:大模型为什么会有幻觉?如何避免?

    作者:探索AGI发布日期:2025-09-08 11:50:00

    嘿,大家好!这里是一个专注于前沿AI和智能体的频道~OpenAI上周发了一篇论文,重点聊了大家都挺感兴趣的话题:为什么大模型会有幻觉?评测缺陷举个例子:你现在参加一场考试,答对得1分,答错或不答都是0

    阅读全文
下一页