OpenAI谈:大模型为什么会有幻觉?如何避免?
嘿,大家好!这里是一个专注于前沿AI和智能体的频道~OpenAI上周发了一篇论文,重点聊了大家都挺感兴趣的话题:为什么大模型会有幻觉?评测缺陷举个例子:你现在参加一场考试,答对得1分,答错或不答都是0
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~OpenAI上周发了一篇论文,重点聊了大家都挺感兴趣的话题:为什么大模型会有幻觉?评测缺陷举个例子:你现在参加一场考试,答对得1分,答错或不答都是0
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~吴恩达昨天发了一篇长文。大谈AI就业生态。核心的观点是:市场正在残酷地淘汰两类人——只会氛围编程的AI新人和拒绝使用AI的老油条。我们正疯狂招聘,但
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~阿里的WebAgent最近又更新了一版,基本一个月一个版本~WebAgent是类似于DeepResearch之类(通用智能体)能力的一个通用智能体。
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~index.dev 最近发布了一份关于Agent的调研报告。2025年,AI Agent 正以非常快的速度重塑我们的工作生活方式。但很多团队对它们如
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~昨天,打开Postman,意外发现它多了一个MCP Generator的功能,拖一拖,点一点,就能构建起MCP Server了。今天给家人们简单分享
阅读全文这几天熬夜读完了一本爆火的书...AI大模型时代必读,《AI智能体实战》,已被Agent卷麻!它能做的实在太多了,能自动执行复杂任务,大幅提升自动化和智能决策的效率。不仅能感知环境变化,还能记忆、规划
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~周末美团开源了LongCat-Flash大模型。第一映像。 LongCat? 支持超长的输入?结果README告诉我,这只是为了音译 “龙”,中文名
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~腾讯优图实验室悄摸摸开源了 Youtu-agent, 在较复杂的的深度搜索和工具使用benchmark上表现不错,今天给家人们分享一下他的亮点。不依
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~张小珺采访了Kimi杨植麟,已经很久没见杨植麟出来了,分享了很多技术细节,包括他对各类技术的看法,看得出来,他这一年一直在专攻技术突破。腾讯这篇文章
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~不知道有多少家人们,用上Claude Code了。我用了很久很久,今天分享一些非常非常干货的实用技巧。应该能大幅提高生产力!为什么Claude Co
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~要让一个LLM成为顶尖行业专家,需要多长的Prompt?毕马威给出的答案是:100页。作为四大咨询巨头之一的毕马威,搞出来一个新闻。说他们打造了一款
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~这几天,英伟达的一篇论文非常火,标题很直接,小模型才是Agentic AI的未来~整个内容,主要是论证了为什么要考虑SLM?以及如何从LLM迁移成S
阅读全文大家好!这里是一个专注于前沿AI和智能体的频道~因为大模型天生的不确定性,所以,AI产品相比于传统产品,Demo vs 生产的稳定性会明显不同。很容易出现,Demo吊炸天,上线各种翻车的场面。今天给家
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今天有个大新闻, OpenAI 和 Google 这两大巨头,罕见地联手了,协同 Factory、Sourcegraph、Cursor 等一众厂商,
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~昨晚 DeepSeek 又没让人睡觉,延续了他们“微信群通知、深夜上传、不写模型卡”的经典操作,在 Hugging Face 上悄悄发布了 V3.1
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近,一篇万字综述 《A Survey on Agent Workflow》 有一点牛皮,作者们扒光了市面上超过20个主流的Agent框架,今天把要
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今天给家人们分享一下,2025 AI Agents的六大趋势、Multi-Agents的协作架构、Agent的自主L1 ~ L5等级 ~趋势一:De
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~字节又偷摸开源了,一个带记忆的Agent。 看起来不稀奇,但是这可能全球首个带终身记忆更新的全多模态智能体。这玩意儿的核心,是给Agent装上了一个
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~GPT5的提示词不出意外的,又被破解出来了。结合官方提供的《GPT-5 Prompting Guide》的内容,仔细琢磨了一下,有一些值得学习的地方
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~相信用过 Claude Code 的家人们,已经可以很明显的感受到,AI编程的L4级时刻可能真的来了!最近,我用Claude Code尝试了很多有趣
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~我们都默认,更强的AI应该更擅长利用工具。如果AI能自主开发工具,自主调用进化,这不就是AGI么?既然有这个问题, 我用 GPT-5 和 Claud
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近, 已经没有自媒体在吹MCP了。过去很长一段时间,所有人都知道,MCP作为 AI界的USB-C接口,主打一个简单易用,似乎只要是个工具,套上MC
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~昨晚,Sam炒作了一个月的GPT-5正式发布了!单纯卷参数和跑分的时代过去了,真正开箱即用的原生Agent时代,开始到来了。体验了一上午,先一句话概
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近有一篇特别特别火的博客,主要是聊AI应用的商业模式。 揭露了一个真相:我们对AI应用成本的理解,可能很有问题!几乎所有人都觉得,AI应用只要熬下
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~昨晚, OpenAI 时隔六年,终于再次开源,甩出两个大模型 gpt-oss-120b 和 gpt-oss-20b;而 Anthropic 也不甘示
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~过去几年,全球的AI在“Scaling law”的范式上走的很远:更大的模型、更多的数据、更强的算力。但这条路似乎正迎来瓶颈。前2天,普林斯顿大学联
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~上周,CAMEL-AI开源了Eigent,推广话术是 “全球首个桌面端多智能体生产力团队”。后脚,Manus火速上线了一个功能高度相似的“Wide
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~今天给家人们分享一些“真”Agent实操经验~你们有没有觉得,自己按照各种教程搭出来的的AI Agent总是有点智障?让它干点复杂任务,分分钟就把自
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~最近 CB Insights 披露了全球20家顶级AI Agent初创公司的收入数据,数字相当“变态”。当大家还在为大模型的参数、Token成本、融
阅读全文嘿,大家好!这里是一个专注于前沿AI和智能体的频道~OpenAI的产品负责人 Miquel 联合Piotr 发布了一份超全面的Context Engineering 深度指南 (原文付费,主要是图多,
阅读全文