综述|智能体为何在复杂任务中“失忆”?中科大团队提出全新情境认知视角:智能源于对“情境”的动态管理
你是否曾遇到过这样的场景:一个能够熟练使用工具、拥有长期记忆的大语言模型智能体,在面对一个需要多步骤协调、环境动态变化的复杂任务时,却表现得像“失忆”一般,前后矛盾,甚至忘记最初的目标?这种能力与表现
阅读全文你是否曾遇到过这样的场景:一个能够熟练使用工具、拥有长期记忆的大语言模型智能体,在面对一个需要多步骤协调、环境动态变化的复杂任务时,却表现得像“失忆”一般,前后矛盾,甚至忘记最初的目标?这种能力与表现
阅读全文2026-04-26 GitHub日Star榜 每日精选最值得关注的开源项目 1. awesome-gpt-image-2(热度: 290) GPT-Image2 提示词引擎,提供结构化模
阅读全文DeepSeek V4 发布时,在技术报告里写的非常真诚:在推理能力上,「落后前沿闭源模型大约 3 到 6 个月」。而最近两天,我的各个编程交流群里就开始了对 V4 和各家模型进行大量比较、讨论。其中
阅读全文你或许刷到了一段来自印度南部服装厂的视频。工厂工人佩戴头戴摄像头,记录手部动作以训练人工智能系统。这是因为随着特斯拉、Figure AI 等公司竞相开发人形机器人,训练它们所需的真实世界动作数据变得极
阅读全文新智元报道 编辑:KingHZ【新智元导读】1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro文本IQ 130踩上门萨会员
阅读全文新智元报道 编辑:艾伦【新智元导读】OpenAI CEO Sam Altman 向加拿大小镇 Tumbler Ridge 道歉:公司曾封禁枪击案嫌疑人的 ChatGPT 账号,却未向警方预警。事
阅读全文新智元报道 编辑:KingHZ【新智元导读】谷歌还在闭源守宝,NVIDIA已把Lyra 2.0全开源:35步去噪变4步,2D图片直出3D高斯泼溅+网格。社交狂欢背后,是对具身AI仿真的巨大潜力—
阅读全文整理 | 傅宇琪、褚杏娟 微博考核全体研发 AI 能力、AI 代码贡献率写进字节部门 ORK;DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠;“豆包提前查到 2026 山东事业编成
阅读全文编译 | 宇琪 策划 | Tina 一个还没发布的新模型,已经让 Anthropic 内部感受到了“断层式”的变化。在最新的播客对话里,Claude Cowork 工程负责人 Felix Rieseb
阅读全文如果您经常用Claude Code、OpenCode、OpenClaw这类Agent框架,大概率会遇到一种不稳定现象:同一个Skills,用Claude能跑,换成Qwen就不行了;在Claude Co
阅读全文PRODUCT• 虽然 AI 越来越聪明,但每次对话,你都得补充一堆东西• 让 AI 记住你说过什么不难,但让它记住你做过的事儿很复杂• 记忆这个东西,已经从产品功能逐渐变成了 Agent 基建以上内
阅读全文田晏林 发自 凹非寺量子位 | 公众号 QbitAI手术视频的“黑盒”,被一脚踢爆了!就在这两天,GitHub和Hugging Face社区上线了一枚医疗大模型领域的“核弹”。全球规模最大、性能最强的
阅读全文IPADS团队 投稿量子位 | 公众号 QbitAISkill确实好用,但架不住模型和Agent Harness适配翻车。不是所有模型都吃得动Skill,有的用上直接反向掉性能。△从计算机系统架构角度
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI最近每个人都被“龙虾”“爱马仕”刷屏了。但AI产品总是面临的问题是,爆火的很多,真正能留下的很少。这正是我们希望回答的:今年最值得关注的AI企业&产品是
阅读全文编辑|冷猫深度学习到底有没有科学理论?这是一个很微妙的时代。一边是大模型以令人眩晕的速度迭代,参数量从百亿冲向万亿;另一边是学术界的一片沉默 —— 我们依然没有找到深度学习的基本理论,神经网络仍然是个
阅读全文编辑|杨文剪辑是个苦差事。每当领导丢来一堆素材,留下一句「剪个宣传片」,我们就知道今晚又得点灯熬油了。素材散落在不同文件夹里,需要逐个导入、预览、筛选;要是再配个解说词,我们还得先绞尽脑汁写文案,找个
阅读全文在过去一年中,大模型推理中的「过度思考」问题引发了广泛关注。然而,真正的挑战并非简单地缩短思维链。面对简单问题,模型往往在得出正确答案后仍持续进行冗余验证;而许多旨在抑制过度思考的方法虽能压缩输出长度
阅读全文中美AI基础设施正在呈现出不同的演化倾向。作者|AGI-Signal编辑|秦聪慧本文首发于钛媒体APP4天内,亚马逊宣布250亿美元追加投资,谷歌宣布最高400亿美元投资——两家直接竞争对手,在Ant
阅读全文“现在这个帕西尼,才是我们原本设计的完全体。”作者|科技不焦虑编辑|陶天宇本文首发于钛媒体APP在全球机器人发展历程中,日本,是全球公认的行业奠基者。1970年到2010年间,在工业机器人领域,日本的
阅读全文(4月20日~4月25日)亚马逊与Anthropic未来十年将合作在AWS技术上投入超1000亿美元;国家计算机病毒应急处理中心:警惕“龙虾”智能体被投毒;谷歌发布一系列新AI工具【数智周报将整合本周
阅读全文作者|黄小艺邮箱|huangxiaoyi@pingwest.comManus在去年3月引爆了“通用Agent”的概念——不再是大模型套个壳,而是真正能自主规划、调用工具、端到端执行复杂任务的独立系统。
阅读全文作者|陆邮箱|xiaoyu@pingwest.com在过去两年里,Meta 与 Ray-Ban 联名的智能眼镜可谓是“卖爆了”,但对于我来说,它一直处在一个略显尴尬的位置:外形足够酷、功能也足够新鲜,
阅读全文“多人+多 Agent”新主场。👩 采访:壹小姐🥷 整理编辑:十字路口🧑🎨 排版: Zeooo.cc张佳圆带着他的新产品 Multica 一周斩获 GitHub 1.2w Star回来了。这一次,他
阅读全文这一周让我真正不安的,不是哪个 Benchmark 又被刷新了,这榜单每天都在刷新,已经麻了。让我不安的是,我发现自己打开朋友圈看到一张截图,第一反应不再是「这事儿真的假的」,而是「这图保真吗」。图源
阅读全文系列文章DeepSeek这招太绝了!不加一张显卡,让大模型提速2倍的底层黑科技DeepSeek-OCR 2 重磅发布:告别机械扫描!给 AI 装上“因果脑”,让机器像人一样读懂世界DeepSeek刚刚
阅读全文绝大多数 AI 系统,从底层架构上就设计错了。只要任务稍显复杂,大多数人第一反应就是搭建多智能体系统,但这往往是错误的设计直觉。核心问题从来不是是否要使用多个智能体,而是当前任务究竟需要何种协作模式。
阅读全文在过去三年里,很多人认为模型越大越“聪明”。他们觉得参数越多性能越好,GPU 越多就越强。这个普遍认知本周被 Google 的开源模型 “Gemma 4” 彻底颠覆。Gemma 是 Google 发布
阅读全文诸神之战。本周 AI 快讯 | 1 分钟速览01 DeepSeek V4 预览版开源,1.6 万亿参数携手华为昇腾 :V4-Pro 限时 2.5 折,输入命中 0.25 元、输出 6 元/百万 tok
阅读全文