AI

Agent，源神启动~ 字节整了个原神Agent，Google也发了个游戏Agent SIMA 2。好像很牛，所以仔细瞧了瞧，到底是如何做到让Agent自己玩游戏的呢？核心设计好像就再3点上：第一，一个定时捕捉的视频帧，720P，每200ms捕捉一次。字节的Lumine是基于Qwen2-VL-7B-Base进一步训练的。第二点，混合推理。就是可以选择是不是要思考，简单场景，直接输出动作就好了，比如移动，重复的操作。复杂场景，先进行思考，比如出现了新的目标。第三，就是让模型所有的输出都是，鼠标键盘的序列，直接可执行验证。训练分三个阶段：基础动作→指令跟随→决策推理。从Lumine-Base到Lumine-Thinking，能力是阶梯式上升的。 Base版本能拾取、开宝箱、爬墙，但没有目标导向。 Instruct版本可以完成指令，短任务（10秒至数分钟任务）成功率80%+。在璃月这种没训练过的场景也能自主导航。 Thinking版本，使用了使用15小时的人工标注推理数据。让模型学会自主规划、反思与修正的能力，测试下来，以蒙德主线为测试场景，第一章56分钟搞定，GPT-5要112分钟。第二、三章4.7小时，完成率98.2%，Gemini只完成了65%还用了8小时。跨游戏测试里，《鸣潮》100%完成率，《崩铁》92.3%，《黑悟空》85.7%。所以整体还是靠模型，逻辑应该都是,先在3D游戏里训练通用Agent，因为相对封闭的游戏环境里，规则清晰、反馈明确。然后实际目标是具身智能？难得就是真实世界没有血条和小地图。论文地址：https://arxiv.org/abs/2511.08892
作者：探索AGI发布日期：2025-11-17 11:50:00
Agent，源神启动~ 字节整了个原神Agent，Google也发了个游戏Agent SIMA 2。好像很牛，所以仔细瞧了瞧，到底是如何做到让Agent自己玩游戏的呢？核心设计好像就再3点
阅读全文
对话Memories.ai：“人的记忆本质上是视觉，AI也该如此”
作者：硅星人Pro发布日期：2025-11-17 11:03:08
对话：王兆洋，黄小艺整理：黄小艺Memories.ai试图为未来的AI设备装上“视觉记忆”。这家由前Meta Reality Labs研究员Shawn Shen和Ben Zhou创立的公司，11月6日
阅读全文
AI生成乡村歌曲登顶Billboard榜首：这该让所有人愤怒
作者：硅星人Pro发布日期：2025-11-17 11:03:08
最近在浏览海外音乐媒体时，我注意到一个重磅消息在乡村音乐圈引发轩然大波。美国乡村音乐文化媒体Whiskey Riff发布了一篇措辞严厉的文章，标题直指"一首AI生成的乡村歌曲正在霸占Billboard
阅读全文
年度最强AI压轴！谷歌Gemini 3.0下周决战OpenAI，前端要下岗了
作者：硅星人Pro发布日期：2025-11-17 11:03:08
文章转载于新智元年度压轴AI大戏，就在下周了！今天，一张图火爆全网：69%的人都在押注，谷歌下一代AI模型Gemini 3.0即将在下周登场。就在此时，谷歌CEO劈柴突然现身回应：两个「若有所思」的表
阅读全文
让千问APP当一周科研打工人：它比我想的能干，也比我想的累
作者：PaperWeekly发布日期：2025-11-17 11:01:13
我把自己一周的博士日常全塞进了千问 APP——读论文、啃图表、跑实验、写 related work、救火 debug……结果用着用着，我突然有点怀疑：这手机里的模型，可能比我更像个 PhD。这两年，大
阅读全文
双重隐式记忆来了！JanusVLN让视觉语言导航真正理解3D空间
作者：PaperWeekly发布日期：2025-11-17 11:01:13
引言视觉-语言导航（Vision-and-Language Navigation, VLN）作为具身智能的关键研究领域，旨在赋予智能体遵循自然语言指令在未知三维环境中导航的能力。近年来，多模态大语言模
阅读全文
千问APP来咯！会聊天，能办事，还免费！！
作者：通义千问Qwen发布日期：2025-11-17 11:00:00
阅读全文
刚刚，阿里千问 APP 开启公测，要做中国版ChatGPT | 附实测
作者：APPSO发布日期：2025-11-17 10:56:23
前几天，阿里「千问计划」被曝光。消息称，他们要基于全球性能第一的开源模型 Qwen3 打造个人 AI 助手「千问 APP」。而就在刚刚，靴子终于落地。阿里官宣千问 APP 公测版上线。除了聊天足够聪明
阅读全文
阿里千问 APP 来了，对标 ChatGPT，配吗？
作者：夕小瑶科技说发布日期：2025-11-17 10:52:13
阿里发布千问 APP，正式开启公测。这个消息我上周已经刷到了——“阿里秘密启动千问项目，全面对标 ChatGPT ”，甚至还带动了阿里港股小涨一波。周末我发现 APP Store 里已经开放下载，于是
阅读全文
陈天桥的AI布局再下一子，推出最强AI长记忆操作系统
作者：钛媒体AGI发布日期：2025-11-17 10:23:19
文｜TechPulse作者｜张帅本文首发于巴伦APP近日，EverMind 团队宣布正式发布其旗舰产品 EverMemOS，这是一款面向人工智能智能体的世界级长期记忆操作系统，它旨在成为未来智能体的数
阅读全文
AI大模型开发核心技术栈：从框架到部署的全景解析
作者：AIGC开放社区发布日期：2025-11-17 09:25:36
专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！构建未来智能的“开发者军火库”在A
阅读全文
VLM 实现 10%的精度提高，13.1倍加速！纽约大学新算法让视觉语言模型更小、更快、更准确
作者：AIGC开放社区发布日期：2025-11-17 09:25:36
专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！纽约大学的研究团队通过QSVD的新
阅读全文
开发者必学！谷歌和Kaggle推出5天免费智能体课程，5份重磅报告，解构AI智能体未来
作者：AIGC开放社区发布日期：2025-11-17 09:25:36
算泥社区是集 “AI 大模型开发服务 + 算法 + 算力” 于一体的开源生态社区，欢迎关注！谷歌与Kaggle联手，用为期5天的强化课程和5份重磅报告，为全球开发者系统性地描绘了构建AI智能体的完整蓝
阅读全文
GLM Coding Plan 特供版全新上线
作者：AIGC开放社区发布日期：2025-11-17 09:25:36
专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！智谱「GLM Coding Pl
阅读全文
雷军连发数文回怼质疑：车好看与安全不矛盾/曝库克将于明年卸任苹果CEO/华为或将发布AI突破性技术
作者：APPSO发布日期：2025-11-17 08:35:30
📱iPhone 发布周期大变：每年可能会推出 6 款新机🔄曝华为将发布 AI 领域突破性技术🔬北京 6G 实验室多项进展公布🚗雷军连发多条微博：一辆车好看与安全不矛盾🤖Grok 5 或延期至明年发布📱
阅读全文
使用Claude Skills 快速学习一切
作者：字节笔记本发布日期：2025-11-17 08:23:08
如果只是把Claude Skills用来编码就真的有点暴殄天物了。Claude Code Skills 不是什么？在上面的文章中我们其实可以了解到Skills的本质是Agent的中枢，基本所有的Age
阅读全文
一半成本，更优性能：JustRL用"反常识"配方打破强化学习训练迷思
作者：觉察流发布日期：2025-11-17 08:00:00
点击👇🏻可关注，文章来自🙋‍♂️ 想加入社群的朋友，可看文末方法，进群交流。“ 在强化学习训练日益复杂化的今天，清华大学自然语言处理实验室的JustRL研究提出了一个反常识的发现：单阶段训练、固定超参
阅读全文
LLM为什么能替你操作电脑？4个关键技术让AI拥有"操作系统级"能力｜Agent和工作流的区别就在这
作者：AI修猫Prompt发布日期：2025-11-17 07:26:00
如何构建一个真正意义上的“自主代理”（Agent），而不是一个“带LLM的高级工作流”？让钢铁侠中的“贾维斯”（J.A.R.V.I.S.）真正来到现实，不仅能对话，还能调动资源、控制机械、在复杂战局
阅读全文
GPT-5.1：被骂 3 个月后，OpenAI 终于“认怂”了
作者：AI信息Gap发布日期：2025-11-17 06:20:34
三个月前，GPT 5 发布时，CEO Sam Altman 说：“这是我们最强的模型”。三个月后，OpenAI 发布 GPT 5.1，官方博客罕见地承认：“我们听到了用户的声音，真正好用的 AI 不仅
阅读全文
【视频版】事情为什么会踏马发展成整个样子？170页 ppt
作者：赛博禅心发布日期：2025-11-16 22:02:21
本内容由明浩老师提供，在电影院进行的年度暴论非常真实，笑抽了公众号回复「251101」，可获得完整 PPT先放AI总结，后面 PPT以下内容，由「飞书妙计」整理：广告（超大声）：先进团队，先用飞书（
阅读全文
Meta宣布彻底解决RAG最大痛点：速度提升30倍，上下文窗口暴增16倍，成本直接腰斩！
作者：PyTorch研习社发布日期：2025-11-16 21:34:18
大家有没有这种感觉：明明只想让大模型看10段资料，它偏偏要硬塞100段，消耗的token数像火箭一样增长，速度还慢得像乌龟？恭喜你，这个行业通病，Meta今天直接给治好了。他们刚开源了一个叫 REF
阅读全文
RAG 真的能“不暴露私有数据”吗？答案是：可以
作者：PyTorch研习社发布日期：2025-11-16 21:34:18
你是否认真考虑过 RAG 流水线中的文档隐私？这篇文章也许能提供一个有帮助的方向。为什么“Standard RAG → Cloud Search”在隐私上行不通Standard RAG 的做法是把明文
阅读全文
Pygame RPG Tutorial 9 – Collision Detection
作者：AI大模型调参指北笔记发布日期：2025-11-16 21:00:00
我们成功地创造了玩家和敌人两个职业。下一步是使这两个实体彼此可交互。目标很简单；玩家必须能够攻击敌人，反之亦然。在当前版本的游戏中，我们可以随心所欲地攻击敌人（反之亦然），但这对任何一方都没有影响。原
阅读全文
未来的个性化陪伴？卡内基梅隆大学提出AI伴侣四象限
作者：机智流发布日期：2025-11-16 20:00:00
一句话速读：卡内基梅隆大学研究者提出 AI 伴侣四象限分类法，以 “情感型 vs 功能型”“虚拟型 vs 实体型” 为核心维度，系统梳理了从虚拟偶像、职场助手到实体护理机器人的全场景形态，揭秘了不同类
阅读全文
这枚卖 2000 元的 AI 戒指，心率睡眠都测不了，只能听你碎碎念
作者：APPSO发布日期：2025-11-16 17:55:30
AI 硬件的失败名单已经很拥挤，但总有人不信邪继续入场。这次入场的是前 Meta 员工创立的 Sandbar，他们最近发布的 Stream 智能戒指砍掉了所有智能戒指该有的功能——不监测心率，不追踪睡
阅读全文
AI视频泛滥成灾！平台管控难，消费者鉴别能力日益重要？
作者：智能Pro发布日期：2025-11-16 17:05:00
👆👆👆重要提醒！微信推荐机制大幅调整，大家务必将我们公众号设为★星标，否则很可能看不到推送了......作者：TSKnight | 监制：罗超当你在刷短视频的时候，是否会想到一些看似夸张的视频背后，其
阅读全文
双十一销量暴涨十倍，谁是AI眼镜的“超级赢家”？
作者：智能Pro发布日期：2025-11-16 17:05:00
👆👆👆重要提醒！微信推荐机制大幅调整，大家务必将我们公众号设为★星标，否则很可能看不到推送了......双十一虽然结束了，但是小雷的双十一专题还没到结束的时候。在各个品牌和平台陆续发布战报后，我们终于
阅读全文
神仙工具！资源全面，速度收藏！
作者：智能Pro发布日期：2025-11-16 17:05:00
👆👆👆重要提醒！微信推荐机制大幅调整，大家务必将我们公众号设为★星标，否则很可能看不到推送了......这是一款全新闪耀登场的手机技能资源应用，宛如一座蕴藏无尽宝藏的知识迷宫，为广大技能探索者开辟了便
阅读全文
2万买威马、8万买极越，这届年轻人开始“抄底”烂尾车
作者：智能Pro发布日期：2025-11-16 17:05:00
👆👆👆重要提醒！微信推荐机制大幅调整，大家务必将我们公众号设为★星标，否则很可能看不到推送了......2025年的中国新能源汽车市场，正在经历一场“废墟淘金”运动。有人花7.77万买下原价14.99
阅读全文
白宫深夜盯上阿里？或源于“千问恐慌”；多次泄密！字节Seed研究员、知乎V被开除；Meta员工绩效将与AI结果挂钩 | AI周报
作者：AI前线发布日期：2025-11-16 13:30:00
整理 | 傅宇琪、褚杏娟多次泄密！字节 Seed 研究员、知乎 8 万粉大 V 被开除；雷军千万年薪挖角？前 DeepSeek 研究员罗福莉官宣加入小米；白宫深夜盯上阿里？或源于“千问恐慌”（Qwe
阅读全文

上一页下一页