大模型SFT后效果≠RL潜力!港科大、阿里提出自适应冷启动新范式
本文第一作者是来自香港科技大学的博士生李欣然,并由胡张广达、厦门大学沈思淇副教授、阿里集团陈庆国、徐昭、骆卫华、张凯夫和香港科技大学张军教授合作完成。自 2025 年以来,强化学习(RL)逐渐成为了大
阅读全文本文第一作者是来自香港科技大学的博士生李欣然,并由胡张广达、厦门大学沈思淇副教授、阿里集团陈庆国、徐昭、骆卫华、张凯夫和香港科技大学张军教授合作完成。自 2025 年以来,强化学习(RL)逐渐成为了大
阅读全文被毕业的同事其实并没有消失,他们只是被蒸馏成了 Token,换成另一种形式陪伴你。最近一个「同事.skill 」的叫 GitHub 项目火了。项目的 slogan 写得很温情:「将冰冷的离别化为温暖的
阅读全文作者|周一笑邮箱|zhouyixiao@pingwest.com今年1月,一个叫Mana的团队做了一件很酷的事,用自然语言生成iOS快捷指令。说一句话,就能串联起闹钟、健康、日历等590多个原生能力,
阅读全文最近,GitHub 上突然冒出一批名字带 .skill 后缀的项目。同事.skill、前任.skill、导师.skill、boss.skill 以及更多看起来像玩笑、实则很认真的变种。把一个人的聊天记
阅读全文一个叫 Mintlify 的文档平台最近干了一件很是巧妙的事:给自家 AI 文档助手,造了一套假的文件系统。Mintlify 虚拟文件系统然后,Agent 会以为自己在用 grep 搜文档、用 cat
阅读全文新智元报道 编辑:编辑部【新智元导读】就在刚刚,全球AI巨头Anthropic正式发出通牒:从美国东部时间4月4日 15:00起,强行将OpenClaw踢出Claude订阅服务的白名单!全球开发
阅读全文新智元报道 编辑:KingHZ【新智元导读】越像人的AI,越要被工程化地「去人性」。微软AI CEO Suleyman提出争议设计准则:非感知信号、身份水印、法律禁区。否则,镜子套镜子,我们将永
阅读全文新智元报道 编辑:倾倾【新智元导读】Chatbot时代结束了!Google将AI植入Android底层,让它变成一个主动规划一切的系统管家。每个月$19.99+你的全部数据,就能获得一个全天候2
阅读全文很多开发者在使用 Claude Code 时,一遇到新功能或复杂任务,就会输入 /plan 或进入 Plan Mode,一遇到新功能或复杂任务,就会进入 Plan Mode,期待 AI 帮我们先想清楚
阅读全文就在刚刚,Anthropic 宣布「封杀」OpenClaw。很多 OpenClaw 用户的邮件收件箱,悄悄多了一封邮件,邮件内容不长,但信息量很大:从太平洋时间 4 月 4 日起,用户将无法再使用您的
阅读全文🍎曝苹果「天价扫货」DRAM,阻止竞争对手获取😭小米手机官宣涨价,卢伟冰:内存涨价远超预期🔋充电宝迎史上最严国标,明年强制实施🚗福特刷新纽北美系纪录,小米排名下滑、雷军发文祝贺🤯Slack 切断大中华
阅读全文昨天聊了 Gemma 4,今天教你把它装进本地电脑里。养龙虾终于不用花钱了。谷歌最新的开源模型 Gemma 4,原生支持 function calling。装在你自己的电脑上,接入 OpenClaw,
阅读全文上一篇,我介绍了一种 OpenClaw + Qwen3.5 + Ollama 的本地方案。今天来介绍更好的本地方案!CoPaw + CoPaw 模型 + llama.cpp 的方案。整体来说,会比之前
阅读全文图片由 AI 生成导读:当AI的“方向盘”和“仪表盘”不再隐藏在代码深处,而是变成人人都能看懂的自然语言文档,智能体开发将迎来怎样的革命?在当今AI智能体开发领域,一个不为人知却至关重要的现实是:智能
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:三七二十一 | 监制:罗超发布才几个小时,Gemma 4 就已经把开发者社区的情绪拉满了。
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:利剑 | 监制:罗超机器人,正在从「能走路」进化到「能干活」。这一进程中,除了备受诟病的「
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......作者:三七二十一 | 监制:罗超4 月 1 日,联想中国区举行了一场新财年的誓师大会,复盘成绩、
阅读全文graph_rewriting.pyLayerclass Layer: ''' Layer is a wrapper for TensorRT's ILayer with several
阅读全文Claude Code 源码泄露之后,随之而来就是各种的源码分析报告。但说实话,大多数人阅读和分析源码的方式都是错的,一般就是下载下来打开目录,开始读,然后直接歇菜。Claude Code泄露的源码有
阅读全文作者 | 四月 “这么多版本的龙虾,我到底该用哪个?”这是 InfoQ 在落地的近 20 场“龙虾”(OpenClaw) 主题线下活动中,从数千名开发者口中听到的最多困惑。OpenClaw 的 Git
阅读全文作者 | Leela Kumili译者 | 张卫滨Stripe 的工程师开发了 Minions,这是一个自主编程的智能体,能够根据单条指令端到端地完成软件开发任务。该系统实现了大语言模型(LLM)与内
阅读全文作者|骆轶航邮箱|tluo@pingwest.com2026年3月30日到4月2日,阿里巴巴旗下的通义实验室密集发布了三个模型:先是3月30日的 Qwen3.5-Omni,主打全模态交互。它在215项
阅读全文作者|吴瑞琪邮箱|rachelwu@pingwest.comGDC 2026 的氛围明显不同以往。整个游戏行业对 AI 的态度,已经从质疑转向了兴奋与期待。大多数游戏工作室不再纠结要不要用 AI,而是
阅读全文文章转载于字母AI甲骨文凌晨突发裁员,不是愚人节玩笑。据CNBC证实,甲骨文(Oracle)已经启动新一轮裁员,涉及数千名员工。同一时间,它正在砸下数百亿美元,建设AI基础设施。多家行业媒体披露,甲骨
阅读全文一水 发自 凹非寺量子位 | 公众号 QbitAIToken,这下真成了智能世界的基本单位。不是被定义出来的“词元”,而是被一套全新的统一Token架构,直接压进了现实建模的最底层。过去一年,几乎所有
阅读全文金磊 发自 凹非寺量子位 | 公众号 QbitAI龙虾(OpenClaw)的火,是真的火,整个行业都在为这个能真正干活的Agent疯狂。但真用起来的尴尬,也是真的尴尬。因为好多企业跟风All in A
阅读全文听雨 发自 凹非寺量子位 | 公众号 QbitAI啥?AI也有情绪?Anthropic最新研究发现,Claude内部存在多种“情绪表征”,包括“快乐”“爱”“悲伤”“愤怒”“恐惧”“绝望”等等。这些情
阅读全文组委会 发自 凹非寺量子位|公众号 QbitAI中国生成式AI正在进入产业深水区。这两年,AI从“新技术”变成了“新工具”,又从“新工具”慢慢变成企业必须面对的现实。它不只在改变内容生产,也在影响研发
阅读全文