训练减半反超GRPO!Shuffle-R1引入动态洗牌术,突破多模态RL效率瓶颈
©作者 | 朱泠皞单位 | 华中科技大学/小米公司研究方向 | 多模态大模型太长不看:我们提出了 Shuffle-R1,一个简单而高效的多模态大语言模型(MLLM)强化学习后训练框架,它通过“动态数据
阅读全文©作者 | 朱泠皞单位 | 华中科技大学/小米公司研究方向 | 多模态大模型太长不看:我们提出了 Shuffle-R1,一个简单而高效的多模态大语言模型(MLLM)强化学习后训练框架,它通过“动态数据
阅读全文近年来,大语言模型(LLM)在人工智能领域取得了突破性进展,成为推动自然语言处理技术发展与通用人工智能实现的核心力量。上下文学习能力(In-Context Learning, ICL)是 LLM 最显
阅读全文合适的工作难找?最新的招聘信息也不知道?AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职!香港理工大学香港理工大学 (The Hong Kong Polytechnic
阅读全文闻乐 鱼羊 发自 凹非寺量子位 | 公众号 QbitAI大模型“世子之争”,果然暗潮汹涌(doge)。这不“手机内存不够”怎么办,如果你问问DeepSeek老师:你和豆包删一个你删谁?DeepSeek
阅读全文克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI已经能够自主思考并证明新的数学规律了?OpenAI研究人员表示,自己喂给GPT-5 Pro一篇论文,结果模型读完之后得到了新的结论。在凸优化问题
阅读全文衡宇 白交 发自 上海量子位 | 公众号 QbitAI这辈子,咱也是被人形机器人夹道欢迎过了!最左边这位机器人最后还有点踉踉跄跄(艾玛更像人了)。这是来自智元机器人首届合作伙伴大会现场传回的最新画面。
阅读全文Kwai Keye团队 投稿量子位 | 公众号 QbitAI在Openai 发布o3后,think with image功能得到了业界和学术界的广泛关注。Kwai Keye团队提出Thyme (Thi
阅读全文林樾 发自 凹非寺量子位|公众号 QbitAIAI Agent能帮你干活,还能帮你自动赚钱了。一个全天在线、理性决策、快速执行的Agent,或许真有机会替代传统投资方式。Agent真能理解市场、预测行
阅读全文OpenAI发布了开源的agent README格式: AGENTS.md而且这就是它的域名,可以直接访问。目前Codex, Amp, Google jules , Cursor, FactoryAI
阅读全文图片来源:a16zZ Highlights:这真的是一种平衡艺术——要搞清楚模型应该具备哪些特性,以及我们希望它给人的“感觉”是什么。GPT-5发布时,我们觉得正好是一次重置和重新思考的机会。尤其是,
阅读全文8.11-8.17 TOP10TOP1:Macaron AI(华人Builder)一句话描述:Macaron AI是一款通过记忆用户偏好和即时生成个性化微应用。图片来源:Product Hunt简介:
阅读全文图片来源:Character.AICharacter.AI 是一家聊天机器人制造商,其创始人去年 8 月
阅读全文图片来源:SRE.aiY Combinator 校友企业 SRE.ai ,专注 DevOps 人工智能Agent开发。该公司于周三正式结束隐匿模式,宣布完成由Salesforce Ventures 和
阅读全文作者|董道力邮箱|dongdaoli@pingwest.com如果一个 Agent 只能用固定的功能,那它还是 Agent 吗?在去年 AutoGLM 的发布会上,智谱 CEO 张鹏用 AutoGLM
阅读全文作者|陆邮箱|xiaoyu@pingwest.com小时候第一次看《哈利波特与魔法石》的时候,第一个让我印象深刻的魔法道具不是魔杖、不是飞天扫帚、而是纳威奶奶买给他的「记忆球」。这是一个当你忘记了事情
阅读全文文章转载于量子位(QbitAI)作者:梦晨疯狂扎克伯克,有点太猛了。6个月内第4次重组AI部门…而且还被曝出疯批一样裁掉一些AI高管和员工……太疯了太疯了。省略中间过程,首先直接来看最终结果,现在整个
阅读全文"API开发正在被AI重写规则。过去写文档、编测试、对字段要花掉团队大量的时间,如今一句自然语言指令就能利用Apipost AI在几分钟内完成80%的重复工作:自动补全文档、生成边界测试、同步字段命名
阅读全文📦5700 元起,Pixel 10 系列正式发布👽奥特曼:GPT-6「大饼」已经在画了🎮中国一汽回应「入股零跑」:不实信息⌚钉钉否认「优化不主张加班主管」👾机构:折叠屏 iPhone 有望点燃折叠屏市
阅读全文点击👇🏻可关注,文章来自🙋♂️ 想加入社群的朋友,可看文末方法,进群交流。“ 一项覆盖31K图像的实证研究,为GPT-5的空间智能能力画出精确坐标。它在简单任务上遥遥领先,却在复杂挑战前与开源模型并
阅读全文在经过长足的预热,并且见识到谷歌堪比阿勃维尔的保密程度之后,我们终于迎来了 2025 年谷歌的 Pixel 系列新品的正式发布。不出所料,其中大部分硬件参数都与前期爆料中的信息相符,大小两款 Pro
阅读全文刚刚,字节跳动向世界投出了一枚重磅炸弹!ByteDance Seed团队正式开源了Seed-OSS系列模型,这个仅用12T tokens训练的36B参数模型,在多个主流基准测试上的表现足以让人刮目相看
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......最近两年,AI 在教育领域的存在感变得前所未有的强。并且伴随大模型技术的不断演进,用户对教育 A
阅读全文想必大家肯定都听说过某猫小说,甚至还有不少人使用它,也难怪,以免费阅读且可以领现金的福利火速出圈,就连小编都经常用它来看小说。不得不说确实很不错,用户界面干净简洁,排版也很好,拥有多个书源版权,当然最
阅读全文👆👆👆重要提醒!微信推荐机制大幅调整,大家务必将我们公众号设为★星标,否则很可能看不到推送了......如果你问我,现在哪个数码圈子最热闹?我的答案一定是AI眼镜。你看,从去年开始,各式各样的玩家都开
阅读全文由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场,即将开播!近期各
阅读全文Source 来源Rethinking Information: Linus Lee on Representations, AI & Human Agency -- Linus Leehttps:
阅读全文2025年7月,在备受瞩目的2025开放原子开源生态大会上,第三届开放原子大赛正式拉开帷幕。这是由开放原子开源基金会主办的系列开源技术赛事,攻坚产业与科研实际技术难题,推广开源技术,发掘开源人才。如今
阅读全文整理 | 褚杏娟众所周知,前不久 Anthropic 宣布对用户实行每周速率限制。其中,在解释原因时,Anthropic 提到“虽然 Pro 和 Max 套餐提供了充足的 Claude 访问权限,但一
阅读全文