全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    中国科大认知全重实验室发布Agent-R1训练框架,支持自主思考与工具调用!

    作者:NLP PaperWeekly发布日期:2025-04-02 09:19:38

    什么是 Agent-R1imgAgent-R1是由中科大认知智能全国重点实验室开发的智能体强化学习训练框架,致力于推进强化学习与智能体技术的融合发展。框架采用端到端强化学习方法,突破了依赖人工设计工

    阅读全文
  • 文章封面

    香港科技大学联合DeepSeek-AI推出CODEI/O:让AI学会“浓缩”推理模式

    作者:NLP PaperWeekly发布日期:2025-04-01 07:28:57

    大家好,我是HxShine今天分享一篇香港科技大学、DeepSeek-AI和上海交通大学联合发表的文章,标题为:CODEI/O: Condensing Reasoning Patterns via

    阅读全文
  • 文章封面

    人工标注太贵,合成数据不够好?看OS-Genesis如何破解数据困局

    作者:NLP PaperWeekly发布日期:2025-03-31 10:55:08

    从1920年的小说《R.U.R》到《钢铁侠》中的JARVIS,在过去的一个世纪里,人们一直梦想着构建能够自动化日常工作的Digital Agents(数字代理)。如今,随着视觉语言模型(VLMs)的

    阅读全文
上一页