啥工作量?!60天就发了一篇NLP顶会
搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道:科研成果是干出来的
阅读全文搞科研,最怕的就是每天“眼睛读文献,脑袋想方案”。以为只要文献读的够多,准备就足够充分,就能找到好选题,写出好文章。实际上是在用“勤奋读文献”掩盖“不敢开始干”的焦虑。过来人都知道:科研成果是干出来的
阅读全文今天分享一篇来自 DeepMind 的研究论文,标题为:Putting the Value Back in RL: Better Test-Time Scaling by Unifying LLM
阅读全文Kaggle | 总奖池超200万美金的数学竞赛AIMO2冠军方案大家好,我是HxShine今天分享一篇来自 NVIDIA 的文章(kaggle AIMO2冠军方案,冠军奖金高达26w美金,总奖池超
阅读全文大家好,我是HxShine!今天分享一篇来自清华大学和上海人工智能实验室的文章,标题为 TTRL: Test-Time Reinforcement Learning(测试时强化学习)。这篇文章探讨了
阅读全文大家好,我是HxShine今天分享一篇来自清华的文章,标题为:“Does Reinforcement Learning Really Incentivize Reasoning Capacity i
阅读全文2025开年,AI技术打得火热,正在改变程序员的职业命运:阿里云核心业务全部接入Agent体系;字节跳动30%后端岗位要求大模型开发能力;腾讯、京东、百度开放招聘技术岗,80%与AI相关……大模型正在
阅读全文什么是 Agent-R1imgAgent-R1是由中科大认知智能全国重点实验室开发的智能体强化学习训练框架,致力于推进强化学习与智能体技术的融合发展。框架采用端到端强化学习方法,突破了依赖人工设计工
阅读全文大家好,我是HxShine今天分享一篇香港科技大学、DeepSeek-AI和上海交通大学联合发表的文章,标题为:CODEI/O: Condensing Reasoning Patterns via
阅读全文从1920年的小说《R.U.R》到《钢铁侠》中的JARVIS,在过去的一个世纪里,人们一直梦想着构建能够自动化日常工作的Digital Agents(数字代理)。如今,随着视觉语言模型(VLMs)的
阅读全文