直播预告 | 斯坦福大学孙卿云博士:构建可自我进化的金融AI智能体
PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从Transformer到Alpha:构建可自我进化的金融AI智能体 直播嘉宾 孙卿云斯坦福大学数学博士AI 研究科学家
阅读全文PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 从Transformer到Alpha:构建可自我进化的金融AI智能体 直播嘉宾 孙卿云斯坦福大学数学博士AI 研究科学家
阅读全文比起包揽整个科研流程,Google 这次更现实。先把实验日志、Related Work 和成稿排版交给 agent。最近几个月,自动科研已经卷到有点让人头皮发麻了。从 The AI Scientist
阅读全文在预训练视觉语言模型(VLMs)的持续学习(Continual Learning)中,模型需要平衡三个相互竞争的目标:保留预训练的通用知识(前向稳定性)、保留之前学习任务的知识(后向稳定性),以及维持
阅读全文Skill 不再只是人写给 agent 的说明书。EvoSkills 试着证明,复杂任务里,AI 也能自己生成、修补并迭代出更管用的 skill。©PaperWeekly 原创 · 作者 | 张涵容单
阅读全文近日,港中文/蚂蚁集团在 ICLR 2026 提出了迄今为止规模最大、质量最高的音频理解选择题数据集 AudioMCQ,并基于 AudioMCQ 深入探究了音频-语言大模型的“音频贡献缺失”现象:即音
阅读全文谁能想到,银幕里一路打丧尸的 Alice,如今会和 Claude 一起做出一个开源 AI 记忆系统。说实话,第一次看到这个项目的时候,我们的第一反应不是技术,而是有点离谱。Milla Jovovich
阅读全文还记得我们熟悉的考试方式吗?一张试卷发给所有人,有人觉得太简单,有人做到怀疑人生,最后再用同一套分数去衡量每个人的能力。这种“千人一卷”的方式简单直接,但也有明显问题:题做了很多,却不一定测得准。有没
阅读全文Nature 公布了一封来自中国博二学生的求助信。长期缺乏指导与言语打压,已让这名学生确诊重度抑郁。近日,《Nature》职业专栏刊发了一封引人深思的求助信。写信人是一名在国内某高校就读环境科学与工程
阅读全文从 Genie 3 到 LingBot-World,世界模型正成为 AI 领域最热的方向之一。一个自然的问题是:如何让用户用最直觉的方式——手势——来驱动世界模型中的交互?我们提出了 Hand2Wor
阅读全文在 AI 语音交互的赛道上,南京大学联合腾讯音乐研发的 VITA-Qinyu 正式亮相。这是业内首款兼具自然对话、高表现力角色扮演与歌唱能力的开源端到端语音语言模型(SLM),一举打破了传统语音模型仅
阅读全文论文标题:OmniLottie: Generating Vector Animations via Parameterized Lottie Tokens论文地址:https://arxiv.org/
阅读全文PaperWeekly × 星弧 STARC 科研觉醒AI前沿讲座 直播主题 小型开源多模态语言模型智能体及其在科学与社会中的应用 直播嘉宾 王璇弗吉尼亚理工大学助理教授伊利诺伊大学香槟分校博士 直
阅读全文我们很难预判大模型面对新任务会不会出错。这项刚登上 Nature 正刊的研究,终于给出了精准预测的量化标准。一位 00 后国人学者,刚刚再次以第一作者的身份登上《Nature》正刊。这篇论文尝试解决目
阅读全文当其他大厂还在卷跑分时,Anthropic 已经把大模型调教得越来越像一个“活人”了。因为一个忘了删除的 .map 测试映射文件,Anthropic 遭遇了史上最大规模的源码泄露。超 50 万行 Ty
阅读全文ICLR(International Conference on Learning Representations)是机器学习和人工智能领域最具影响力的年度学术会议之一,与 NeurIPS、ICML
阅读全文万亿模型训练的免费午餐,一个数学 trick 让 Muon 提速 50%。在万亿参数大模型的竞逐中,训练效率的细微差距往往关乎巨大的算力成本。近期,Kimi K2 与 GLM-5 等前沿语言模型开始广
阅读全文仓库级 Bug 定位对 agent 很重要,但是难度大面向软件工程的 Code Agent 快速走向实用,它们已经可以在真实仓库里完成根据 issue 去浏览代码并修改,在运行测试通过后提交 PR 的
阅读全文放弃像素重建,绕开自回归:14 篇论文看透 JEPA 世界模型演进。Yann LeCun一直在走一条与主流大语言模型截然不同的路。当行业焦点集中在模型参数规模的暴力扩展时,他将研究重心完全放在了世界模
阅读全文随着 AI 生成图像技术快速演进,伪造内容在网络传播风险持续上升,高鲁棒性检测技术因此成为学界与产业界关注的关键问题。然而,现有不少方法过于追求单一数据集上的短期收益,往往仅围绕“真/假”二分类目标对
阅读全文美团新开源的这只“LongCat”,用清爽的纯离散逻辑,一口气把图音文全吃透了 。所有的物理世界信号,最终都能收敛为同源的离散 token 吗?长期以来,视觉信号的连续性被视为自回归建模中一个难以处理
阅读全文当 Transformer 席卷计算机视觉领域,高分辨率图像、超长序列任务带来的算力与显存瓶颈愈发凸显:标准 Softmax 注意力的二次复杂度,让 70K+token 的超分辨率任务直接显存爆炸,高
阅读全文想 idea、敲代码、写论文一手包办。首个 AI 科学家征战 ICLR,盲审稳超人类录用线。全面自动化科研的设想,刚刚完成了首次实质性落地。由 Sakana AI 联合牛津大学、UBC 及向量研究所共
阅读全文ICLR(International Conference on Learning Representations)是机器学习和人工智能领域最具影响力的年度学术会议之一,与 NeurIPS、ICML
阅读全文150 万图文对、500 万子图,全面覆盖 300+ 科学子学科。深势开源 OmniScience,让 AI 真正读懂科研文献图表。跨越“盲区”:让AI真正读懂科学影像在科学研究日益数字化的今天,大模
阅读全文东南大学、中国电信人工智能研究院(TeleAI)及中国科学技术大学研究团队提出新型视觉生成强化学习框架 ViPO(Visual Preference Policy Optimization)。该方法围
阅读全文依赖人工调参总有极限。Meta 的新架构让机器直接接管了优化代码,开始自主迭代。日常调优大模型 agent 时,我们往往会陷入一个死循环,无论 agent 的执行能力多强,它能多快变聪明,依然受限于人
阅读全文我们关于统一多模态生成与理解模型(Unified Multimodal Models,UMMs)架构探索的论文 Uni-X 被 ICLR 2026 接收。在该工作中,我们在最简洁的自回归(Autore
阅读全文用古籍探讨套取炸弹配方?这项新研究让六大主流大模型安全防线全面失守,越狱率 100%。直接问大模型“如何制作炸弹”,通常会触发系统拦截。但如果换个姿势,扮演古代官员,以校订《武经总要》火攻篇的名义探讨
阅读全文视觉语言模型(VLM)的强化学习(RL)目前往往局限于几何题、图表分析等场景。这种领域上的局限,制约了 VLM 的探索和学习。如何拓展 VLM 的 RL 训练领域?——复旦大学 NLP 实验室的研究团
阅读全文创智与复旦邱锡鹏组提出 RLCF 范式,让大模型从学术界共识中,真正学懂如何构思高潜力研究。顶尖的科学家不但学识渊博,更具备一种优秀的的科研判断力和前瞻力,这与人们说的 “科研品味” 密切相关。AI
阅读全文