HF今日推荐论文20篇|浙大LightMem三阶段记忆模型效率暴增117倍!MIT世界模型闭环评测,复旦多模态基准革新
(1) LightMem: Lightweight and Efficient Memory-Augmented Generation论文 ID:2510.18866论文简介:由浙江大学、新加坡国立大
阅读全文(1) LightMem: Lightweight and Efficient Memory-Augmented Generation论文 ID:2510.18866论文简介:由浙江大学、新加坡国立大
阅读全文在大模型(Large Language Model, LLM)深度融入日常交互的今天,用户对 AI 响应速度的要求越来越高:既要“秒回”(低Time-to-First-Token, TTFT),又要“
阅读全文> 本文来自社区投稿,作者:孟祥玉本篇分享论文《Identity-GRPO: Optimizing Multi-Human Identity-preserving Video Generation v
阅读全文近期 Andrej Karpathy 与播客主持人 Dwarkesh Patel 的两小时访谈[1]引发科技圈震动,播放量半天内突破 130 万次。Andrej Karpathy 是人工智能领域的知名
阅读全文(1) QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs论文 ID:2510.116
阅读全文引言PaddleOCR-VL 来了!它是百度飞桨团队最新推出的超轻量视觉语言模型(VLM),以仅 0.9 亿参数的紧凑设计,在全球多模态文档解析评测榜 OmniDocBench v1.5 上以 92.
阅读全文上新 ICCV 2025 专区,收录 2702 篇 ICCV 论文,并使用科学能力超强的 Intern-S1 生成了 2702 篇「图文并茂」的解读博客以及「中英文」对照的 PDF 翻译。https
阅读全文> 本文来自社区投稿,作者:港大MMLAB金伟阳今天带来的是来自香港大学MMLab实验室最新的统一多模态大模型框架 SRUM[1],代码与模型已在 Github[2] 和 HF[3] 开源。背景在通往
阅读全文探索前沿,共塑未来。SGLang 社区与亚马逊云科技强强联合,将于2025年10月25日在中国北京共同举办 SGLang Meetup。本次活动将汇聚核心贡献者与行业伙伴,深度剖析 SGLang 在大
阅读全文> 作者:李剑锋前言在之前的课程中,我们一直聚焦在如何快速搭建一个大模型应用来辅助工作与生活。但很多人往往忽略了一个同样关键的环节——大模型的监控。众所周知,大语言模型(LLMs)本质上是一个黑盒神经
阅读全文> 本文来自社区投稿,作者:Ruihang Xu在图片生成领域,如何从基础的“能生”,发展到更高层次的“精准可控”,一直是行业关注的重点。特别是对于复杂场景下的多实例图像生成(Multi-Instan
阅读全文> 原创作者:机智流编辑部近年来,多模态大语言模型(Multimodal Large Language Models, MLLMs)在图文理解、视觉问答等任务上取得了令人瞩目的进展。然而,当面对需要精
阅读全文> 本文来自社区投稿,作者:邬雨航今天要分享给大家的这篇论文聚焦大型语言模型(LLMs)的安全漏洞,提出了全新的越狱攻击范式与防御策略,深入剖析了模型在生成过程中的注意力变化规律,为LLMs安全研究提
阅读全文2025湾芯展现场,新凯来受关注。图源:科技日报> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对在2025年10月15日开幕的湾区半导体产业生态博览会(湾芯展)上,深圳市万里眼技术有限
阅读全文> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对在多模态大模型(Large Multimodal Models, LMMs)日益普及的今天,用户对响应速度的要求却愈发严苛。然而,现有推
阅读全文> 本文转载自「上海模速空间大模型创新生态社区」-- 完 --机智流推荐阅读:1. LangChain 稳定版 v1.0 即将上线:旧链消失,新链让大模型开发更简单2. JanusVLN:阿里高德和
阅读全文> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对经常关注我们的朋友知道,昨天我们发布了一份 ICLR-2026 论文洞察报告。报告分析了当前机器学习领域的研究趋势、热点和未来方向,以及
阅读全文策划|QCon 全球软件开发大会编辑|Kitty当 AI 技术的兴奋期渐退,工程化的深水区已然到来。真正的挑战不再是构建概念验证,而是如何将智能可靠、高效、安全地注入企业核心系统的运行底座。在这场深刻
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对前言本文章旨在矩阵乘法及其在许多深度学习操作中的应用。这些实现是全连接层、卷积层和循环层等优良性能的基础,其中包括其他可能的
阅读全文在文字诞生之前,人类通过对话交换情感和思想——充满温度与实时反馈。今天,AI 与实时互动技术正引领一场「对话式社会」复兴,让沟通回归本能。从智能终端、儿童 AI 导师到智能客服,语音交互技术正让「对话
阅读全文> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对在当今人工智能领域,“越大越好”似乎已成为默认共识:千亿参数、万亿token训练、超大规模推理……然而,一篇来自三星SAIL蒙特利尔实验
阅读全文今年 5 月,OpenAI 以 65 亿美元收购了由传奇苹果设计师 Jony Ive 与 OpenAI CEO Sam Altman 联合创立的初创公司 io,正式宣告 OpenAI 开拓硬件版图的野
阅读全文> 作者:Rikki如果你关注机器人领域,可能会发现一个有趣的趋势:越来越多的四足机器人开始“听懂人话”“看懂世界”,能根据语言指令完成导航、避障甚至抓取等任务。这背后,多模态大语言模型(MLLM)功
阅读全文> 论文选自 HuggingFace 每日论文,解读由 Intern-S1 等 AI 生成今天为大家精选了今日Hugging Face热门论文,涵盖语言智能体、多模态推理、科学发现与视觉生成等
阅读全文作者:李剑锋简介早在 LangChain 0.2 版本时,LCEL(LangChain Expression Language) 作为 LangChain 推出的声明式语言,就已开始被大力推广。它的诞
阅读全文本文来自社区投稿引言视觉-语言导航(Vision-and-Language Navigation, VLN)作为具身智能的关键研究领域,旨在使智能体能够根据自然语言指令在复杂的真实世界环境中自主导航。
阅读全文本文由 Intern-S1 等 AI 生成,机智流编辑部校对最近,Bloomberg记者Mark Gurman的报道引发了苹果公司高层变动的大讨论:现任CEO蒂姆·库克(Tim Cook)可能在未来几
阅读全文本文翻译自|https://www.nobelprize.org/prizes/chemistry/2025/popular-information/瑞典皇家科学院决定将 2025 年化学奖授予北川进
阅读全文