实测MiniMax M2:与商业闭源有差距,但基本够用!
> 本文作者:机智流编辑部MiniMax[1](国内名称海螺)近两年在“可落地的智能体(Agent)”方向上动作频繁:一边迭代通用/多模态基础模型线(Text、Speech、Video 等),一边把这
阅读全文> 本文作者:机智流编辑部MiniMax[1](国内名称海螺)近两年在“可落地的智能体(Agent)”方向上动作频繁:一边迭代通用/多模态基础模型线(Text、Speech、Video 等),一边把这
阅读全文大家好,我是「PaperScope.ai | P站·站长」闻星!本文将给大家分享在 ICCV 2025 中看到的多模态大模型与视觉理解相关论文!在正式开始前,站长来简单介绍一下在 P 站检索到的字节各
阅读全文全球范围内心理与精神健康问题,已经成为越来越紧迫的公共卫生挑战,而专业的心理与精神健康服务资源仍然严重短缺与分布不均。近来大模型技术和能力越来越强,有望成为提升心理与精神健康服务可及性与效率的强大助推
阅读全文大家好,我是「PaperScope.ai | P站·站长」闻星!图片生成/视频生成作为商业化想象力非常高的 AI 赛道,让我们看看手握抖音短视频超级入口的字节在 ICCV 2025 上发表了哪些有意思
阅读全文> 本文由社区投稿,作者单位:上海人工智能实验室引言当你向AI咨询健康问题或寻求建议时,是否想过——它可能正在“违背本心”地欺骗你?最近一项由上海人工智能实验,复旦大学,中科大和上海交通大学联合发布的
阅读全文ICCV 2025 中看到了 11 篇 腾讯 ARC Lab 相关论文,分享给大家!腾讯ARC Lab致力于探索和挑战前沿技术,站在腾讯探索挑战多模态理解和生成相关前沿技术的第一线。ARC(Appli
阅读全文> 本文来自社区投稿,作者:廖康图一:展示我们模型多样化能力的示意图。模型统一了以相机为中心的多模态理解与生成,支持空间想象,并实现灵活的跨视角应用如世界探索等论文标题:Thinking with C
阅读全文> 作者:李剑锋LangChain V1.0 简介终于,万众瞩目的 LangChain V1.0 版本正式发布了!其实在“剑锋小课堂”这个专栏中,我花费了大量的篇幅去介绍关于 LangChain 框架
阅读全文(1) R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization论文简介:由
阅读全文> 作者:yanbo新闻资讯1. DeepSeek再开源:发布3B混合专家OCR模型“DeepSeek-OCR”DeepSeek正式推出视觉文本压缩模型 DeepSeek-OCR,参数量仅3B,却采
阅读全文在 ICCV 2025 中看到了 6 篇“腾讯混元”团队相关的论文推荐给大家!(1) SVG-Head: Hybrid Surface-Volumetric Gaussians for High-Fi
阅读全文(1) LightMem: Lightweight and Efficient Memory-Augmented Generation论文 ID:2510.18866论文简介:由浙江大学、新加坡国立大
阅读全文在大模型(Large Language Model, LLM)深度融入日常交互的今天,用户对 AI 响应速度的要求越来越高:既要“秒回”(低Time-to-First-Token, TTFT),又要“
阅读全文> 本文来自社区投稿,作者:孟祥玉本篇分享论文《Identity-GRPO: Optimizing Multi-Human Identity-preserving Video Generation v
阅读全文近期 Andrej Karpathy 与播客主持人 Dwarkesh Patel 的两小时访谈[1]引发科技圈震动,播放量半天内突破 130 万次。Andrej Karpathy 是人工智能领域的知名
阅读全文(1) QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs论文 ID:2510.116
阅读全文引言PaddleOCR-VL 来了!它是百度飞桨团队最新推出的超轻量视觉语言模型(VLM),以仅 0.9 亿参数的紧凑设计,在全球多模态文档解析评测榜 OmniDocBench v1.5 上以 92.
阅读全文上新 ICCV 2025 专区,收录 2702 篇 ICCV 论文,并使用科学能力超强的 Intern-S1 生成了 2702 篇「图文并茂」的解读博客以及「中英文」对照的 PDF 翻译。https
阅读全文> 本文来自社区投稿,作者:港大MMLAB金伟阳今天带来的是来自香港大学MMLab实验室最新的统一多模态大模型框架 SRUM[1],代码与模型已在 Github[2] 和 HF[3] 开源。背景在通往
阅读全文探索前沿,共塑未来。SGLang 社区与亚马逊云科技强强联合,将于2025年10月25日在中国北京共同举办 SGLang Meetup。本次活动将汇聚核心贡献者与行业伙伴,深度剖析 SGLang 在大
阅读全文> 作者:李剑锋前言在之前的课程中,我们一直聚焦在如何快速搭建一个大模型应用来辅助工作与生活。但很多人往往忽略了一个同样关键的环节——大模型的监控。众所周知,大语言模型(LLMs)本质上是一个黑盒神经
阅读全文> 本文来自社区投稿,作者:Ruihang Xu在图片生成领域,如何从基础的“能生”,发展到更高层次的“精准可控”,一直是行业关注的重点。特别是对于复杂场景下的多实例图像生成(Multi-Instan
阅读全文> 原创作者:机智流编辑部近年来,多模态大语言模型(Multimodal Large Language Models, MLLMs)在图文理解、视觉问答等任务上取得了令人瞩目的进展。然而,当面对需要精
阅读全文> 本文来自社区投稿,作者:邬雨航今天要分享给大家的这篇论文聚焦大型语言模型(LLMs)的安全漏洞,提出了全新的越狱攻击范式与防御策略,深入剖析了模型在生成过程中的注意力变化规律,为LLMs安全研究提
阅读全文2025湾芯展现场,新凯来受关注。图源:科技日报> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对在2025年10月15日开幕的湾区半导体产业生态博览会(湾芯展)上,深圳市万里眼技术有限
阅读全文> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对在多模态大模型(Large Multimodal Models, LMMs)日益普及的今天,用户对响应速度的要求却愈发严苛。然而,现有推
阅读全文> 本文转载自「上海模速空间大模型创新生态社区」-- 完 --机智流推荐阅读:1. LangChain 稳定版 v1.0 即将上线:旧链消失,新链让大模型开发更简单2. JanusVLN:阿里高德和
阅读全文> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对经常关注我们的朋友知道,昨天我们发布了一份 ICLR-2026 论文洞察报告。报告分析了当前机器学习领域的研究趋势、热点和未来方向,以及
阅读全文策划|QCon 全球软件开发大会编辑|Kitty当 AI 技术的兴奋期渐退,工程化的深水区已然到来。真正的挑战不再是构建概念验证,而是如何将智能可靠、高效、安全地注入企业核心系统的运行底座。在这场深刻
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对前言本文章旨在矩阵乘法及其在许多深度学习操作中的应用。这些实现是全连接层、卷积层和循环层等优良性能的基础,其中包括其他可能的
阅读全文