全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型

    作者:机智流发布日期:2025-11-05 22:56:23

    > 本文转载自机器之心程爽,上海人工智能实验室和浙江大学联培博士生一年级;卞一涵,美国马里兰大学硕士生二年级,上海人工智能实验室实习生;刘大卫,上海人工智能实验室和上海交通大学联培博士生一年级;齐弼卿

    阅读全文
  • 文章封面

    聊聊大模型推理系统之SparseServe:HBM-DRAM分层存储实现3.14倍吞吐,首Token延迟降低89%

    作者:机智流发布日期:2025-11-04 21:32:44

    在大模型推理成本居高不下的今天,长上下文(Long-Context)应用正成为行业刚需——从百万字文档分析到复杂推理任务,用户对模型“记忆力”的要求越来越高。然而,传统Transformer架构下的K

    阅读全文
  • 文章封面

    10 月 Hugging Face「Math」方向论文|MathCanvas、MATH-Beyond、AMO-Bench等

    作者:机智流发布日期:2025-11-04 21:32:44

    大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,本文我们来看看「Math」方向的部分论文。(1) M

    阅读全文
  • 文章封面

    让AI模型永不遗忘新知识?Meta FAIR与UC Berkeley联手提出“稀疏内存微调”

    作者:机智流发布日期:2025-11-03 22:34:10

    在AI领域,大模型的"终身学习"能力一直是业界追求的核心目标:我们期待AI能像人类一样,在不断吸收新知识、新技能的同时,不丢失过往积累的能力。但现实往往不尽如人意:当大模型通过微调更新新数据时,极易出

    阅读全文
  • 文章封面

    别被 100% 骗了:GPU 利用率背后的真相

    作者:机智流发布日期:2025-11-02 21:51:13

    原文链接:https://www.trainy.ai/blog/gpu-utilization-misleading前言机器学习团队评估 GPU 使用情况的最常见指标是 GPU 利用率,通常通过终端运

    阅读全文
  • 文章封面

    10 月 Hugging Face「Code」方向论文|JanusCoder、Diff-XYZ、LongCodeZip 等

    作者:机智流发布日期:2025-11-02 21:51:13

    大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,本文我们来看看「Code」方向的部分论文。Janus

    阅读全文
  • 文章封面

    10月 Hugging Face「视频生成」方向论文|字节跳动、快手等火力全开!

    作者:机智流发布日期:2025-11-01 21:05:41

    大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,今天我们来看看「AI 视频生成」方向的论文。(1)

    阅读全文
  • 文章封面

    10 月 Hugging Face「AI For Science」方向论文|SciVideoBench、NewtonBench等

    作者:机智流发布日期:2025-11-01 21:05:41

    大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,本文我们来看看「AI For Science」方向的

    阅读全文
  • 文章封面

    10 月 HuggingFace 论文 TOP 50|BDH、MCPMark、QeRL、D2E 等

    作者:机智流发布日期:2025-10-31 20:34:57

    大家好我是 「PaperScope.ai | P 站站长」闻星,本周将会从各个维度盘点 10 月 Hugging Face Daily Paper,截止到撰写本文的时间 10 月已有 936 篇论文提

    阅读全文
  • 文章封面

    万字长文!深度解析 LangChain V1.0 Middleware:打造可控可审的智能体架构

    作者:机智流发布日期:2025-10-30 23:45:05

    > 作者:李剑锋简介前情回顾在上节课(LangChain V1.0 深度解析:手把手带你跑通全新智能体架构)其实我们就已经讲述了关于 ReAct 的基本框架。那因为这节课要讲的 MiddleWare

    阅读全文
  • 文章封面

    10月Hugging Face论文盘点(一):核心洞察与总体趋势

    作者:机智流发布日期:2025-10-30 23:45:05

    大家好我是 「PaperScope.ai | P 站站长」,10 月底了又到了盘点 Hugging Face 每月论文盘点分析时间!截止 10 月 30 日 Hugging Face Daily Pa

    阅读全文
  • 文章封面

    阿里通义&人大新作UI-Ins:让指令学会推理的下一代GUI基础模型,解锁GUI智能体推理新范式

    作者:机智流发布日期:2025-10-29 23:59:16

    在AI智能体迅猛发展的当下,图形用户界面(GUI)定位技术正成为通往通用智能的关键一环。相信不少人像小编一样,希望只需要语音发出指令“找附近奶茶店下单20杯并用优惠券”,AI 智能体就能自动实现跳过广

    阅读全文
  • 文章封面

    19万奖金虚位以待!开源GPU创新生态赛常规赛报名启动!

    作者:机智流发布日期:2025-10-29 23:59:16

    赛事背景作为第八届CCF开源创新大赛的常规赛的赛题之一,第八届CCF开源创新大赛专项赛题 —— “开源GPU创新生态赛(常规赛)”第一期即将开启。本届大赛由中国计算机学会(CCF)主办,开源发展技术委

    阅读全文
  • 文章封面

    Last Call!对话式 AI 和对话式人类聚集!RTE Open Day@RTE2025,10.31/11.1,北京

    作者:机智流发布日期:2025-10-29 23:59:16

    对话式 AI 和对话式人类聚集!2025 年 10 月 31 日~11 月 1 日,由声网和 RTE 开发者社区联合主办的 Convo AI&RTE2025「实时互联网大会暨对话式 AI 论坛」将在北

    阅读全文
  • 文章封面

    聊聊大模型推理系统之Aegaeon:用Token级自动扩缩容实现单GPU服务7个模型高效并发推理!

    作者:机智流发布日期:2025-10-28 21:45:00

    尽管如今大模型如雨后春笋般涌现,但现实却很骨感:绝大多数模型调用稀疏、请求突发性强,导致大量 GPU 长期“空转”——17.7%的 GPU 仅处理 1.35%的请求,资源利用率惨不忍睹。面对这一行业痛

    阅读全文
  • 文章封面

    你的Agent可能在“错误进化”!上海AI Lab&上交&普林斯顿 揭示自进化智能体失控风险

    作者:机智流发布日期:2025-10-28 21:45:00

    > 本文由上海 AI Lab 联合其他团队投稿当Agent学会了自我进化,我们距离AGI还有多远?这曾是科幻小说里的情节,如今正成为现实。从自动编写代码、做实验到扮演客服,能够通过与环境的持续互动,不

    阅读全文
  • 文章封面

    就在本周五!全球首款 AI 主题桌游试玩会丨Convo AI&RTE2025

    作者:机智流发布日期:2025-10-28 21:45:00

    10 月 31 日,北京,来 RTE2025 大会,试玩全球首款 AI 主题语言类桌游《Talk With》!睡不着?想恋爱?开车犯困?…… 都是聊天能解决的事儿!玩家在《Talk With》里会面临

    阅读全文
  • 文章封面

    实测MiniMax M2:与商业闭源有差距,但基本够用!

    作者:机智流发布日期:2025-10-27 23:29:36

    > 本文作者:机智流编辑部MiniMax[1](国内名称海螺)近两年在“可落地的智能体(Agent)”方向上动作频繁:一边迭代通用/多模态基础模型线(Text、Speech、Video 等),一边把这

    阅读全文
  • 文章封面

    ICCV 25「字节跳动」多模态理解相关论文|D-Attn、Dynamic-VLM、SpatialTrackerV2等

    作者:机智流发布日期:2025-10-26 21:59:31

    大家好,我是「PaperScope.ai | P站·站长」闻星!本文将给大家分享在 ICCV 2025 中看到的多模态大模型与视觉理解相关论文!在正式开始前,站长来简单介绍一下在 P 站检索到的字节各

    阅读全文
  • 文章封面

    线下活动报名|AI for Mental Health主题前沿论坛

    作者:机智流发布日期:2025-10-26 21:59:31

    全球范围内心理与精神健康问题,已经成为越来越紧迫的公共卫生挑战,而专业的心理与精神健康服务资源仍然严重短缺与分布不均。近来大模型技术和能力越来越强,有望成为提升心理与精神健康服务可及性与效率的强大助推

    阅读全文
  • 文章封面

    ICCV 25「字节」图片生成/视频生成 相关论文(24 篇)|极具商业化想象力的赛道

    作者:机智流发布日期:2025-10-25 21:02:03

    大家好,我是「PaperScope.ai | P站·站长」闻星!图片生成/视频生成作为商业化想象力非常高的 AI 赛道,让我们看看手握抖音短视频超级入口的字节在 ICCV 2025 上发表了哪些有意思

    阅读全文
  • 文章封面

    仅1%的“脏数据”就能教坏AI?上海AILab等研究揭示大模型如何学会隐瞒与欺骗

    作者:机智流发布日期:2025-10-25 21:02:03

    > 本文由社区投稿,作者单位:上海人工智能实验室引言当你向AI咨询健康问题或寻求建议时,是否想过——它可能正在“违背本心”地欺骗你?最近一项由上海人工智能实验,复旦大学,中科大和上海交通大学联合发布的

    阅读全文
  • 文章封面

    ICCV 25「腾讯 ARC Lab」相关论文| Mamba-3VL、VisionMath、Moto

    作者:机智流发布日期:2025-10-24 22:46:35

    ICCV 2025 中看到了 11 篇 腾讯 ARC Lab 相关论文,分享给大家!腾讯ARC Lab致力于探索和挑战前沿技术,站在腾讯探索挑战多模态理解和生成相关前沿技术的第一线。ARC(Appli

    阅读全文
  • 文章封面

    当空间智能大模型“与相机共思”:从任意视角理解和创造世界的统一多模态架构

    作者:机智流发布日期:2025-10-24 22:46:35

    > 本文来自社区投稿,作者:廖康图一:展示我们模型多样化能力的示意图。模型统一了以相机为中心的多模态理解与生成,支持空间想象,并实现灵活的跨视角应用如世界探索等论文标题:Thinking with C

    阅读全文
  • 文章封面

    LangChain V1.0 深度解析:手把手带你跑通全新智能体架构

    作者:机智流发布日期:2025-10-23 20:00:00

    > 作者:李剑锋LangChain V1.0 简介终于,万众瞩目的 LangChain V1.0 版本正式发布了!其实在“剑锋小课堂”这个专栏中,我花费了大量的篇幅去介绍关于 LangChain 框架

    阅读全文
  • 文章封面

    ICCV 25 「腾讯微信」团队相关论文|WalkVLM、Morph、MCID 等

    作者:机智流发布日期:2025-10-23 20:00:00

    (1) R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization论文简介:由

    阅读全文
  • 文章封面

    1023晚报:百度登顶、智谱推出最强Agent化编程平台、Deepseek和Qwen再次开源、鱼皮团队发布沉浸式AI模拟面试平台

    作者:机智流发布日期:2025-10-23 20:00:00

    > 作者:yanbo新闻资讯1. DeepSeek再开源:发布3B混合专家OCR模型“DeepSeek-OCR”DeepSeek正式推出视觉文本压缩模型 DeepSeek-OCR,参数量仅3B,却采

    阅读全文
  • 文章封面

    ICCV 25「腾讯混元」相关论文|SVG-Head、RomanTex、MaterialMVP、SparseMM等

    作者:机智流发布日期:2025-10-22 22:31:33

    在 ICCV 2025 中看到了 6 篇“腾讯混元”团队相关的论文推荐给大家!(1) SVG-Head: Hybrid Surface-Volumetric Gaussians for High-Fi

    阅读全文
  • 文章封面

    HF今日推荐论文20篇|浙大LightMem三阶段记忆模型效率暴增117倍!MIT世界模型闭环评测,复旦多模态基准革新

    作者:机智流发布日期:2025-10-22 22:31:33

    (1) LightMem: Lightweight and Efficient Memory-Augmented Generation论文 ID:2510.18866论文简介:由浙江大学、新加坡国立大

    阅读全文
  • 文章封面

    聊聊大模型推理系统之TokenFlow:用“抢占式调度+写通缓存”实现高并发下P99延迟暴降80%

    作者:机智流发布日期:2025-10-21 21:43:35

    在大模型(Large Language Model, LLM)深度融入日常交互的今天,用户对 AI 响应速度的要求越来越高:既要“秒回”(低Time-to-First-Token, TTFT),又要“

    阅读全文
上一页下一页