上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型
> 本文转载自机器之心程爽,上海人工智能实验室和浙江大学联培博士生一年级;卞一涵,美国马里兰大学硕士生二年级,上海人工智能实验室实习生;刘大卫,上海人工智能实验室和上海交通大学联培博士生一年级;齐弼卿
阅读全文> 本文转载自机器之心程爽,上海人工智能实验室和浙江大学联培博士生一年级;卞一涵,美国马里兰大学硕士生二年级,上海人工智能实验室实习生;刘大卫,上海人工智能实验室和上海交通大学联培博士生一年级;齐弼卿
阅读全文在大模型推理成本居高不下的今天,长上下文(Long-Context)应用正成为行业刚需——从百万字文档分析到复杂推理任务,用户对模型“记忆力”的要求越来越高。然而,传统Transformer架构下的K
阅读全文大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,本文我们来看看「Math」方向的部分论文。(1) M
阅读全文在AI领域,大模型的"终身学习"能力一直是业界追求的核心目标:我们期待AI能像人类一样,在不断吸收新知识、新技能的同时,不丢失过往积累的能力。但现实往往不尽如人意:当大模型通过微调更新新数据时,极易出
阅读全文原文链接:https://www.trainy.ai/blog/gpu-utilization-misleading前言机器学习团队评估 GPU 使用情况的最常见指标是 GPU 利用率,通常通过终端运
阅读全文大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,本文我们来看看「Code」方向的部分论文。Janus
阅读全文大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,今天我们来看看「AI 视频生成」方向的论文。(1)
阅读全文大家好我是 「PaperScope.ai | P 站站长」闻星,10 月有 945 篇论文提交到 Hugging Face Daily Paper,本文我们来看看「AI For Science」方向的
阅读全文大家好我是 「PaperScope.ai | P 站站长」闻星,本周将会从各个维度盘点 10 月 Hugging Face Daily Paper,截止到撰写本文的时间 10 月已有 936 篇论文提
阅读全文> 作者:李剑锋简介前情回顾在上节课(LangChain V1.0 深度解析:手把手带你跑通全新智能体架构)其实我们就已经讲述了关于 ReAct 的基本框架。那因为这节课要讲的 MiddleWare
阅读全文大家好我是 「PaperScope.ai | P 站站长」,10 月底了又到了盘点 Hugging Face 每月论文盘点分析时间!截止 10 月 30 日 Hugging Face Daily Pa
阅读全文在AI智能体迅猛发展的当下,图形用户界面(GUI)定位技术正成为通往通用智能的关键一环。相信不少人像小编一样,希望只需要语音发出指令“找附近奶茶店下单20杯并用优惠券”,AI 智能体就能自动实现跳过广
阅读全文赛事背景作为第八届CCF开源创新大赛的常规赛的赛题之一,第八届CCF开源创新大赛专项赛题 —— “开源GPU创新生态赛(常规赛)”第一期即将开启。本届大赛由中国计算机学会(CCF)主办,开源发展技术委
阅读全文对话式 AI 和对话式人类聚集!2025 年 10 月 31 日~11 月 1 日,由声网和 RTE 开发者社区联合主办的 Convo AI&RTE2025「实时互联网大会暨对话式 AI 论坛」将在北
阅读全文尽管如今大模型如雨后春笋般涌现,但现实却很骨感:绝大多数模型调用稀疏、请求突发性强,导致大量 GPU 长期“空转”——17.7%的 GPU 仅处理 1.35%的请求,资源利用率惨不忍睹。面对这一行业痛
阅读全文> 本文由上海 AI Lab 联合其他团队投稿当Agent学会了自我进化,我们距离AGI还有多远?这曾是科幻小说里的情节,如今正成为现实。从自动编写代码、做实验到扮演客服,能够通过与环境的持续互动,不
阅读全文10 月 31 日,北京,来 RTE2025 大会,试玩全球首款 AI 主题语言类桌游《Talk With》!睡不着?想恋爱?开车犯困?…… 都是聊天能解决的事儿!玩家在《Talk With》里会面临
阅读全文> 本文作者:机智流编辑部MiniMax[1](国内名称海螺)近两年在“可落地的智能体(Agent)”方向上动作频繁:一边迭代通用/多模态基础模型线(Text、Speech、Video 等),一边把这
阅读全文大家好,我是「PaperScope.ai | P站·站长」闻星!本文将给大家分享在 ICCV 2025 中看到的多模态大模型与视觉理解相关论文!在正式开始前,站长来简单介绍一下在 P 站检索到的字节各
阅读全文全球范围内心理与精神健康问题,已经成为越来越紧迫的公共卫生挑战,而专业的心理与精神健康服务资源仍然严重短缺与分布不均。近来大模型技术和能力越来越强,有望成为提升心理与精神健康服务可及性与效率的强大助推
阅读全文大家好,我是「PaperScope.ai | P站·站长」闻星!图片生成/视频生成作为商业化想象力非常高的 AI 赛道,让我们看看手握抖音短视频超级入口的字节在 ICCV 2025 上发表了哪些有意思
阅读全文> 本文由社区投稿,作者单位:上海人工智能实验室引言当你向AI咨询健康问题或寻求建议时,是否想过——它可能正在“违背本心”地欺骗你?最近一项由上海人工智能实验,复旦大学,中科大和上海交通大学联合发布的
阅读全文ICCV 2025 中看到了 11 篇 腾讯 ARC Lab 相关论文,分享给大家!腾讯ARC Lab致力于探索和挑战前沿技术,站在腾讯探索挑战多模态理解和生成相关前沿技术的第一线。ARC(Appli
阅读全文> 本文来自社区投稿,作者:廖康图一:展示我们模型多样化能力的示意图。模型统一了以相机为中心的多模态理解与生成,支持空间想象,并实现灵活的跨视角应用如世界探索等论文标题:Thinking with C
阅读全文> 作者:李剑锋LangChain V1.0 简介终于,万众瞩目的 LangChain V1.0 版本正式发布了!其实在“剑锋小课堂”这个专栏中,我花费了大量的篇幅去介绍关于 LangChain 框架
阅读全文(1) R1-Onevision: Advancing Generalized Multimodal Reasoning through Cross-Modal Formalization论文简介:由
阅读全文> 作者:yanbo新闻资讯1. DeepSeek再开源:发布3B混合专家OCR模型“DeepSeek-OCR”DeepSeek正式推出视觉文本压缩模型 DeepSeek-OCR,参数量仅3B,却采
阅读全文在 ICCV 2025 中看到了 6 篇“腾讯混元”团队相关的论文推荐给大家!(1) SVG-Head: Hybrid Surface-Volumetric Gaussians for High-Fi
阅读全文(1) LightMem: Lightweight and Efficient Memory-Augmented Generation论文 ID:2510.18866论文简介:由浙江大学、新加坡国立大
阅读全文在大模型(Large Language Model, LLM)深度融入日常交互的今天,用户对 AI 响应速度的要求越来越高:既要“秒回”(低Time-to-First-Token, TTFT),又要“
阅读全文