刚刚,梁文锋署名,DeepSeek元旦新论文要开启架构新篇章
> 本文转载自机器之心,作者:机器之心编辑部新年第一天,DeepSeek 发布了一篇新论文,提出了一种名为 mHC (流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题
阅读全文> 本文转载自机器之心,作者:机器之心编辑部新年第一天,DeepSeek 发布了一篇新论文,提出了一种名为 mHC (流形约束超连接)的新架构。该研究旨在解决传统超连接在大规模模型训练中的不稳定性问题
阅读全文图片由AI生成在自动驾驶、工业控制、机器人等时间关键系统(time-critical systems)中,大语言模型(LLM)的推理必须在严格的时间预算内完成——晚 1 秒,可能就是事故。然而,LLM
阅读全文多年后回望当下,2025年可能会被铭记为AI新纪元的黎明。模型性能因创新而飞跃,AI驱动的应用已成为不可或缺的存在,顶尖公司为争夺技术人才展开激烈竞争,基础设施建设则推动了美国GDP的增长。今天这篇文
阅读全文> 本文来自社区投稿,作者:Trae1ounG图片由AI生成当前,大模型+强化学习成为AI领域极为热门的研究。现有的强化学习(RL)方法通常将大语言模型(LLM)视为一个单一的整体策略进行优化,主要的
阅读全文一句话总结:该综述系统梳理了 RAG 技术的发展脉络,从早期开放域问答任务中的原型,到近年来多领域大规模应用的系统化演化,进行了全面而深入的总结。在前文中,我们已系统介绍了:RAG 是什么、为什么需要
阅读全文> 本文由 Intern-S1 等 AI 生成,机智流编辑部校对2025年12月23日,SpecForge团队联合蚂蚁集团AQ团队、美团、Nex-AGI、EigenAI等多家行业伙伴,正式推出Spec
阅读全文图片由 AI 生成在人工智能领域,训练能在复杂环境中自主决策的多模态智能体一直是研究热点。这类智能体基于视觉-语言模型(VLM),需要具备感知、推理和行动能力,但在多轮交互任务中,稀疏奖励和长程信用分
阅读全文2025年即将收尾,这一年,AI席卷千行百业,你是被浪潮推着走,还是主动握住了桨?12月28日下午,我们邀请数位身处AI浪潮中的行动者——从连续创业者、AI创作者、硬件极客到产品主理人相聚模速空间。他
阅读全文图:Scarlett荷淼、Sunny林琅 文:水中鱼、Kelen-- 完 --机智流推荐阅读:1. 规划能力远超GPT-4近30个基点!港科广等团队解锁 AI 物理智能新路径,机器人操控再升级2.
阅读全文图片由AI生成当你戴着运动相机做饭、修理家电时,镜头记录下的不仅是动作,更是“眼睛看到的场景+大脑的决策+手部的交互”——这种第一人称(自我中心)视角的体验,正是人形机器人最需要的“生存技能”。毕竟,
阅读全文> 本文转载自「OpenBMB」近年来,大语言模型(LLMs)在问答、推理与生成任务中展现出卓越能力,但其幻觉(Hallucination)问题仍然是制约实际应用的核心挑战之一。模型有时会在缺乏事实依
阅读全文一句话总结:上海交通大学与滴滴联合团队的自动驾驶综述提出 “通用端到端自动驾驶(GE2E)” 统一分析框架,系统梳理三大技术范式的技术脉络、共性挑战与性能差异,并展望了融合基础模型、智能体架构、世界模
阅读全文刚结束 11 月上海首场的圆满相聚,现场留下了许多精彩的瞬间!综合众多社区伙伴的建议,现开启 不卷算力卷效率!HAMi Meetup 北京站 报名。北京——这座聚合科研引擎、产业集群与前沿技术思潮的城
阅读全文图片由AI生成在大模型迈向“全能”的时代,Any-to-Any 多模态模型正迅速崛起——它们不仅能理解文本、图像、视频、音频等多种输入,还能生成文本、图像、语音等任意组合的输出。然而,这类模型的复杂异
阅读全文> 本文转载自「沐曦股份MetaX」1前言01版本概述与核心定位近期,沐曦股份发布了MXMACA软件栈(以下简称“MACA”)的3.3.0.X版本,MACA套件是面向沐曦曦云C系列、曦思N系列GPU研
阅读全文一句话总结:这篇由多所顶尖研究机构联合发布的综述,明晰了智能体记忆与LLM记忆、RAG、上下文工程的边界与联系,提出了“形态-功能-动态”三维框架,系统解构了AI智能体记忆系统的完整蓝图,为构建真正具
阅读全文2025年的最后一个月,AI领域的目光再次聚焦PyTorch社区。作为全球最具活力的开源AI框架生态之一,PyTorch在12月交出了一份含金量十足的答卷:核心工具链完成里程碑式整合、国际顶级会议大放
阅读全文-- 完 --机智流推荐阅读:1. 95%越狱成功率!佐治亚理工与清华联手发布新型攻击框架,最强大模型无一幸免2. 2025最新rag综述(2)——RAG技术发展流程、最新技术挑战与系统级优化3.
阅读全文在AI助手日益融入我们数字生活的今天,你是否想过,未来的AI不仅能与你对话,还能像真人一样操作你的手机或电脑,替你完成从点外卖、订机票到处理文档等一系列任务?前段时间,字节旗下、和中兴合作的豆包AI手
阅读全文一同探索语音驱动的下一代人机交互界面。2025 年 RTE 开发者社区的收官活动,将再次落地硬件之都深圳,一起畅想 2026!聚焦「对话式 AI+硬件」主题, 来自通义百聆 Fun-CosyVoice
阅读全文> 作者:李剑锋前言在构建大模型应用的过程中,模型通常不是简单地一问一答,而是会经历:多轮 LLM 调用工具调用(Tool Calling)RAG 检索、数据库查询中间提示词生成、结构化输出处理这些复
阅读全文> 本文来自社区投稿在AI席卷各行各业的今天,体育圈的“智能化”走到哪一步了?现有的智能体育系统,大多还停留在“打分+可视化”的阶段。屏幕上画出的骨骼线很酷,但对于运动员和教练来说,往往面临一个尴尬的
阅读全文当我们用手机拍摄一段 "拿起杯子放进抽屉" 的视频时,大脑能瞬间从 2D 画面中捕捉到杯子的位置、距离、手的运动轨迹等 3D 空间信息。但对于依赖视觉-语言-动作(VLA)模型的机器人来说,这却是一个
阅读全文在大模型快速演进的过程中,评测成为衡量模型能力不可或缺的“标尺”。模型究竟具备哪些能力、存在哪些短板,以及在复杂场景下是否足够稳定,仅凭参数规模或模型结构难以给出明确答案,仍需依托系统化的评测基准与多
阅读全文图片由AI生成在大模型推理系统中,输入/输出长度高度动态、注意力掩码结构复杂多变、Prefill/Decode/Verify 阶段混合调度等问题,正严重制约 AI 加速器(尤其是华为昇腾 NPU等基于
阅读全文自 2023 年底书生大模型实战营推出以来,已有五期学员共同进行了学习和开发实践,吸引超过 25 万人次 在线学习,孵化出近 1500 个创意项目。书生大模型实战营第 6 期全面升级,本次课程将在 A
阅读全文警告:本文包含可能具有冒犯性和有害性的内容!近日,来自佐治亚理工学院、伊利诺伊大学厄巴纳-香槟分校(UIUC)、清华大学、IBM研究院等多家顶尖机构的研究团队,联合发布了一种名为 CKA-Agent[
阅读全文一句话总结:该综述系统梳理了 RAG 技术的发展脉络,从早期开放域问答任务中的原型,到近年来多领域大规模应用的系统化演化,进行了全面而深入的总结。前文速览:RAG 是当前提升大语言模型回答质量与准确性
阅读全文2020 年 11 月 19 日,Hugging Face 发布了 Transformers v4 的首个候选版本,彼时这个 AI 模型定义库的日安装量仅 2 万次,支持的模型架构不过 40 种,社区
阅读全文昨晚我们刚说到Cursor提前泄露GPT-5.2,今天(当地时间12月11号)OpenAI就正式放出了这款被定位为“迄今最强专业知识工作模型”的新系统GPT-5.2[1],已全面向ChatGPT订阅用
阅读全文