CVPR2025 | 清北等提出UniAct:通过构建通用动作空间,让具身智能通用化离我们又近了一步
作者:周善斌全文约 2400 字,预计阅读时间 6 分钟在自然语言处理与计算机视觉领域,大规模基础模型通过互联网级数据训练展现出强大的泛化能力。然而,这一成功经验在具身智能领域却遭遇显著挑战:不同机器
阅读全文作者:周善斌全文约 2400 字,预计阅读时间 6 分钟在自然语言处理与计算机视觉领域,大规模基础模型通过互联网级数据训练展现出强大的泛化能力。然而,这一成功经验在具身智能领域却遭遇显著挑战:不同机器
阅读全文全文约 1400 字,预计阅读时间 3 分钟新闻资讯1. MiniMax发布MiniMax-M1开源混合注意力推理模型2025年6月17日,上海AI公司MiniMax正式开源其混合注意力推理模型Min
阅读全文全文约 1600 字,预计阅读时间 5 分钟在大语言模型(LLM)日益普及的今天,如何高效地为数百万用户提供服务成为了一个关键挑战。传统的试错方法不仅耗时且成本高昂,而现有的理论模型又难以准确预测复杂
阅读全文作者:InternLM、Qwen 等 LLM全文约 4400 字,预计阅读时间 12 分钟近年来,大语言模型(LLMs)凭借其强大的语言理解和生成能力席卷了AI领域。然而,随着知识的快速迭代和实时更新
阅读全文全文约 2000 字,预计阅读时间 5 分钟前言在上一次的课程当中,我们尝试的进行了在LangChain中接入ModelScope模型,但是在接入中,我们会发现与模型的对话有些许的问题,包括模型回复时
阅读全文在知识爆炸、信息过载的时代,如何洞悉 AI 领域前沿趋势?OpenMMLab 联合 Hugging Face、ModelScope、知乎及机智流等重磅推出 AI Insight Talk,邀请「强化学
阅读全文作者:羰汤羰和 Teamo AI首先严正声明,今天这篇我们没有收广告费(广告位招租),但我们也确实要到了官方的内测邀请码,我们会在文末公布邀请码获取方式。全文约 5200 字,预计阅读时间 10 分钟
阅读全文本文转载自「司南评测体系」司南评测集社区 CompassHub 作为上海人工智能实验室司南评测体系的重要组成部分,旨在打造创新性的基准测试资源导航社区,提供丰富、及时、专业的评测集信息,帮助研究人员和
阅读全文全文约 2300 字,预计阅读时间 5 分钟新闻资讯苹果 WWDC2025:设计革新与 AI 探索北京时间 6 月 10 日凌晨 1 点,苹果 WWDC25 全球开发者大会盛大举行。此次大会聚焦软件更
阅读全文本文来自社区同学投稿近年来,强化学习 (RL) 在提升大型语言模型 (LLM) 的链式思考 (CoT) 推理能力方面展现出巨大潜力,其中直接偏好优化 (DPO) 和组相对策略优化 (GRPO) 是两大
阅读全文作者:Google Gemini今日趋势概括今日GitHub趋势榜上的项目广泛分布于多个热门技术领域。人工智能与机器学习依旧是焦点,涌现了大量关于大型语言模型(LLM)优化、AI代理内存管理、检索增强
阅读全文本文来自社区同学投稿,作者:复旦大学牛轲引言计算机辅助设计(CAD)在现代工业制造中扮演着至关重要的角色。其中,正交投影推理作为CAD设计、制造与仿真流程的基础,其精度与可编辑性对整体工作流程至关重要
阅读全文作者:企鹅火烈鸟文章转载自:https://sander.ai/2022/01/31/diffusion.html2019年底,自从宋(Song)和埃蒙(Ermon)发表了他们的那篇重磅论文后,扩散模
阅读全文随着大模型能力不断下沉,AI 的落地路径正在发生结构性变化——多模态与智能体(Agent)正重新定义“应用接入层”,成为系统级能力;与此同时,推理性能、数据体系与工具链协作,也进入新一轮重构周期。即将
阅读全文作者:InternLM、Qwen 等 LLM 和人时光飞逝, AI 界三大顶会之一的 CVPR 将在下周 6.11-6.15 于美国田纳西州纳什维尔召开。本次会议共收到 13,008 份有效投稿,最终
阅读全文本文来自社区同学投稿现如今,视频生成技术正以前所未有的速度革新着我们的视觉内容创作方式。从电影制作到广告设计,从虚拟现实到社交媒体,高质量且符合人类期望的视频生成模型正变得越来越重要。如何准确评估这些
阅读全文作者:李剑锋简介在之前的课程中,我们主要是通过 API 的方式与 LangChain 框架进行联动。但最近在筹备自己的大模型教学系列课程时,我开始探索:能不能将国内 ModelScope 平台上的开源
阅读全文全文约 3000 字,预计阅读时间 8 分钟原文链接:https://arxiv.org/pdf/2411.14869在具身智能系统中,3D 感知算法是极为关键的存在,它宛如智能体的 “慧眼”,助力其
阅读全文本文转载自书生Intern,原文来自社区投稿,作者尖米、张富才。书生大模型实战营第5期已正式启动,本期实战营新增「论文分类打榜赛」,以帮助学员更好地掌握大模型技能。本文将手把手带领大家用 ms-swi
阅读全文全文约 2300 字,预计阅读时间 6 分钟上个月底,我们熟知的那个小米新组建的 LLM-Core 团队开源了四款 MiMo-7B 系列模型。近日他们又推出了一项令人振奋的工作——开源了MiMo-VL
阅读全文本文转载自 JackCui这周,Cursor 的主设计师 Ryo Lu 在 X 上亲自分享了一条关于如何正确使用 Cursor 的实践帖,并强调了一个核心理念:使用得当 = 快速、干净的代码使用不当
阅读全文作者:洛1. 项目背景Local Deep Researcher 是一个本地化运行的 AI 研究助手,旨在通过结合大语言模型(LLM)和搜索工具,实现自动化深度研究并生成结构化报告。该项目由 Lang
阅读全文🌟 欢迎参加 Gradio & MCP 智能体主题黑客松!准备好了吗?一场以智能体 (Agent) 和模型上下文协议 (Model Context Protocol,简称 MCP) 为核心的全球在线黑
阅读全文全文约 1400 字,预计阅读时间 5 分钟在大语言模型(LLM)广泛应用的当下,如何在保证低延迟的前提下最大化吞吐量成为行业亟待解决的问题。近段时间,由新加坡国立大学(NUS)和中国科学技术大学(U
阅读全文本文来自社区同学投稿,作者:复旦大学余海洋导读:近日字节和复旦团队提出了一种基于置信度的自适应推理框架(CAR),通过评估模型困惑度(PPL)动态选择短回答或长文本推理,实现准确性和效率的平衡。实验效
阅读全文全文约 3200 字,预计阅读时间 9 分钟说在前面的话以往real2sim2real的叙事方式和贡献方式都是通过摸索NeRF(神经辐射场)/3DGS(3D 高斯溅射)等高质量的稠密重建技术,更好地渲
阅读全文本文由社区同学投稿导读:RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!Deepseek-R1 的成功已经证明了纯 RL
阅读全文全文约 3200 字,预计阅读时间 9 分钟近年来,大语言模型(LLMs)凭借强大的推理能力在数学问题求解、逻辑推理和智能助手等领域展现出惊人潜力。然而,复杂任务需要模型进行冗长的“链式思考”(Cha
阅读全文作者:李剑锋前言在上节课中,我们详细学习了如何利用Function Calling机制实现文本标注、情感分析和结构化信息抽取任务,展示了Function Calling在处理结构化数据方面的巨大优势。
阅读全文