字节和复旦团队提出首个推理长度自适应框架,助力LLM/MLLM高效推理,提升精度同时降低输出Token数量!
本文来自社区同学投稿,作者:复旦大学余海洋导读:近日字节和复旦团队提出了一种基于置信度的自适应推理框架(CAR),通过评估模型困惑度(PPL)动态选择短回答或长文本推理,实现准确性和效率的平衡。实验效
阅读全文本文来自社区同学投稿,作者:复旦大学余海洋导读:近日字节和复旦团队提出了一种基于置信度的自适应推理框架(CAR),通过评估模型困惑度(PPL)动态选择短回答或长文本推理,实现准确性和效率的平衡。实验效
阅读全文全文约 3200 字,预计阅读时间 9 分钟说在前面的话以往real2sim2real的叙事方式和贡献方式都是通过摸索NeRF(神经辐射场)/3DGS(3D 高斯溅射)等高质量的稠密重建技术,更好地渲
阅读全文本文由社区同学投稿导读:RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!Deepseek-R1 的成功已经证明了纯 RL
阅读全文全文约 3200 字,预计阅读时间 9 分钟近年来,大语言模型(LLMs)凭借强大的推理能力在数学问题求解、逻辑推理和智能助手等领域展现出惊人潜力。然而,复杂任务需要模型进行冗长的“链式思考”(Cha
阅读全文作者:李剑锋前言在上节课中,我们详细学习了如何利用Function Calling机制实现文本标注、情感分析和结构化信息抽取任务,展示了Function Calling在处理结构化数据方面的巨大优势。
阅读全文本文转载自 RTE 开发者社区,编者:RTE 施苏娜、傅丰元 全文约 5200 字,预计阅读时间 13 分钟前言:我们用 ListenHubAI 制作了一个3分钟的短播客,帮助大家快速了解 Proje
阅读全文作者:HowardZhangdqs资讯GoogleI/O 2025开发者大会:AI与AR的创新盛宴Google I/O 2025于5月20日至21日在加州山景城举行,聚焦人工智能(AI)、Androi
阅读全文全文约 1800 字,预计阅读时间 6 分钟随着大语言模型(Large Language Models, LLMs)在各种任务中的广泛应用,如何优化大规模请求下的成本和响应时间成为关键挑战。最近几个月
阅读全文AI资讯日报 - 05.20 洞悉AI前沿,把握技术脉搏 🚀 Omni-R1:音频问答的技术革命 MIT、IBM等研究团队联合推出Omni-R1音频问答系统,在多模态语言模型领域取得重大突破。通过G
阅读全文导读:今天试用 ListenHub AI 将日报做成播客形式,真的太惊艳了,深情并茂,效果几乎可以媲美真人了,分享给大家,我们还为大家准备了 ListenHub AI 专属邀请码。也欢迎大家关注 机智
阅读全文https://io.google/2025/谷歌 I/O 大会 2025 将于北京时间 2025 年 5 月 21 日 (周三) 凌晨 1 点开始分享 Google Key Note,Develop
阅读全文全文约 2800 字,预计阅读时间 8 分钟https://arxiv.org/pdf/2505.07773在人工智能(AI)的快速发展中,大语言模型(LLMs)凭借其强大的文本生成能力席卷了多个领域
阅读全文作者:Lilian Weng,机器之心编译学习大模型的优质博客又更新了!最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长长长长博客《Why We T
阅读全文作者:企鹅火烈鸟🦩前言有一段时间没更新读LLM算子库系列了,这一期我们一起来看看在turbomind中的gemm操作。turbomind中的gemm是从cutlass中抽出的模版,并进行实现的过程。t
阅读全文全文约 2800 字,预计阅读时间 8 分钟在人工智能飞速发展的今天,大型语言模型(LLMs)如GitHub Copilot、ChatGPT等已成为开发者手中的“得力助手”,极大地提升了代码编写效率。
阅读全文由中国电子商会归口管理,汇集众多企业、大模型专家提供支持,智合标准中心(北京之合网络科技有限公司)组织起草的《人工智能大模型私有化部署技术实施与评价指南》团体标准(以下简称《标准》)现已正式立项。这是
阅读全文全文约 1000 字,预计阅读时间 3 分钟新闻资讯1. MiniMax发布通用 AI 智能体平台 MiniMax Agent,实现多领域任务自动化新锐 AI 公司 MiniMax 悄然推出全新的通用
阅读全文导读:这是一篇写得比较全面的基准数据集构建论文,论文附录还开源了人工标注说明、模型评测实验软硬件环境、详细的系统和用户提示词等,希望对大家有帮助。论文和数据集链接见文末全文约 3000 字,预计阅读时
阅读全文司南评测集社区 CompassHub 作为司南评测体系的重要组成部分,旨在打造创新性的基准测试资源导航社区,提供丰富、及时、专业的评测集信息,帮助研究人员和行业人士快速搜索和使用评测集。评测集社区 C
阅读全文全文约 3500 字,预计阅读时间约 9 分钟近年来,大型语言模型(LLMs)在自然语言处理领域掀起了一场风暴,从对话生成到复杂任务推理,它们的表现令人惊叹。然而,单个模型的性能总有瓶颈,训练成本高
阅读全文作者:企鹅火烈鸟原文链接:https://research.colfax-intl.com/cutlass-tutorial-writing-gemm-kernels-using-tensor-mem
阅读全文作者:李剑锋前言继上节课我们学习了如何利用 Function Calling 完成文本标注和信息抽取任务后,本节课将围绕“从真实网页中提取结构化信息”的主题展开一次完整实战。课程分为以下三个模块:模块
阅读全文全文约 2100 字,预计阅读时间 6 分钟在大语言模型(LLM)推理服务需求激增的背景下,如何高效处理海量请求、保障服务质量成为行业焦点。就在上个月,来自港科大与上海交大的研究团队提出了全新框架——
阅读全文作者:yanbo新闻资讯1. 扣子空间开放测试,无需邀请码即可体验专家 Agent 服务近日,扣子空间正式宣布开放测试,无需邀请码即可登录官网体验产品。此次测试开放了三大专家 Agent,包括:用户研
阅读全文全文约 2000 字,预计阅读时间 6 分钟在大语言模型(LLM)席卷AI行业的今天,如何高效地为多个LLM提供服务成为了一个亟待解决的问题。一篇题为《MuxServe: Flexible Spati
阅读全文本文转载自量子位,作者:量子位梦晨 鹭羽最新开源模型LTXV-13B,免费可商用、推理速度快、游戏显卡就能跑,视觉效果也不错。要素都齐了,想不火都难。从官方透露的信息看,新模型在速度、质量和控制三个方
阅读全文