全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    字节和复旦团队提出首个推理长度自适应框架,助力LLM/MLLM高效推理,提升精度同时降低输出Token数量!

    作者:机智流发布日期:2025-05-26 20:30:00

    本文来自社区同学投稿,作者:复旦大学余海洋导读:近日字节和复旦团队提出了一种基于置信度的自适应推理框架(CAR),通过评估模型困惑度(PPL)动态选择短回答或长文本推理,实现准确性和效率的平衡。实验效

    阅读全文
  • 文章封面

    Real2sim2Real的破局之法

    作者:机智流发布日期:2025-05-25 20:26:24

    全文约 3200 字,预计阅读时间 9 分钟说在前面的话以往real2sim2real的叙事方式和贡献方式都是通过摸索NeRF(神经辐射场)/3DGS(3D 高斯溅射)等高质量的稠密重建技术,更好地渲

    阅读全文
  • 文章封面

    一键式训练端到端Agent,Qwen3+MCP工具集高效集成!

    作者:机智流发布日期:2025-05-24 23:44:04

    本文由社区同学投稿导读:RLFactory能够让你通过低代码的方式快速训练你的端到端Agent模型,以Qwen3等最新的模型为基座调用你的MCP工具集!Deepseek-R1 的成功已经证明了纯 RL

    阅读全文
  • 文章封面

    Thinkless:会自己决定何时“深度思考”的AI来了!新加坡国立大学提出DeGRPO革新大模型推理效率

    作者:机智流发布日期:2025-05-23 21:24:29

    全文约 3200 字,预计阅读时间 9 分钟近年来,大语言模型(LLMs)凭借强大的推理能力在数学问题求解、逻辑推理和智能助手等领域展现出惊人潜力。然而,复杂任务需要模型进行冗长的“链式思考”(Cha

    阅读全文
  • 文章封面

    构建可调用外部工具的AI助手:LangChain函数调用与API集成详解

    作者:机智流发布日期:2025-05-22 22:28:10

    作者:李剑锋前言在上节课中,我们详细学习了如何利用Function Calling机制实现文本标注、情感分析和结构化信息抽取任务,展示了Function Calling在处理结构化数据方面的巨大优势。

    阅读全文
  • 文章封面

    Gemini 刚发布的「主动音频」和「主动视频」是什么?对谈 Project Astra 主管

    作者:机智流发布日期:2025-05-21 23:30:21

    本文转载自 RTE 开发者社区,编者:RTE 施苏娜、傅丰元 全文约 5200 字,预计阅读时间 13 分钟前言:我们用 ListenHubAI 制作了一个3分钟的短播客,帮助大家快速了解 Proje

    阅读全文
  • 文章封面

    0521晚报:Google I/O 开发者大会 | 全球首个无限步骤AI智能体 | 英伟达让机器人通过梦境学习新技能

    作者:机智流发布日期:2025-05-21 23:30:21

    作者:HowardZhangdqs资讯GoogleI/O 2025开发者大会:AI与AR的创新盛宴Google I/O 2025于5月20日至21日在加州山景城举行,聚焦人工智能(AI)、Androi

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 EcoServe:在预填充和解码之间实现时间维度上的主动调度

    作者:机智流发布日期:2025-05-20 20:00:00

    全文约 1800 字,预计阅读时间 6 分钟随着大语言模型(Large Language Models, LLMs)在各种任务中的广泛应用,如何优化大规模请求下的成本和响应时间成为关键挑战。最近几个月

    阅读全文
  • 文章封面

    AI速递0520:Omni-R1音频问答突破,微软向量搜索革新,OpenAI预言AI工程师进化

    作者:机智流发布日期:2025-05-20 20:00:00

    AI资讯日报 - 05.20 洞悉AI前沿,把握技术脉搏 🚀 Omni-R1:音频问答的技术革命 MIT、IBM等研究团队联合推出Omni-R1音频问答系统,在多模态语言模型领域取得重大突破。通过G

    阅读全文
  • 文章封面

    ListenHub:让AI为你“说”出精彩内容!

    作者:机智流发布日期:2025-05-19 21:45:41

    导读:今天试用 ListenHub AI 将日报做成播客形式,真的太惊艳了,深情并茂,效果几乎可以媲美真人了,分享给大家,我们还为大家准备了 ListenHub AI 专属邀请码。也欢迎大家关注 机智

    阅读全文
  • 文章封面

    谷歌I/O大会将在本周三凌晨开幕,会发布Gemini 3等黑科技吗,快来看看节目单!!!

    作者:机智流发布日期:2025-05-19 21:45:41

    https://io.google/2025/谷歌 I/O 大会 2025 将于北京时间 2025 年 5 月 21 日 (周三) 凌晨 1 点开始分享 Google Key Note,Develop

    阅读全文
  • 文章封面

    Agent RL Scaling Law:复旦、华东师大和小红书团队如何让AI学会自主使用工具?

    作者:机智流发布日期:2025-05-18 20:11:37

    全文约 2800 字,预计阅读时间 8 分钟https://arxiv.org/pdf/2505.07773在人工智能(AI)的快速发展中,大语言模型(LLMs)凭借其强大的文本生成能力席卷了多个领域

    阅读全文
  • 文章封面

    刚刚!北大校友Lilian Weng最新博客来了:Why We Think

    作者:机智流发布日期:2025-05-18 20:11:37

    作者:Lilian Weng,机器之心编译学习大模型的优质博客又更新了!最近,北大校友、前 OpenAI 应用 AI 研究负责人 Lilian Weng 更新了一篇长长长长长长长博客《Why We T

    阅读全文
  • 文章封面

    一起读LLM算子库之turbomind (6)

    作者:机智流发布日期:2025-05-17 23:40:20

    作者:企鹅火烈鸟🦩前言有一段时间没更新读LLM算子库系列了,这一期我们一起来看看在turbomind中的gemm操作。turbomind中的gemm是从cutlass中抽出的模版,并进行实现的过程。t

    阅读全文
  • 文章封面

    0517晚报:阿里正式推出Qwen2.5-Omni-7B量化版 | OpenAI推出Codex研究预览版

    作者:机智流发布日期:2025-05-17 23:40:20

    阅读全文
  • 文章封面

    ACL2025 | 从漏洞到修复:北大CoV-Eval重新定义大模型代码安全评估

    作者:机智流发布日期:2025-05-16 23:24:37

    全文约 2800 字,预计阅读时间 8 分钟在人工智能飞速发展的今天,大型语言模型(LLMs)如GitHub Copilot、ChatGPT等已成为开发者手中的“得力助手”,极大地提升了代码编写效率。

    阅读全文
  • 文章封面

    初稿抢先看!13家单位共同起草全国首部AI大模型私有化部署标准

    作者:机智流发布日期:2025-05-16 23:24:37

    由中国电子商会归口管理,汇集众多企业、大模型专家提供支持,智合标准中心(北京之合网络科技有限公司)组织起草的《人工智能大模型私有化部署技术实施与评价指南》团体标准(以下简称《标准》)现已正式立项。这是

    阅读全文
  • 文章封面

    速报:MiniMax发布通用 AI 智能体平台 MiniMax Agent|OpenAI引入 GPT-4.1 编程专家模型

    作者:机智流发布日期:2025-05-16 23:24:37

    全文约 1000 字,预计阅读时间 3 分钟新闻资讯1. MiniMax发布通用 AI 智能体平台 MiniMax Agent,实现多领域任务自动化新锐 AI 公司 MiniMax 悄然推出全新的通用

    阅读全文
  • 文章封面

    如何构建行业LLM基准评测:看看英国健康安全署发布的PubHealthBench如何评测大模型公共卫生知识边界

    作者:机智流发布日期:2025-05-14 23:29:33

    导读:这是一篇写得比较全面的基准数据集构建论文,论文附录还开源了人工标注说明、模型评测实验软硬件环境、详细的系统和用户提示词等,希望对大家有帮助。论文和数据集链接见文末全文约 3000 字,预计阅读时

    阅读全文
  • 文章封面

    ToolHop:查询驱动的多跳工具使用评测集 | 司南评测集社区直播预告

    作者:机智流发布日期:2025-05-14 23:29:33

    司南评测集社区 CompassHub 作为司南评测体系的重要组成部分,旨在打造创新性的基准测试资源导航社区,提供丰富、及时、专业的评测集信息,帮助研究人员和行业人士快速搜索和使用评测集。评测集社区 C

    阅读全文
  • 文章封面

    聊聊MoA(混合智能体架构):如何激发LLM潜力并掀起语言模型协作革命?

    作者:机智流发布日期:2025-05-12 22:01:07

    全文约 3500 字,预计阅读时间约 9 分钟近年来,大型语言模型(LLMs)在自然语言处理领域掀起了一场风暴,从对话生成到复杂任务推理,它们的表现令人惊叹。然而,单个模型的性能总有瓶颈,训练成本高

    阅读全文
  • 文章封面

    一起聊聊Nvidia Blackwell 新特性之UMMA

    作者:机智流发布日期:2025-05-11 22:28:36

    作者:企鹅火烈鸟原文链接:https://research.colfax-intl.com/cutlass-tutorial-writing-gemm-kernels-using-tensor-mem

    阅读全文
  • 文章封面

    跨网页解析实战:基于LangChain的多段文本分析与结构化抽取

    作者:机智流发布日期:2025-05-10 22:25:16

    作者:李剑锋前言继上节课我们学习了如何利用 Function Calling 完成文本标注和信息抽取任务后,本节课将围绕“从真实网页中提取结构化信息”的主题展开一次完整实战。课程分为以下三个模块:模块

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 APT-Serve:提升有效吞吐量 8.8 倍背后的混合缓存机制和自适应请求调度算法

    作者:机智流发布日期:2025-05-09 23:14:23

    全文约 2100 字,预计阅读时间 6 分钟在大语言模型(LLM)推理服务需求激增的背景下,如何高效处理海量请求、保障服务质量成为行业焦点。就在上个月,来自港科大与上海交大的研究团队提出了全新框架——

    阅读全文
  • 文章封面

    速报:扣子空间开放测试,无需邀请码|阿里开源大模型搜索引擎|腾讯开源 HunyuanCustom

    作者:机智流发布日期:2025-05-09 23:14:23

    作者:yanbo新闻资讯1. 扣子空间开放测试,无需邀请码即可体验专家 Agent 服务近日,扣子空间正式宣布开放测试,无需邀请码即可登录官网体验产品。此次测试开放了三大专家 Agent,包括:用户研

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 MuxServe:多LLM并发服务如何实现1.8倍吞吐量提升?

    作者:机智流发布日期:2025-05-08 22:30:00

    全文约 2000 字,预计阅读时间 6 分钟在大语言模型(LLM)席卷AI行业的今天,如何高效地为多个LLM提供服务成为了一个亟待解决的问题。一篇题为《MuxServe: Flexible Spati

    阅读全文
  • 文章封面

    LTX新开源13B模型生成提速30倍,5090跑出好莱坞特效

    作者:机智流发布日期:2025-05-08 22:30:00

    本文转载自量子位,作者:量子位梦晨 鹭羽最新开源模型LTXV-13B,免费可商用、推理速度快、游戏显卡就能跑,视觉效果也不错。要素都齐了,想不火都难。从官方透露的信息看,新模型在速度、质量和控制三个方

    阅读全文
上一页