聊聊大模型推理系统之 Arrow:自适应调度实现请求吞吐提升7.78倍背后的三大创新
全文约 1800 字,预计阅读时间 5 分钟在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟?传统静态资源分配策略往往导致计算资源严重浪费。近期,来自中国
阅读全文全文约 1800 字,预计阅读时间 5 分钟在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟?传统静态资源分配策略往往导致计算资源严重浪费。近期,来自中国
阅读全文文章翻译自:https://cursor.com/cn/blog/kernelsCursor致力于打造全球最佳的 AI 编程模型,但训练大型语言模型成本高昂。例如,我们最大的内部模型在数万个 GPU
阅读全文最近编程越来越火了,我也试了试用 Termux 配 Claude Code 在手机上写代码,发现体验还真不错。说起来也挺魔幻的,以前写代码必须坐在电脑前,现在躺床上都能敲代码。手机24小时不离身,编程
阅读全文本文作者明仔 matrix, 由机智流编辑部校对。说在前面的话有关具身智能,在今年前三季度的大部分工作和思考仍旧集中在数据的收集和数据的利用上——即如何高效的利用视频的示例数据去训练一个性能表现都不错
阅读全文本文由被奴役的机智流AI生成,机智流编辑部校对。播客由ListenHub AI生成近年来,视觉语言模型(VLMs)驱动的计算机使用代理(CUAs,Computer-Use Agents)正成为AI领域
阅读全文🌟 大赛亮点速览2025年被誉为Agent AI商业化元年,AI Agent技术正从实验室走向产业一线。中国人工智能学会主办的"场景驱动·数智强国"——2025第三届全国人工智能应用场景创新挑战赛AI
阅读全文全文约 7000 字,预计阅读时间 21 分钟。欢迎收听下方精简版播客在人工智能飞速发展的今天,基础模型的竞争已从通用领域逐步延伸至高价值的科学专业领域。无论是分子结构分析、时间序列信号处理,还是复杂
阅读全文作者:李剑锋前言在上一节课中(万字长文!从 0 到 1 搭建基于 LangGraph 的 AI Agent),我们已经完成了一个可正常运行的 LangGraph 智能体框架,能够根据需求调用外部工具,
阅读全文全文约 1800 字,预计阅读时间 5 分钟RAG(Retrieval - Augmented Generation,检索增强生成 )技术最早可追溯至2020年被正式提出。如今,伴随大模型技术的飞速迭
阅读全文最近,Intern-S1、MiniCPM-V-4、GLM-4.5V、Step3、OVIS 等多模态大模型纷纷开源,在大模型开源社区引发了热烈讨论。这些模型不仅在参数规模、训练范式和应用场景上各具特色,
阅读全文全文约 2000 字,预计阅读时间 6 分钟相信不少读者在 WAIC2025 大会上已经被华为云的 CloudMatrix384 超节点震撼到了。CloudMatrix 384对标英伟达GB200 N
阅读全文全文约 1600 字,预计阅读时间 5 分钟新闻资讯DeepSeek V3.1 发布官方通知上下文长度拓展至128K(虽然 Huggingface 上 DeepSeek V3 的模型卡上写着上下文长度
阅读全文全文约 3800 字,预计阅读时间 15 分钟。也可以点击下方音频,收听本文的简洁版播客(播客由 ListenHubAI 生成)自 2 月份 DeepSeek 火爆全网以来,大语言模型(LLMs)凭借
阅读全文🌟 大赛亮点速览2025年被誉为Agent AI商业化元年,AI Agent技术正从实验室走向产业一线。中国人工智能学会主办的"场景驱动·数智强国"——2025第三届全国人工智能应用场景创新挑战赛AI
阅读全文近年来,随着多模态大语言模型(MLLMs)在视觉问答、图像识别等领域的飞速发展,其在复杂数学推理任务中的表现却始终是一大挑战。如何让AI不仅能“看懂”数学题目中的图像,还能像人类一样进行逻辑严密的推理
阅读全文作者:企鹅火烈鸟原文链接:https://developer.nvidia.com/blog/cutlass-3-x-orthogonal-reusable-and-composable-abstra
阅读全文浦东新区作为人工智能创新高地,再次点燃科技盛宴!2025 第七届浦东新区人工智能创新应用竞赛火热启动,现在正是报名黄金期!不管你是 AI 领域的技术大牛,还是怀揣奇思妙想的创新小队,这场盛宴都为你量身
阅读全文图1:UI-Venus在多个UI定位与导航基准测试中的SOTA性能。该图展示了UI-Venus在ScreenSpot-V2、ScreenSpot-Pro和AndroidWorld等基准测试中的卓越表现
阅读全文前几天小编在 HuggingFace 上摸鱼的时候,发现我们的老朋友,腾讯BAC团队(PCG内服基础算法中心)新开源了一款小尺寸多模态大模型 — TBAC-UniImage-3B[1]。 在 TIIF
阅读全文论文选自 8 月 14 日 Hugging Face Daily Paper 内容涵盖视频生成中的身份控制、AI 辅助分子发现、更鲁棒的多智能体系统、扩散模型推理加速等多个前沿领域。本文将按照 Hug
阅读全文全文约 2600 字,预计阅读时间 7 分钟一、引言:6D位姿估计的核心挑战与传统方法瓶颈6D物体位姿估计(包含3D旋转与3D平移)是机器人抓取、3D场景理解、增强现实等领域的关键任务,其目标是建立从
阅读全文全文约 2000 字,预计阅读时间 6 分钟如何在保证响应速度的同时,大幅提升大模型服务的效率?这篇论文给出了惊艳答案。随着大语言模型(LLM)在聊天机器人、代码生成、文档分析等领域的广泛应用,其高昂
阅读全文本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对全文约 4000 字,预计阅读时间 12 分钟近日,智谱AI与清华大学发布了 GLM-4.5 系列模型的技术报告,这份长达数
阅读全文全文约 3000 字,预计阅读时间 9 分钟还在为AI智能体的成本发愁?OPPO AI团队打造低成本高性能智能体,成本降低28.4%!在人工智能飞速发展的今天,大语言模型(LLM)驱动的智能体系统以其
阅读全文全文约 3200 字,预计阅读时间 10 分钟在人工智能领域,大语言模型(LLM)的微调技术一直是推动模型性能提升的关键环节。但熟悉的朋友知道,尽管传统的监督微调(Supervised Fine-Tu
阅读全文本文来自社区同学投稿全文约 1600 字,预计阅读时间 5 分钟🏠 项目主页:http://www.kernelpilot.com🎯 体验地址:http://www.kernelpilot.com/i
阅读全文作者:李剑锋前言在前几节课中,我们已经掌握了 HTML 的基础标签和网页结构搭建方式,能够初步构建出一个具有内容层次的网页。然而,仅靠 HTML 结构,网页的外观还较为单调、缺乏美感。为了让网页具备更
阅读全文