全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    聊聊大模型推理系统之 Arrow:自适应调度实现请求吞吐提升7.78倍背后的三大创新

    作者:机智流发布日期:2025-08-26 22:30:00

    全文约 1800 字,预计阅读时间 5 分钟在大模型(LLM)推理服务中,如何在输入/输出长度剧烈波动的现实场景下,依然保持高吞吐与低延迟?传统静态资源分配策略往往导致计算资源严重浪费。近期,来自中国

    阅读全文
  • 文章封面

    1.5 倍加速 MoE 训练:从零构建基于 Blackwell 的 MXFP8 Kernels

    作者:机智流发布日期:2025-08-25 23:59:00

    文章翻译自:https://cursor.com/cn/blog/kernelsCursor致力于打造全球最佳的 AI 编程模型,但训练大型语言模型成本高昂。例如,我们最大的内部模型在数万个 GPU

    阅读全文
  • 文章封面

    手机也能写代码了?实测安卓Termux配Claude,随地大小编成为现实

    作者:机智流发布日期:2025-08-25 23:59:00

    最近编程越来越火了,我也试了试用 Termux 配 Claude Code 在手机上写代码,发现体验还真不错。说起来也挺魔幻的,以前写代码必须坐在电脑前,现在躺床上都能敲代码。手机24小时不离身,编程

    阅读全文
  • 文章封面

    3D/4D World Model(WM)近期发展的总结和思考

    作者:机智流发布日期:2025-08-24 22:45:00

    本文作者明仔 matrix, 由机智流编辑部校对。说在前面的话有关具身智能,在今年前三季度的大部分工作和思考仍旧集中在数据的收集和数据的利用上——即如何高效的利用视频的示例数据去训练一个性能表现都不错

    阅读全文
  • 文章封面

    港大联合月之暗面发布OpenCUA:32B模型力压GPT-4o登顶CUA榜,还提供端到端的CUA研究解决方案!

    作者:机智流发布日期:2025-08-23 23:00:00

    本文由被奴役的机智流AI生成,机智流编辑部校对。播客由ListenHub AI生成近年来,视觉语言模型(VLMs)驱动的计算机使用代理(CUAs,Computer-Use Agents)正成为AI领域

    阅读全文
  • 文章封面

    中国人工智能学会丨AI Agent全球专项赛重磅来袭:百万奖金+资源加持,共赴AI创新盛宴!

    作者:机智流发布日期:2025-08-23 23:00:00

    🌟 大赛亮点速览2025年被誉为Agent AI商业化元年,AI Agent技术正从实验室走向产业一线。中国人工智能学会主办的"场景驱动·数智强国"——2025第三届全国人工智能应用场景创新挑战赛AI

    阅读全文
  • 文章封面

    Intern-S1 技术报告深度解读:从通用到专业,如何实现卓越的多模态和科学推理能力

    作者:机智流发布日期:2025-08-22 18:33:04

    全文约 7000 字,预计阅读时间 21 分钟。欢迎收听下方精简版播客在人工智能飞速发展的今天,基础模型的竞争已从通用领域逐步延伸至高价值的科学专业领域。无论是分子结构分析、时间序列信号处理,还是复杂

    阅读全文
  • 文章封面

    【直播预告】vLLM Community Meetup 上海站

    作者:机智流发布日期:2025-08-22 18:33:04

    📅 直播时间:8 月 23 日下午 2 点立即预约直播活动日程安排

    阅读全文
  • 文章封面

    LangGraph 高级实战:让 AI 会记忆、能暂停、可插手的断点恢复与流式控制

    作者:机智流发布日期:2025-08-21 23:12:29

    作者:李剑锋前言在上一节课中(万字长文!从 0 到 1 搭建基于 LangGraph 的 AI Agent),我们已经完成了一个可正常运行的 LangGraph 智能体框架,能够根据需求调用外部工具,

    阅读全文
  • 文章封面

    一文带你快速入门大模型工作流都在用的RAG和GraphRAG技术

    作者:机智流发布日期:2025-08-20 23:09:00

    全文约 1800 字,预计阅读时间 5 分钟RAG(Retrieval - Augmented Generation,检索增强生成 )技术最早可追溯至2020年被正式提出。如今,伴随大模型技术的飞速迭

    阅读全文
  • 文章封面

    最强开源VLM“华山论剑”丨多模态专场直播

    作者:机智流发布日期:2025-08-20 23:09:00

    最近,Intern-S1、MiniCPM-V-4、GLM-4.5V、Step3、OVIS 等多模态大模型纷纷开源,在大模型开源社区引发了热烈讨论。这些模型不仅在参数规模、训练范式和应用场景上各具特色,

    阅读全文
  • 文章封面

    聊聊大模型推理系统之华为云 xDeepServe:千卡级超节点规模下如何实现 50ms 时延的 LLM 推理?

    作者:机智流发布日期:2025-08-19 23:30:45

    全文约 2000 字,预计阅读时间 6 分钟相信不少读者在 WAIC2025 大会上已经被华为云的 CloudMatrix384 超节点震撼到了。CloudMatrix 384对标英伟达GB200 N

    阅读全文
  • 文章封面

    0819资讯:DeepSeek V3.1开源|Qwen 上线Qwen-Image-Edit|谷歌强势开源Gemma 3 270M

    作者:机智流发布日期:2025-08-19 23:30:45

    全文约 1600 字,预计阅读时间 5 分钟新闻资讯DeepSeek V3.1 发布官方通知上下文长度拓展至128K(虽然 Huggingface 上 DeepSeek V3 的模型卡上写着上下文长度

    阅读全文
  • 文章封面

    观点|英伟达:小语言模型才是 AI 智能体的未来

    作者:机智流发布日期:2025-08-18 23:18:39

    全文约 3800 字,预计阅读时间 15 分钟。也可以点击下方音频,收听本文的简洁版播客(播客由 ListenHubAI 生成)自 2 月份 DeepSeek 火爆全网以来,大语言模型(LLMs)凭借

    阅读全文
  • 文章封面

    中国人工智能学会丨AI Agent全球专项赛重磅来袭:百万奖金+资源加持,共赴AI创新盛宴!

    作者:机智流发布日期:2025-08-18 23:18:39

    🌟 大赛亮点速览2025年被誉为Agent AI商业化元年,AI Agent技术正从实验室走向产业一线。中国人工智能学会主办的"场景驱动·数智强国"——2025第三届全国人工智能应用场景创新挑战赛AI

    阅读全文
  • 文章封面

    WE-MATH2.0解锁数学推理新高度!北京邮电大学与腾讯WeChat Vision联手打造从小学到大学的多层级数学推理知识体系

    作者:机智流发布日期:2025-08-17 23:59:35

    近年来,随着多模态大语言模型(MLLMs)在视觉问答、图像识别等领域的飞速发展,其在复杂数学推理任务中的表现却始终是一大挑战。如何让AI不仅能“看懂”数学题目中的图像,还能像人类一样进行逻辑严密的推理

    阅读全文
  • 文章封面

    PaperScope 本周末更新

    作者:机智流发布日期:2025-08-17 23:59:35

    阅读全文
  • 文章封面

    细数CUTLASS 3.x中的内核设计抽象

    作者:机智流发布日期:2025-08-16 23:12:15

    作者:企鹅火烈鸟原文链接:https://developer.nvidia.com/blog/cutlass-3-x-orthogonal-reusable-and-composable-abstra

    阅读全文
  • 文章封面

    AI 团队集合|2025 第七届浦东新区人工智能创新应用竞赛正在报名!

    作者:机智流发布日期:2025-08-16 23:12:15

    浦东新区作为人工智能创新高地,再次点燃科技盛宴!2025 第七届浦东新区人工智能创新应用竞赛火热启动,现在正是报名黄金期!不管你是 AI 领域的技术大牛,还是怀揣奇思妙想的创新小队,这场盛宴都为你量身

    阅读全文
  • 文章封面

    GUI-Agent 领域新作!蚂蚁集团发布 UI-Venus,以截图驱动的智能交互,刷新行业标杆!

    作者:机智流发布日期:2025-08-15 22:05:57

    图1:UI-Venus在多个UI定位与导航基准测试中的SOTA性能。该图展示了UI-Venus在ScreenSpot-V2、ScreenSpot-Pro和AndroidWorld等基准测试中的卓越表现

    阅读全文
  • 文章封面

    欢迎报名参加 | Shanghai vLLM Community Meetup (2025年8月23日)

    作者:机智流发布日期:2025-08-15 22:05:57

    阅读全文
  • 文章封面

    本地也能玩转AI图片创作?腾讯3B开源模型实测:精准又轻便,统一生成理解,手把手教你部署

    作者:机智流发布日期:2025-08-14 19:39:05

    前几天小编在 HuggingFace 上摸鱼的时候,发现我们的老朋友,腾讯BAC团队(PCG内服基础算法中心)新开源了一款小尺寸多模态大模型 — TBAC-UniImage-3B[1]。 在 TIIF

    阅读全文
  • 文章封面

    HF今日论文|Stand-In 视频换人、Mol-R1 分子发现、AWorld 多智能体

    作者:机智流发布日期:2025-08-14 19:39:05

    论文选自 8 月 14 日 Hugging Face Daily Paper 内容涵盖视频生成中的身份控制、AI 辅助分子发现、更鲁棒的多智能体系统、扩散模型推理加速等多个前沿领域。本文将按照 Hug

    阅读全文
  • 文章封面

    TRO2025|基于隐式表面优化的快速精确6D物体位姿精修方法

    作者:机智流发布日期:2025-08-13 23:59:00

    全文约 2600 字,预计阅读时间 7 分钟一、引言:6D位姿估计的核心挑战与传统方法瓶颈6D物体位姿估计(包含3D旋转与3D平移)是机器人抓取、3D场景理解、增强现实等领域的关键任务,其目标是建立从

    阅读全文
  • 文章封面

    聊聊大模型推理系统之 TaiChi:打破聚合/分离之争,华为云提出统一架构

    作者:机智流发布日期:2025-08-12 20:41:58

    全文约 2000 字,预计阅读时间 6 分钟如何在保证响应速度的同时,大幅提升大模型服务的效率?这篇论文给出了惊艳答案。随着大语言模型(LLM)在聊天机器人、代码生成、文档分析等领域的广泛应用,其高昂

    阅读全文
  • 文章封面

    GLM-4.5 技术报告解读:预训练筑基、中训练提能、专家迭代统一

    作者:机智流发布日期:2025-08-11 23:43:43

    本文由 Intern-S1、Qwen3 等 AI 生成, 由机智流编辑部校对全文约 4000 字,预计阅读时间 12 分钟近日,智谱AI与清华大学发布了 GLM-4.5 系列模型的技术报告,这份长达数

    阅读全文
  • 文章封面

    还在为AI智能体的成本发愁?OPPO AI团队打造低成本高性能智能体,成本降低28.4%!

    作者:机智流发布日期:2025-08-10 22:38:08

    全文约 3000 字,预计阅读时间 9 分钟还在为AI智能体的成本发愁?OPPO AI团队打造低成本高性能智能体,成本降低28.4%!在人工智能飞速发展的今天,大语言模型(LLM)驱动的智能体系统以其

    阅读全文
  • 文章封面

    仅一行代码即可极大优化SFT泛化能力!东南大学等顶尖高校揭示SFT泛化能力差的根本原因,并提出高效改进方案

    作者:机智流发布日期:2025-08-09 23:35:43

    全文约 3200 字,预计阅读时间 10 分钟在人工智能领域,大语言模型(LLM)的微调技术一直是推动模型性能提升的关键环节。但熟悉的朋友知道,尽管传统的监督微调(Supervised Fine-Tu

    阅读全文
  • 文章封面

    还在手写CUDA?上交KernelPilot用AI帮你写又快又好的CUDA!

    作者:机智流发布日期:2025-08-08 10:00:00

    本文来自社区同学投稿全文约 1600 字,预计阅读时间 5 分钟🏠 项目主页:http://www.kernelpilot.com🎯 体验地址:http://www.kernelpilot.com/i

    阅读全文
  • 文章封面

    万字上文!从零到精通,开启你的CSS布局能力之路

    作者:机智流发布日期:2025-08-07 21:28:23

    作者:李剑锋前言在前几节课中,我们已经掌握了 HTML 的基础标签和网页结构搭建方式,能够初步构建出一个具有内容层次的网页。然而,仅靠 HTML 结构,网页的外观还较为单调、缺乏美感。为了让网页具备更

    阅读全文
下一页