全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    让大模型在线服务提速37%,告别等待!武汉大学&亚马逊提出PRISM技术,大模型服务TTFT降低超23%

    作者:机智流发布日期:2026-05-19 21:30:00

    图片由 AI 生成在当今的在线大语言模型服务场景中,无论是检索增强生成系统,还是复杂的智能体应用,我们都能观察到两种显著的模式。用户的请求往往由多个可复用的“片段”拼接而成,例如固定的系统指令、检索到

    阅读全文
  • 文章封面

    千问5.20的“新朋友”,可能不只是一个新模型

    作者:机智流发布日期:2026-05-18 21:30:00

    > 本文由 Intern-S2 等 AI 生成,机智流编辑部校对下午,千问大模型官方账号发了一条预告:这是一条很会吊胃口的预告,既没有直接说是“新模型”,也没有说是“新功能”,反而用了“新朋友”?那我

    阅读全文
  • 文章封面

    小米OneVL:首个超越显式推理的隐式推理模型,让自动驾驶规划又快又准

    作者:机智流发布日期:2026-05-16 23:26:00

    导读:最近,小米正式发布并全面开源了其自动驾驶模型Xiaomi OneVL 及对应代码。OneVL在业内率先通过潜空间推理,将VLA、世界模型统一到同一套框架中;并在推理、规划等多个主流基准上,全面刷

    阅读全文
  • 文章封面

    大模型推理能力究竟如何产生的?人大、清华、小米EV联合研究揭示其本质,并提出无需标签的大模型推理诊断方法

    作者:机智流发布日期:2026-05-15 22:30:00

    图片由AI生成当我们向大语言模型提出一个复杂的数学问题或逻辑谜题时,它似乎能“思考”并给出答案。然而,这种推理能力究竟是如何在大模型内部实现的?传统的评估方法主要依赖于标注好的基准测试和任务准确率,但

    阅读全文
  • 文章封面

    从 SFT 到继续预训练:大模型领域知识注入的原理与实战

    作者:机智流发布日期:2026-05-14 21:00:00

    > 作者:李剑锋前言课程回顾在前面的课程中,我们已经系统讲解了 SFT 微调 的完整过程,包括不同的微调方法,如全量微调、LoRA 微调和 QLoRA 微调,以及配套的数据生成思路。通过这部分内容,我

    阅读全文
  • 文章封面

    MolmoAct2:为真实世界部署而生的开放动作推理模型

    作者:机智流发布日期:2026-05-13 22:30:00

    图片由 AI 生成机器人控制领域一直追求能适应各种任务的通用控制器,而视觉-语言-动作模型正是这一方向的关键技术。然而,现有系统在实际部署中仍面临诸多挑战:顶尖模型多为闭源;开源替代方案又往往依赖于昂

    阅读全文
  • 文章封面

    吞吐量提升5.66倍!微软、港中大等Spin框架如何统一稀疏注意力与分级内存,让稀疏注意力算法真正高效落地

    作者:机智流发布日期:2026-05-12 21:00:00

    图片由 AI 生成随着大语言模型(LLM)的上下文窗口不断扩展,从数十万词元迈向百万级别,一个核心的挑战日益凸显:模型推理时,用于存储注意力计算中间状态的关键值(KV)缓存会线性增长,这给GPU内存容

    阅读全文
  • 文章封面

    从尝鲜到规模化:OpenAI 总结了企业 AI 落地的 5 个关键动作

    作者:机智流发布日期:2026-05-11 22:30:00

    过去一年,很多公司都在问:我们是不是该上 AI?现在这个问题已经不够用了。更准确的问题应该是:我们有没有能力承接 AI?上 AI 很简单,先买账号,开权限,拉一个群,组织几场 prompt 培训。老板

    阅读全文
  • 文章封面

    多模态大模型“找茬”能力大考:DiffCap-Bench全面评测揭示模型短板,解锁图像编辑新可能

    作者:机智流发布日期:2026-05-10 22:07:57

    在数字图像编辑日益普及的今天,无论是专业设计师还是普通用户,都常常需要对两张图片进行精细的对比。例如,检查一张海报修改前后的细微差别,或者理解一张产品图在调整了哪些细节后变得更具吸引力。准确描述两张图

    阅读全文
  • 文章封面

    打破垄断!华南理工等团队发布首个大规模多镜头视频生成数据集,推动视频生成迈向工业级应用

    作者:机智流发布日期:2026-05-09 23:59:00

    图片由 AI 生成从单镜头到电影叙事:MuSS数据集如何推动多镜头视频生成在专业影视制作、广告创意和短视频内容中,视觉叙事从来不是孤立的单镜头展示。一个完整的故事往往由多个镜头序列构成:从交代环境的大

    阅读全文
  • 文章封面

    Agent真的能完成入职办理这样的跨系统真实业务吗?港中文等团队提出Claw-Eval-Live,让Agent评测在多个系统里把业务真的跑完

    作者:机智流发布日期:2026-05-08 20:30:00

    > 本文来自社区投稿导读:先说结论Claw-Eval-Live 不是简单把 Claw-Eval 扩大一圈,而是在回答另一个更现实的问题:当 Agent 的能力开始接近部署边界时,评测基准不能只测“模型

    阅读全文
  • 文章封面

    从数据补充到知识蒸馏:一次自我认知微调的优化实践

    作者:机智流发布日期:2026-05-07 20:30:00

    > 作者:李剑锋1. 前言1.1 前情回顾在上一节课中,我们通过 QLoRA 算法,将 swift 团队开源的自我认知数据集与基于 qwen3-32B 蒸馏得到的日常对话数据集(带思考)结合起来,完成

    阅读全文
  • 文章封面

    机器人决策新范式:港大&小鹏机器人提出DIAL,让AI机器人“想清楚”再动手,效率提升10倍

    作者:机智流发布日期:2026-05-06 21:30:00

    图片由 AI 生成在机器人执行“把桌上的苹果放进篮子里”这样的指令时,我们期望它不仅能“看到”苹果和篮子,更能“理解”任务目标,并规划出一系列连贯的抓取、移动、放置动作。近年来,借助强大的预训练视觉-

    阅读全文
  • 文章封面

    YC CEO:现在的 AI 是它有史以来最糟糕的版本|机智流 AI 日报 5/4

    作者:机智流发布日期:2026-05-05 09:42:59

    SMARTFLOW · AI DAILY · 05/04「现在的 AI 是它有史以来最糟糕的版本。」— Garry Tan(YC CEO)5-4 转发的一段评论2026-05-04 · 第 125 期

    阅读全文
  • 文章封面

    月活 3 万也要关:AI 公司只剩两条赚钱路|机智流 AI 日报 5/3

    作者:机智流发布日期:2026-05-04 09:59:36

    SMARTFLOW · AI DAILY · 05/03月活 3 万也要关,AI 公司只剩两条赚钱路。2026-05-03 · 第 124 期 · 精选 3 条值得读5-3 在 swyx 主办的 AI

    阅读全文
  • 文章封面

    Sam Altman:旧岗会消失,新岗会涌现|机智流 AI 日报 5/2

    作者:机智流发布日期:2026-05-03 09:28:17

    SMARTFLOW · AI DAILY · 05/02「旧岗会消失,新岗会涌现。」— Sam Altman5-2 GPT-5.5 派对日 · 一条推文回复2026-05-02 · 第 123 期 ·

    阅读全文
  • 文章封面

    Karpathy:LLM 不只是加速旧工作|机智流 AI 日报 5/1

    作者:机智流发布日期:2026-05-02 11:34:24

    SMARTFLOW · AI DAILY · 05/01「LLM 不只是在加速已有的东西,是在打开几条全新的地平线。」— Andrej Karpathy4-29 Sequoia Ascent 2026

    阅读全文
  • 文章封面

    4月AI月报|各领风骚数十天|AI 厂商的军备竞赛 30 天

    作者:机智流发布日期:2026-05-01 18:12:24

    机智流 · 4 月 AI 月报各领风骚数十天AI 厂商的军备竞赛 30 天825 条头条 · 8 个新前沿模型 · 3 把 SDK · 4 家同日入场安全 Agent2026 年 4 月,一位没受过高

    阅读全文
  • 文章封面

    从 LoRA 到 QLoRA:小显存环境下的大模型高效微调实践

    作者:机智流发布日期:2026-04-30 20:00:00

    > 作者:李剑锋前言在上节课中,我们已经基于 LoRA 微调方法,结合 swift 团队开源的自我认知数据集,完成了对 qwen3-0.6B 模型的高效参数微调实践。通过这一过程,大家初步掌握了在有限

    阅读全文
  • 文章封面

    硬件开发新革命:剑桥大学等机构提出首个新兴硬件内核生成基准KernelCraft,展示LLM生成汇编内核的潜力

    作者:机智流发布日期:2026-04-29 22:30:00

    图片由 AI 生成当我们谈论AI加速器时,通常会想到GPU或TPU。但为了追求极致的能效和吞吐量,越来越多的定制化AI加速器正在涌现。这些新兴硬件平台往往拥有独特的指令集架构,这为软件开发带来了巨大的

    阅读全文
  • 文章封面

    智能体推理平均降低27%功耗?伊利诺伊与密歇根大学提出KAIROS,用“上下文”实现高效节能

    作者:机智流发布日期:2026-04-28 20:30:00

    图片由 AI 生成在当今的AI数据中心,电力消耗已成为一个日益严峻的瓶颈。随着大语言模型从简单的单轮问答,演进到能够自主规划、调用工具、执行多轮复杂任务的“智能体”形态,其背后的计算模式发生了根本性变

    阅读全文
  • 文章封面

    产品经理向下,工程师向上:Claude Code 背后的 AI 职业融合

    作者:机智流发布日期:2026-04-27 21:00:20

    > 北辰编译今天没什么特别大的 AI 新闻。那就不追热点了,聊一段前两天听到的播客(也同步放出文字稿的中文翻译)。Lenny 采访了 Anthropic 的 Cat Wu。她负责 Claude Cod

    阅读全文
  • 文章封面

    Anthropic 产品团队为什么能跑得这么快 — Lenny 播客翻译

    作者:机智流发布日期:2026-04-27 21:00:20

    > 本文由 AI 辅助翻译,北辰校对Lenny Rachitsky,产品领域知名作者与播客主持人,主持 Lenny’s Podcast。Cat Wu 是 Anthropic 的产品负责人之一,负责

    阅读全文
  • 文章封面

    综述|智能体为何在复杂任务中“失忆”?中科大团队提出全新情境认知视角:智能源于对“情境”的动态管理

    作者:机智流发布日期:2026-04-26 21:01:18

    你是否曾遇到过这样的场景:一个能够熟练使用工具、拥有长期记忆的大语言模型智能体,在面对一个需要多步骤协调、环境动态变化的复杂任务时,却表现得像“失忆”一般,前后矛盾,甚至忘记最初的目标?这种能力与表现

    阅读全文
  • 文章封面

    过度思考如何毁掉你的项目

    作者:机智流发布日期:2026-04-25 23:59:00

    > 本文整理自外网,原文链接[1]见文末> 原作者:Kevin Lynagh当一个项目想法冒出来的时候,我通常会有两种走向:第一种:直接干。 最多微调几次,但做出来往往跟想象中一模一样,很满意。第二种

    阅读全文
  • 文章封面

    纯文本依然能打:Deepseek-V4  VS. GPT-5.5 实测比较

    作者:机智流发布日期:2026-04-24 23:25:57

    > 北辰今早 GPT-5.5 还在 X 上力压 Opus 4.7 呢,下午 Deepseek-V4 就放出大招,不仅正式在网页端上线,还一次性开源了模型文件、同步了技术报告。小编评价:这才是真正的开源

    阅读全文
  • 文章封面

    一文带你跑通基于 Transformers 的参数高效微调:数据处理、LoRA 训练、模型合并与评估全流程实践指南

    作者:机智流发布日期:2026-04-23 21:30:00

    > 作者:李剑锋前言在上一节课里,我们通过使用 200 条示例数据,并结合训练参数的调整,成功实现了 Qwen3-0.6B 模型的全参数微调及测试。这一步非常有价值,因为它让我们真正走通了一次从数据准

    阅读全文
  • 文章封面

    淘宝今天上线AI试穿!一文揭秘如何解决行业痛点,实现高保真、低延迟、多品类的一站式试衣,极端姿势、复杂光照都不怕!

    作者:机智流发布日期:2026-04-22 22:35:12

    图片由AI生成对于许多线上购物者来说,无法亲身试穿衣物始终是影响购买决策的一大障碍。即便有了商品展示图、模特上身图,但服装穿在自己身上究竟是什么效果,依然是个未知数。这种不确定性常常导致退货率上升和消

    阅读全文
  • 文章封面

    CDIE2026 圆满收官:以 AI 生产力落地书写数字化转型新答卷

    作者:机智流发布日期:2026-04-22 22:35:12

    > 本文转载自 CDIE20262026 年 4 月 14 日—15 日,由华昂集团(Dot Connector)主办的第十二届 CDIE 数字化创新博览会在上海张江科学会堂圆满落幕。本届大会以 “将

    阅读全文
  • 文章封面

    大模型服务新范式:PipeLive突破在线流水线并行重构难题,自适应异构GPU环境,性能提升超30%

    作者:机智流发布日期:2026-04-21 21:00:00

    图片由 AI 生成在当前的AI服务场景中,大语言模型(LLM)的部署常常面临一个核心难题:如何在不中断服务的情况下,根据实时变化的负载动态调整模型的计算资源分配?传统的静态部署方式,一旦选定流水线并行

    阅读全文
下一页