机智流

AI-native/一人公司OPC到底怎么从 0 到 1——Claude 给创业者写了一本说明书
作者：机智流发布日期：2026-05-25 20:07:51
想用 AI 助力创业，第一步可以从一个更大的问题开始：怎样创建一家真正 AI-native 的公司？近期，Claude 官方发布了一份面向创业者手册：The founder's playbook: B
阅读全文
智能体不只靠模型：一篇综述讲清 Harness Engineering 的系统地图
作者：机智流发布日期：2026-05-24 21:30:00
> 本文由 Intern-S2 等 AI 生成，机智流编辑部校对智能体的能力，不只在模型里当一个智能体被要求修复代码、整理调研报告、操作网页、调用工具，甚至跨多轮会话持续完成一件事时，真正决定体验的往
阅读全文
Vibe Coding闲谈：当AI写代码越来越稳以至我们不怎么Review时，我们的防线还剩下什么？
作者：机智流发布日期：2026-05-23 21:00:00
> 本文编译自外网，机智流编辑部校对Vibe coding 这条路越走越宽了。很多程序员朋友日常都在用 AI 写代码，但用法分两种：一种像许愿池，对着 AI 一通输入，祈祷某次能吐出正确结果；另一种是
阅读全文
智能体如何学会“吃一堑，长一智”？中科大&美团等Skill1框架让技能选择、利用、提炼三者协同进化
作者：机智流发布日期：2026-05-22 20:00:00
图片由 AI 生成在数字世界中，一个智能体正面对一项看似简单的任务：加热一个盘子并将其放入橱柜。它环顾四周，发现了炉灶和微波炉。对于人类而言，选择微波炉是显而易见的，但对于一个正在学习的智能体，这却是
阅读全文
从 RLHF 到 DPO：大模型偏好对齐的原理与实战
作者：机智流发布日期：2026-05-21 22:07:16
> 作者：李剑锋前言在前面的课程中，我们已经重点讲解了 SFT（监督微调）的相关内容，并在上一节课中进一步介绍了继续预训练的基本思路。而在这一节课里，我们将继续沿着模型训练能力不断增强的这条路线
阅读全文
解读AutoResearchClaw：更接近人类真实迭代的AI科研多智能体协作系统
作者：机智流发布日期：2026-05-20 22:00:00
科学研究是一个不断试错、迭代、积累的过程。一个研究者提出假设，设计实验，观察失败，基于失败修正计划，然后再次尝试。然而，现有的基于大语言模型的自主研究系统，往往将这一复杂过程简化为一条直线：从想法到论
阅读全文
一个词就能视觉推理？Meta 华人颠覆性提出 ATLAS 新范式
作者：机智流发布日期：2026-05-20 22:00:00
> 本文来自社区投稿近日，Meta AI 与香港中文大学颠覆性提出了一种全新的视觉推理范式 ATLAS，不用外部工具，不显式生成中间图像，没有视觉监督信号，只用一个离散 word，首次颠覆性地代替 A
阅读全文
让大模型在线服务提速37%，告别等待！武汉大学&亚马逊提出PRISM技术，大模型服务TTFT降低超23%
作者：机智流发布日期：2026-05-19 21:30:00
图片由 AI 生成在当今的在线大语言模型服务场景中，无论是检索增强生成系统，还是复杂的智能体应用，我们都能观察到两种显著的模式。用户的请求往往由多个可复用的“片段”拼接而成，例如固定的系统指令、检索到
阅读全文
千问5.20的“新朋友”，可能不只是一个新模型
作者：机智流发布日期：2026-05-18 21:30:00
> 本文由 Intern-S2 等 AI 生成，机智流编辑部校对下午，千问大模型官方账号发了一条预告：这是一条很会吊胃口的预告，既没有直接说是“新模型”，也没有说是“新功能”，反而用了“新朋友”？那我
阅读全文
小米OneVL：首个超越显式推理的隐式推理模型，让自动驾驶规划又快又准
作者：机智流发布日期：2026-05-16 23:26:00
导读：最近，小米正式发布并全面开源了其自动驾驶模型Xiaomi OneVL 及对应代码。OneVL在业内率先通过潜空间推理，将VLA、世界模型统一到同一套框架中；并在推理、规划等多个主流基准上，全面刷
阅读全文
大模型推理能力究竟如何产生的？人大、清华、小米EV联合研究揭示其本质，并提出无需标签的大模型推理诊断方法
作者：机智流发布日期：2026-05-15 22:30:00
图片由AI生成当我们向大语言模型提出一个复杂的数学问题或逻辑谜题时，它似乎能“思考”并给出答案。然而，这种推理能力究竟是如何在大模型内部实现的？传统的评估方法主要依赖于标注好的基准测试和任务准确率，但
阅读全文
从 SFT 到继续预训练：大模型领域知识注入的原理与实战
作者：机智流发布日期：2026-05-14 21:00:00
> 作者：李剑锋前言课程回顾在前面的课程中，我们已经系统讲解了 SFT 微调的完整过程，包括不同的微调方法，如全量微调、LoRA 微调和 QLoRA 微调，以及配套的数据生成思路。通过这部分内容，我
阅读全文
MolmoAct2：为真实世界部署而生的开放动作推理模型
作者：机智流发布日期：2026-05-13 22:30:00
图片由 AI 生成机器人控制领域一直追求能适应各种任务的通用控制器，而视觉-语言-动作模型正是这一方向的关键技术。然而，现有系统在实际部署中仍面临诸多挑战：顶尖模型多为闭源；开源替代方案又往往依赖于昂
阅读全文
吞吐量提升5.66倍！微软、港中大等Spin框架如何统一稀疏注意力与分级内存，让稀疏注意力算法真正高效落地
作者：机智流发布日期：2026-05-12 21:00:00
图片由 AI 生成随着大语言模型（LLM）的上下文窗口不断扩展，从数十万词元迈向百万级别，一个核心的挑战日益凸显：模型推理时，用于存储注意力计算中间状态的关键值（KV）缓存会线性增长，这给GPU内存容
阅读全文
从尝鲜到规模化：OpenAI 总结了企业 AI 落地的 5 个关键动作
作者：机智流发布日期：2026-05-11 22:30:00
过去一年，很多公司都在问：我们是不是该上 AI？现在这个问题已经不够用了。更准确的问题应该是：我们有没有能力承接 AI？上 AI 很简单，先买账号，开权限，拉一个群，组织几场 prompt 培训。老板
阅读全文
多模态大模型“找茬”能力大考：DiffCap-Bench全面评测揭示模型短板，解锁图像编辑新可能
作者：机智流发布日期：2026-05-10 22:07:57
在数字图像编辑日益普及的今天，无论是专业设计师还是普通用户，都常常需要对两张图片进行精细的对比。例如，检查一张海报修改前后的细微差别，或者理解一张产品图在调整了哪些细节后变得更具吸引力。准确描述两张图
阅读全文
打破垄断！华南理工等团队发布首个大规模多镜头视频生成数据集，推动视频生成迈向工业级应用
作者：机智流发布日期：2026-05-09 23:59:00
图片由 AI 生成从单镜头到电影叙事：MuSS数据集如何推动多镜头视频生成在专业影视制作、广告创意和短视频内容中，视觉叙事从来不是孤立的单镜头展示。一个完整的故事往往由多个镜头序列构成：从交代环境的大
阅读全文
Agent真的能完成入职办理这样的跨系统真实业务吗？港中文等团队提出Claw-Eval-Live，让Agent评测在多个系统里把业务真的跑完
作者：机智流发布日期：2026-05-08 20:30:00
> 本文来自社区投稿导读：先说结论Claw-Eval-Live 不是简单把 Claw-Eval 扩大一圈，而是在回答另一个更现实的问题：当 Agent 的能力开始接近部署边界时，评测基准不能只测“模型
阅读全文
从数据补充到知识蒸馏：一次自我认知微调的优化实践
作者：机智流发布日期：2026-05-07 20:30:00
> 作者：李剑锋1. 前言1.1 前情回顾在上一节课中，我们通过 QLoRA 算法，将 swift 团队开源的自我认知数据集与基于 qwen3-32B 蒸馏得到的日常对话数据集（带思考）结合起来，完成
阅读全文
机器人决策新范式：港大&小鹏机器人提出DIAL，让AI机器人“想清楚”再动手，效率提升10倍
作者：机智流发布日期：2026-05-06 21:30:00
图片由 AI 生成在机器人执行“把桌上的苹果放进篮子里”这样的指令时，我们期望它不仅能“看到”苹果和篮子，更能“理解”任务目标，并规划出一系列连贯的抓取、移动、放置动作。近年来，借助强大的预训练视觉-
阅读全文
YC CEO：现在的 AI 是它有史以来最糟糕的版本｜机智流 AI 日报 5/4
作者：机智流发布日期：2026-05-05 09:42:59
SMARTFLOW · AI DAILY · 05/04「现在的 AI 是它有史以来最糟糕的版本。」— Garry Tan（YC CEO）5-4 转发的一段评论2026-05-04 · 第 125 期
阅读全文
月活 3 万也要关：AI 公司只剩两条赚钱路｜机智流 AI 日报 5/3
作者：机智流发布日期：2026-05-04 09:59:36
SMARTFLOW · AI DAILY · 05/03月活 3 万也要关，AI 公司只剩两条赚钱路。2026-05-03 · 第 124 期 · 精选 3 条值得读5-3 在 swyx 主办的 AI
阅读全文
Sam Altman：旧岗会消失，新岗会涌现｜机智流 AI 日报 5/2
作者：机智流发布日期：2026-05-03 09:28:17
SMARTFLOW · AI DAILY · 05/02「旧岗会消失，新岗会涌现。」— Sam Altman5-2 GPT-5.5 派对日 · 一条推文回复2026-05-02 · 第 123 期 ·
阅读全文
Karpathy：LLM 不只是加速旧工作｜机智流 AI 日报 5/1
作者：机智流发布日期：2026-05-02 11:34:24
SMARTFLOW · AI DAILY · 05/01「LLM 不只是在加速已有的东西，是在打开几条全新的地平线。」— Andrej Karpathy4-29 Sequoia Ascent 2026
阅读全文
4月AI月报｜各领风骚数十天｜AI 厂商的军备竞赛 30 天
作者：机智流发布日期：2026-05-01 18:12:24
机智流 · 4 月 AI 月报各领风骚数十天AI 厂商的军备竞赛 30 天825 条头条 · 8 个新前沿模型 · 3 把 SDK · 4 家同日入场安全 Agent2026 年 4 月，一位没受过高
阅读全文
从 LoRA 到 QLoRA：小显存环境下的大模型高效微调实践
作者：机智流发布日期：2026-04-30 20:00:00
> 作者：李剑锋前言在上节课中，我们已经基于 LoRA 微调方法，结合 swift 团队开源的自我认知数据集，完成了对 qwen3-0.6B 模型的高效参数微调实践。通过这一过程，大家初步掌握了在有限
阅读全文
硬件开发新革命：剑桥大学等机构提出首个新兴硬件内核生成基准KernelCraft，展示LLM生成汇编内核的潜力
作者：机智流发布日期：2026-04-29 22:30:00
图片由 AI 生成当我们谈论AI加速器时，通常会想到GPU或TPU。但为了追求极致的能效和吞吐量，越来越多的定制化AI加速器正在涌现。这些新兴硬件平台往往拥有独特的指令集架构，这为软件开发带来了巨大的
阅读全文
智能体推理平均降低27%功耗？伊利诺伊与密歇根大学提出KAIROS，用“上下文”实现高效节能
作者：机智流发布日期：2026-04-28 20:30:00
图片由 AI 生成在当今的AI数据中心，电力消耗已成为一个日益严峻的瓶颈。随着大语言模型从简单的单轮问答，演进到能够自主规划、调用工具、执行多轮复杂任务的“智能体”形态，其背后的计算模式发生了根本性变
阅读全文
产品经理向下，工程师向上：Claude Code 背后的 AI 职业融合
作者：机智流发布日期：2026-04-27 21:00:20
> 北辰编译今天没什么特别大的 AI 新闻。那就不追热点了，聊一段前两天听到的播客（也同步放出文字稿的中文翻译）。Lenny 采访了 Anthropic 的 Cat Wu。她负责 Claude Cod
阅读全文
Anthropic 产品团队为什么能跑得这么快 — Lenny 播客翻译
作者：机智流发布日期：2026-04-27 21:00:20
> 本文由 AI 辅助翻译，北辰校对Lenny Rachitsky，产品领域知名作者与播客主持人，主持 Lenny’s Podcast。Cat Wu 是 Anthropic 的产品负责人之一，负责
阅读全文