5本值得精读的AI实战书籍,助你从入门到精通大模型工程(附链接)
5 本值得精读的 AI 实战书籍,助你从入门到精通大模型工程在 AI 技术日新月异的今天,光靠博客和教程已远远不够。系统性学习,才是构建扎实工程能力的关键。随着大模型(LLM)技术从实验室走向产业落地
阅读全文5 本值得精读的 AI 实战书籍,助你从入门到精通大模型工程在 AI 技术日新月异的今天,光靠博客和教程已远远不够。系统性学习,才是构建扎实工程能力的关键。随着大模型(LLM)技术从实验室走向产业落地
阅读全文构建一个可用于生产的、工具增强型 LLM Agent,具备 token 流式输出、代码执行、搜索能力,以及 FastAPI 带来的极速表现。当 ChatGPT 刚面世时,感觉就像魔法。但新鲜感很快过去
阅读全文“Talk is cheap. Show me the code.” — Linus Torvalds在 AI 时代,这句话比以往任何时候都更真实。最近几个月,“Agentic AI” 成为行业热词。
阅读全文在技术领域,总有那么一刻会让人感觉有点“太魔法”了。这就是其中之一。Postman 悄悄发布了一个 AI Agent Builder,让你把超过 100,000 个可用的任意 API 转成可用的 MC
阅读全文在大模型时代,如何让 AI 系统更准确、更高效地回答用户问题,是开发者和研究者共同关注的核心议题。传统的 RAG(Retrieval-Augmented Generation,检索增强生成) 技术虽然
阅读全文那层几乎没人谈论、却决定你的 AI 应用成败的排序层。Google、Netflix、带网页搜索的 ChatGPT,它们有何共通点?都有一个排序算法来决定你首先看到什么。不是决定“有什么”,而是决定你“
阅读全文“在我本地能跑”和“上线后能用”,中间可能隔着一个太平洋。如果你开发过智能体(Agent),你一定深有体会:“在我机器上能跑” 和 “在生产环境稳定运行” 之间的差距,可能大到令人绝望。传统软件开发的
阅读全文我们正从“与 AI 聊天”的时代迈向“用 AI 构建”的时代。象征 2025 年人工智能的快速发展及其影响。由 AI 生成的图像每隔几年,科技世界就会发生一次转变。但眼下 AI 正在发生的变化,比过去
阅读全文上个月,谷歌没有大张旗鼓,也没有召开发布会,却在连续 5 天内默默释出了 5 篇关于 AI Agent 的重磅白皮书,总计超过 250 页。内容覆盖从“什么是智能体”到“如何让智能体真正走向生产环境”
阅读全文复杂的 Agent 系统往往需要一段时间才能处理完用户的请求。LangChain 实现了一套流式传输系统,用于实时呈现 Agent 系统的处理过程。流式传输对于提升基于 LLM 构建的应用程序的响应速
阅读全文大模型(LLM)能够自动化大量任务。自2022年ChatGPT发布以来,市场上涌现出越来越多利用 LLM 的AI产品。然而,我们在使用 LLM 的方式上仍有许多可改进之处。例如,使用提示词优化工具改进
阅读全文由 Sora 生成大多数开发者在不同项目里都在重复相同的环境搭建、调试或数据清洗工作。选对库可以把这些日常重复动作自动化,省下大量时间和精力。下面这些库能在一周内悄悄帮你省下好几个小时。它们简化 lo
阅读全文你有没有想过有一天,只需对 AI 助手说一句话,它就能自动帮你微调一个大语言模型(LLM),从数据校验、GPU调度、训练监控,到最终把模型上传到 Hugging Face Hub,全程无需你动一行代码
阅读全文大家谈论“agentic AI”,好像只有大实验室才能做出来。 并不是。你完全可以在几天内做出真正能放进作品集的 agent 项目。没错——那种因为能solve problems而助你求职的项目,而不
阅读全文谷歌刚刚发布了一份重磅指南,聚焦于多智能体系统中的高效上下文工程。这对AI开发者来说绝对值得关注!(强烈建议收藏)https://developers.googleblog.com/en/archit
阅读全文由 Sora 生成大多数开发者在不同项目里都在重复相同的环境搭建、调试或数据清洗工作。选对库可以把这些日常重复动作自动化,省下大量时间和精力。下面这些库能在一周内悄悄帮你省下好几个小时。它们简化 lo
阅读全文照片来自 Jason Yuen,发布于 Unsplash小工具,大作用。The Python Toolbelt:12 个能解决大问题的小型库发现一打容易被忽视的 Python 库,它们安静地让开发更顺
阅读全文大家好!我从事大语言模型(LLM)的微调工作已经超过两年了。在这段时间里,从 BERT 到 Llama、Qwen、ChatGLM……我踩过不少坑,也积累了不少经验。今天,我想和大家分享一个非常实用的话
阅读全文在 Sora 中生成几乎每位开发者都经历过因缺少数据而测试受阻的时刻。你做了一个 API、表单或 dashboard,但没有足够真实的输入,测试结果就缺乏参考意义。手动编造假邮箱、手机号或地址,对付几
阅读全文2025年已成为AI智能体元年!8月,国务院发布了《关于深入实施“人工智能+”行动的意见》,明确提出到2030年实现“智能体等应用普及率超90%”的目标。同时,AI智能体正以前所未有的速度走向产业核心
阅读全文一家高速成长的电商初创公司的工程团队正在进行一场经典讨论。他们的推荐引擎需要语义搜索来将用户查询与数百万条商品描述匹配。他们该选择像 Qdrant 或 Pinecone 这样的专用向量数据库,还是使用
阅读全文本次我在《FastAPI+Streamlit打造一套智能体应用GUI展示平台》的基础上加入了三点更新:使用 PostgreSQL 作为 Checkpointer,将 LangGraph Agent 从
阅读全文在 LangChain 中,消息(Message)是模型上下文的基本单元。它们代表了模型的输入和输出,在与LLM交互时,承载着对话状态所需的内容和元数据。消息具有以下属性:角色(Role):标识消息类
阅读全文12月的第一天想和大家分享的这本书,是信息论的开山之作——《通信的数学理论》。克劳德·香农(Claude Shannon)提出了一个非常惊人的观点:信息是可以被量化的。他用“熵”来衡量信息的不确定性,
阅读全文打造真正好用的 AI 工具:Python、FastAPI 与 LangChain 一次搞懂为什么你的 AI 脚本值得更好的呈现方式想象你做了个很酷的 AI 模型,会回答问题或总结文本。在 Jupyte
阅读全文大型语言模型(LLM)是一种强大的 AI 工具,能够像人类一样理解与生成文本。它们具有高度通用性,可以用于写作、翻译、摘要和问答等任务,而无需针对每个任务进行额外的专业训练。除了文本生成之外,许多模型
阅读全文优化 Agentic 方案离不开软件工程:要让各组件能够协调协作、并行运行,并能高效与系统交互。比如 Speculative Execution(推测执行),通过提前处理可预测的请求来降低延迟;再比如
阅读全文在过去的几天,我一直在思考如何以更简单更高效地形式学习 LangChain 和 LangGraph 1.0 的特性,好在让我探索出了一条道路:在做中学!前几天我发表了一篇关于 AgengHub 的文章
阅读全文在大语言模型(LLM)的世界里,有一个长期困扰工程师和研究者的“不可能三角”:推理速度、生成质量、计算成本——三者难以兼得。尤其是速度与质量之间的权衡,几乎成了行业共识:自回归模型(如GPT系列):质
阅读全文今天我们来探讨一次 RAG 效率的大飞跃。为什么传统 RAG 会又慢又浪费传统 RAG 流水线常见做法是把一堆检索到的文本 chunk 塞进 prompt,然后交给 LLM 处理。但这些 chunk
阅读全文