让用户与数据库对话:使用Streamlit构建基于RAG的SQL助手
RAG(检索增强生成)系统通过利用大语言模型(LLM)并将其与特定数据源集成,使用户可以使用自然语言提出问题。我将在本文重点介绍 RAG 的一个具体应用:将用户的自然语言转化成 SQL 查询并在数据库
阅读全文RAG(检索增强生成)系统通过利用大语言模型(LLM)并将其与特定数据源集成,使用户可以使用自然语言提出问题。我将在本文重点介绍 RAG 的一个具体应用:将用户的自然语言转化成 SQL 查询并在数据库
阅读全文从大模型到智能体,从视觉到游戏,从音频到3D,全部开源、可实践,而且完全免费。最后一门课适用于所有人,绝不可错过!1. 大模型课程使用 HuggingFace Transformers 训练、微调和部
阅读全文最近,阿里云通义点金团队和苏州大学合作,带来了一款超级厉害的金融AI大模型——DianJin-R1!这个模型专为金融任务设计,融合了前沿技术和海量数据,堪称金融领域的“推理大师”。DianJin-R1
阅读全文我们打造了一个全新的开源权重推理模型:Phi-4,参数量为14B,基于约 140 万条精心策划的推理示例进行了监督微调(SFT),并进行了少量强化学习(RL)训练。这个模型表现惊人,简直是“小钢炮”。
阅读全文本文回顾了智能体系统中的常见模式。在描述这些系统时,将工作流(workflows)与智能体(Agent)区分开来是有帮助的。Anthropic 的文章《Building Effective Agent
阅读全文随着AI语言模型的不断进步,它们已能处理日益复杂的任务。然而,在提供清晰、逐步的指令时,这些模型往往表现得更好。任务分解是一种强大的方法,能够将复杂问题拆解为更小、更易处理的子任务。这种方法不仅提升了
阅读全文Crawl4AI 是一个专为大模型(LLM)设计的开源网页爬虫和数据提取工具。它支持异步架构,能够高效地从多个网站中提取结构化数据,输出格式包括 JSON、清理过的 HTML 和 Markdown,方
阅读全文笔者开始写公账号大概一个月时间了,期间收到很多同学的私信,发现大家对LLM基础技术还是比较感兴趣,故根据我现在已有的知识,给大家整理一个脑图;主要梳理了基础技术篇的脑图,后续文章会继续给出开发、应用偏
阅读全文虽然目前关于它的信息还未全部公开,但从已经泄露的资料来看,DeepSeek R2 不仅是技术上的全面升级,更是中国 AI 走向“去西方依赖”的重要一步。🔧1.2万亿参数背后的“极致性价比”DeepSe
阅读全文🎯一键下载模型、训练微调、搭建RAG应用、直接对话大模型……📦开箱即用,完全开源,本地运行,隐私安全满分!🧪强烈推荐给:LLM 开发者 / 独立研究者 / AI 极客 / 学术工作者!🔗 GitHub
阅读全文近期,打造出全球首个AI软件工程师 Devin 的 Cognition 团队,又一次放出“大招”:他们开源了一个名为 DeepWiki 的项目,旨在自动生成 GitHub 项目的可读性极强的文档页面,
阅读全文如果你对 Transformer 感兴趣,或想了解 OpenAI、谷歌、Meta 等顶尖研究者的最新思考与实践——那一定不能错过斯坦福大学开设的这门神课:CS25 - Transformers Uni
阅读全文当前,我们正处在Agent开发的‘工程化转折点’。打造一个真正“可上线”的Agent系统,不再只是拼接组件,而是围绕四个核心模块进行有机组合。在大模型持续进化的今天,Agent 成为很多人眼中的“超级
阅读全文角色提示(Role Prompting)是提示工程中的一种强大技术,允许我们引导AI模型采用特定的人物角色或专业知识。这种方法可以显著提高AI生成的响应质量和相关性,使其更适合特定任务或领域。本教程探
阅读全文在众多RAG方法中,NodeRAG以其独特的图结构框架脱颖而出。NodeRAG通过异构图结构和先进的检索机制,为LLM提供更精准、更高效的外部知识支持。本文将深入介绍NodeRAG的核心特性、优势及其
阅读全文chatGPT 的火爆程度,很容易让人忽视生成式人工智能的独特风险。大模型非常擅长创作听起来像母语人士的散文。但正因为如此,大模型可能会给人一种错觉,认为它们拥有真正的理解力。其实不然!在本视频中,P
阅读全文在AI大模型领域,微软再次以惊人之势打破常规:BitNet,一个专为1位LLM(Large Language Model)设计的推理框架,正以前所未有的极简精度和超高性能,颠覆你对算力与资源的所有认知
阅读全文提示调优是一种高效且低成本的方法,它能够使 AI 基础模型适应新的下游任务,而无需重新训练模型和更新其权重。在本视频中,Martin Keen 讨论了三种定制预训练 LLM 以实现专业化的方案,包括:
阅读全文随着大语言模型(LLM)的持续演进,RAG(检索增强生成)技术也在飞速发展。从早期的简单文档检索,到如今与 Agent、多模态、图结构等深度结合,RAG 正逐渐变得更智能、更具推理能力。今天,我们整理
阅读全文AI 框架和 SDK 之间的竞争日益激烈。随着谷歌最近推出其 Agent Development Kit(ADK),可以明显看出各大科技巨头都在积极布局 AI Agent(智能体)开发领域。本人已经使
阅读全文前阵子,Anthropic 提出的 MCP 引发了大量关注。它常被形容为“AI 智能体领域的 USB-C”,因为 MCP 承诺将标准化智能体之间的通信方式。这个理念非常直观:通过一个通用接口连接不同的
阅读全文PyTorch 被广泛认为是众多深度学习研究人员和工程师的首选框架,然而,并非所有人都能充分发挥其潜力。目前,PyTorch 就像一头难以驯服的猛兽,许多强大的性能特性隐藏在开发者文档的深处。网上常见
阅读全文OpenAI周三发布新款AI模型o3和o4-mini,模仿人类的推理过程,解决复杂编程和视觉任务的推理。这是该公司首次推出能够独立使用全部ChatGPT工具的推理模型——包括网页浏览、Python编程
阅读全文尽管大语言模型(LLM)在文本生成方面非常强大,但它们有时会生成过于开放或不符合预期特征的内容。通过引入受限与引导生成技术,我们可以对模型的输出施加更多控制,使其更贴合特定任务的需求,或遵循特定规则与
阅读全文我相信我们每个人都已经快要被 LLM(大语言模型)研究界的节奏“卷”麻了。几乎每天都会有一款新的 SOTA(最先进)模型横空出世,打破现有基准。如果你曾好奇,这样的技术爆发背后到底是什么驱动力——其实
阅读全文我将在本文通过一个超快速教程,向你展示如何使用 Pydantic AI、MCP 和高级网络爬虫技术,构建一个适用于商业或个人用途的强大的多智能体聊天机器人。MCP 作为一种开放标准,正逐渐被接受。在
阅读全文OpenAI 最近发布了 GPT-4.1 系列,包括 GPT-4.1、GPT-4.1-mini 和 GPT-4.1-nano,分别针对高智能、平衡和低延迟任务。GPT-4.1 支持 100 万 tok
阅读全文2025 年以来,AI 大模型领域持续火热,从 DeepSeek、GPT-4、Claude 3 到 Gemini 2.0 等等,各家模型参数动辄千亿级,能力日新月异。在应用层,RAG、Agent、Re
阅读全文在这篇文章中,我将介绍如何使用 LangGraph、Agentic RAR、Nano-GraphRAG 以及 Claude 3.7 Sonnet 来创建一个基于智能推理(Agentic RAR)的聊天
阅读全文