全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    让用户与数据库对话:使用Streamlit构建基于RAG的SQL助手

    作者:PyTorch研习社发布日期:2025-05-05 08:00:00

    RAG(检索增强生成)系统通过利用大语言模型(LLM)并将其与特定数据源集成,使用户可以使用自然语言提出问题。我将在本文重点介绍 RAG 的一个具体应用:将用户的自然语言转化成 SQL 查询并在数据库

    阅读全文
  • 文章封面

    冲!HuggingFace刚刚推出了9门免费AI课程,最后一门绝不可错过!

    作者:PyTorch研习社发布日期:2025-05-04 19:36:48

    从大模型到智能体,从视觉到游戏,从音频到3D,全部开源、可实践,而且完全免费。最后一门课适用于所有人,绝不可错过!1. 大模型课程使用 HuggingFace Transformers 训练、微调和部

    阅读全文
  • 文章封面

    阿里联手苏州大学,发布金融推理大模型:DianJin-R1,32B模型荣膺榜首

    作者:PyTorch研习社发布日期:2025-05-03 15:16:21

    最近,阿里云通义点金团队和苏州大学合作,带来了一款超级厉害的金融AI大模型——DianJin-R1!这个模型专为金融任务设计,融合了前沿技术和海量数据,堪称金融领域的“推理大师”。DianJin-R1

    阅读全文
  • 文章封面

    继Qwen3、DeepSeek之后微软重磅开源Phi4推理大模型:新一轮百模大战开始了

    作者:PyTorch研习社发布日期:2025-05-02 20:20:52

    我们打造了一个全新的开源权重推理模型:Phi-4,参数量为14B,基于约 140 万条精心策划的推理示例进行了监督微调(SFT),并进行了少量强化学习(RL)训练。这个模型表现惊人,简直是“小钢炮”。

    阅读全文
  • 文章封面

    可视化+代码实践说明AI智能体系统中的常见模式

    作者:PyTorch研习社发布日期:2025-05-01 15:30:24

    本文回顾了智能体系统中的常见模式。在描述这些系统时,将工作流(workflows)与智能体(Agent)区分开来是有帮助的。Anthropic 的文章《Building Effective Agent

    阅读全文
  • 文章封面

    提示工程101第十课:任务分解

    作者:PyTorch研习社发布日期:2025-05-01 15:30:24

    随着AI语言模型的不断进步,它们已能处理日益复杂的任务。然而,在提供清晰、逐步的指令时,这些模型往往表现得更好。任务分解是一种强大的方法,能够将复杂问题拆解为更小、更易处理的子任务。这种方法不仅提升了

    阅读全文
  • 文章封面

    GitHub超4万颗星的Crawl4AI:为大模型打造的开源爬虫利器​

    作者:PyTorch研习社发布日期:2025-04-30 08:00:00

    Crawl4AI 是一个专为大模型(LLM)设计的开源网页爬虫和数据提取工具。它支持异步架构,能够高效地从多个网站中提取结构化数据,输出格式包括 JSON、清理过的 HTML 和 Markdown,方

    阅读全文
  • 文章封面

    LLM大型语言模型脑图-基础技术篇

    作者:PyTorch研习社发布日期:2025-04-30 08:00:00

    笔者开始写公账号大概一个月时间了,期间收到很多同学的私信,发现大家对LLM基础技术还是比较感兴趣,故根据我现在已有的知识,给大家整理一个脑图;主要梳理了基础技术篇的脑图,后续文章会继续给出开发、应用偏

    阅读全文
  • 文章封面

    DeepSeek R2 参数被“意外”泄漏

    作者:PyTorch研习社发布日期:2025-04-29 08:00:00

    虽然目前关于它的信息还未全部公开,但从已经泄露的资料来看,DeepSeek R2 不仅是技术上的全面升级,更是中国 AI 走向“去西方依赖”的重要一步。🔧1.2万亿参数背后的“极致性价比”DeepSe

    阅读全文
  • 文章封面

    Transformer Lab:100%本地运行的LLM工作站,开箱即用的全能选手!

    作者:PyTorch研习社发布日期:2025-04-28 08:00:00

    🎯一键下载模型、训练微调、搭建RAG应用、直接对话大模型……📦开箱即用,完全开源,本地运行,隐私安全满分!🧪强烈推荐给:LLM 开发者 / 独立研究者 / AI 极客 / 学术工作者!🔗 GitHub

    阅读全文
  • 文章封面

    Devin团队开源DeepWiki:助你快速读懂所有GitHub代码库!

    作者:PyTorch研习社发布日期:2025-04-27 22:31:30

    近期,打造出全球首个AI软件工程师 Devin 的 Cognition 团队,又一次放出“大招”:他们开源了一个名为 DeepWiki 的项目,旨在自动生成 GitHub 项目的可读性极强的文档页面,

    阅读全文
  • 文章封面

    OpenAI、谷歌等一线大模型科学家亲授!斯坦福CS25春季课程正式上线(附观看地址)

    作者:PyTorch研习社发布日期:2025-04-26 23:03:34

    如果你对 Transformer 感兴趣,或想了解 OpenAI、谷歌、Meta 等顶尖研究者的最新思考与实践——那一定不能错过斯坦福大学开设的这门神课:CS25 - Transformers Uni

    阅读全文
  • 文章封面

    从零到一构建Agent系统:四大模块 + 框架生态详解

    作者:PyTorch研习社发布日期:2025-04-25 08:00:00

    当前,我们正处在Agent开发的‘工程化转折点’。打造一个真正“可上线”的Agent系统,不再只是拼接组件,而是围绕四个核心模块进行有机组合。在大模型持续进化的今天,Agent 成为很多人眼中的“超级

    阅读全文
  • 文章封面

    提示工程101第九课:角色提示

    作者:PyTorch研习社发布日期:2025-04-25 08:00:00

    角色提示(Role Prompting)是提示工程中的一种强大技术,允许我们引导AI模型采用特定的人物角色或专业知识。这种方法可以显著提高AI生成的响应质量和相关性,使其更适合特定任务或领域。本教程探

    阅读全文
  • 文章封面

    大模型的幻觉问题

    作者:PyTorch研习社发布日期:2025-04-25 08:00:00

    像 chatGPT 这样的大型语言模型 (LLM) 可以在许多主题和领域生成看似权威的文章,但它们也容易“胡编乱造”。简直就是胡扯!在本视频中,Martin Keen 解释了不同类型的“LLM 幻觉”

    阅读全文
  • 文章封面

    NodeRAG:以图结构革新检索增强生成

    作者:PyTorch研习社发布日期:2025-04-24 08:00:00

    在众多RAG方法中,NodeRAG以其独特的图结构框架脱颖而出。NodeRAG通过异构图结构和先进的检索机制,为LLM提供更精准、更高效的外部知识支持。本文将深入介绍NodeRAG的核心特性、优势及其

    阅读全文
  • 文章封面

    大模型的风险及应对方法

    作者:PyTorch研习社发布日期:2025-04-24 08:00:00

    chatGPT 的火爆程度,很容易让人忽视生成式人工智能的独特风险。大模型非常擅长创作听起来像母语人士的散文。但正因为如此,大模型可能会给人一种错觉,认为它们拥有真正的理解力。其实不然!在本视频中,P

    阅读全文
  • 文章封面

    在CPU上运行100B模型只需4MB内存!微软BitNet掀了英伟达的桌子!

    作者:PyTorch研习社发布日期:2025-04-23 08:00:00

    在AI大模型领域,微软再次以惊人之势打破常规:BitNet,一个专为1位LLM(Large Language Model)设计的推理框架,正以前所未有的极简精度和超高性能,颠覆你对算力与资源的所有认知

    阅读全文
  • 文章封面

    三种定制预训练大模型以实现专业化的方案

    作者:PyTorch研习社发布日期:2025-04-23 08:00:00

    提示调优是一种高效且低成本的方法,它能够使 AI 基础模型适应新的下游任务,而无需重新训练模型和更新其权重。在本视频中,Martin Keen 讨论了三种定制预训练 LLM 以实现专业化的方案,包括:

    阅读全文
  • 文章封面

    RAG 正在重塑未来:最新 11 种新型 RAG 类型一次看懂!

    作者:PyTorch研习社发布日期:2025-04-22 08:00:00

    随着大语言模型(LLM)的持续演进,RAG(检索增强生成)技术也在飞速发展。从早期的简单文档检索,到如今与 Agent、多模态、图结构等深度结合,RAG 正逐渐变得更智能、更具推理能力。今天,我们整理

    阅读全文
  • 文章封面

    智能体框架大PK!谷歌ADK VS 微软Semantic Kernel

    作者:PyTorch研习社发布日期:2025-04-21 08:00:00

    AI 框架和 SDK 之间的竞争日益激烈。随着谷歌最近推出其 Agent Development Kit(ADK),可以明显看出各大科技巨头都在积极布局 AI Agent(智能体)开发领域。本人已经使

    阅读全文
  • 文章封面

    MCP很好,但安全问题不容忽视,智能体安全框架可以解决

    作者:PyTorch研习社发布日期:2025-04-20 08:00:00

    前阵子,Anthropic 提出的 MCP 引发了大量关注。它常被形容为“AI 智能体领域的 USB-C”,因为 MCP 承诺将标准化智能体之间的通信方式。这个理念非常直观:通过一个通用接口连接不同的

    阅读全文
  • 文章封面

    PyTorch性能调优全攻略:打造快速、简洁、可扩展的深度学习代码

    作者:PyTorch研习社发布日期:2025-04-19 08:00:00

    PyTorch 被广泛认为是众多深度学习研究人员和工程师的首选框架,然而,并非所有人都能充分发挥其潜力。目前,PyTorch 就像一头难以驯服的猛兽,许多强大的性能特性隐藏在开发者文档的深处。网上常见

    阅读全文
  • 文章封面

    OpenAI发新模型o3和o4-mini!首次实现“图像思维”,可利用所有ChatGPT工具

    作者:PyTorch研习社发布日期:2025-04-18 08:00:00

    OpenAI周三发布新款AI模型o3和o4-mini,模仿人类的推理过程,解决复杂编程和视觉任务的推理。这是该公司首次推出能够独立使用全部ChatGPT工具的推理模型——包括网页浏览、Python编程

    阅读全文
  • 文章封面

    提示工程101第八课:受限与引导生成

    作者:PyTorch研习社发布日期:2025-04-18 08:00:00

    尽管大语言模型(LLM)在文本生成方面非常强大,但它们有时会生成过于开放或不符合预期特征的内容。通过引入受限与引导生成技术,我们可以对模型的输出施加更多控制,使其更贴合特定任务的需求,或遵循特定规则与

    阅读全文
  • 文章封面

    揭秘大模型的训练方法:使用PyTorch进行超大规模深度学习模型训练

    作者:PyTorch研习社发布日期:2025-04-17 08:00:00

    我相信我们每个人都已经快要被 LLM(大语言模型)研究界的节奏“卷”麻了。几乎每天都会有一款新的 SOTA(最先进)模型横空出世,打破现有基准。如果你曾好奇,这样的技术爆发背后到底是什么驱动力——其实

    阅读全文
  • 文章封面

    建立强大AI智能体的关键:Pydantic AI+MCP+高级网络爬虫

    作者:PyTorch研习社发布日期:2025-04-16 08:00:00

    我将在本文通过一个超快速教程,向你展示如何使用 Pydantic AI、MCP 和高级网络爬虫技术,构建一个适用于商业或个人用途的强大的多智能体聊天机器人。MCP 作为一种开放标准,正逐渐被接受。在

    阅读全文
  • 文章封面

    关于OpenAI的GPT-4.1:你只需要关注这几点就够了

    作者:PyTorch研习社发布日期:2025-04-16 08:00:00

    OpenAI 最近发布了 GPT-4.1 系列,包括 GPT-4.1、GPT-4.1-mini 和 GPT-4.1-nano,分别针对高智能、平衡和低延迟任务。GPT-4.1 支持 100 万 tok

    阅读全文
  • 文章封面

    从零开始构建大模型:GitHub超44K Star的大模型教程

    作者:PyTorch研习社发布日期:2025-04-15 08:00:00

    2025 年以来,AI 大模型领域持续火热,从 DeepSeek、GPT-4、Claude 3 到 Gemini 2.0 等等,各家模型参数动辄千亿级,能力日新月异。在应用层,RAG、Agent、Re

    阅读全文
  • 文章封面

    Agentic RAR+Nano-GraphRAG+Claude 3.7 Sonnet=智能推理RAG系统

    作者:PyTorch研习社发布日期:2025-04-14 08:00:00

    在这篇文章中,我将介绍如何使用 LangGraph、Agentic RAR、Nano-GraphRAG 以及 Claude 3.7 Sonnet 来创建一个基于智能推理(Agentic RAR)的聊天

    阅读全文
上一页下一页