日常使用大模型的几种方法
著名的人工智能专家 Andrej Karpathy 在最新发布的视频《How I use LLMs: Andrej Karpathy》中揭示了 LLM 世界的演变。他用轻松的口吻带我们回顾了这个生态系
阅读全文著名的人工智能专家 Andrej Karpathy 在最新发布的视频《How I use LLMs: Andrej Karpathy》中揭示了 LLM 世界的演变。他用轻松的口吻带我们回顾了这个生态系
阅读全文Distilabel框架概述Distilabel是由Argilla团队开发的开源框架,专注于解决AI开发中的两大核心挑战:高质量合成数据生成与可靠的AI反馈机制。该框架通过模块化管道设计,将大语言模型
阅读全文今天跟大家推荐几个近期 GitHub 上颇为实用的开源工具,主打简单易用且高效,解放你的个人生产力。AI 数字侦探,全方位深挖了解公司通常我们在面试前,会对即将面试的公司进行了解,在国内可使用天眼查等
阅读全文我们知道,检索增强生成 RAG 通过整合外部知识库与生成模型,有效缓解了大模型在专业领域的知识局限性。传统的知识库以文本为主,通常依赖于纯文本嵌入来实现语义搜索和内容检索。然而,随着多模态数据需求的增
阅读全文初识 Pydantic当我第一次接触 FastAPI 时,不可避免地遇到了 Pydantic。在 FastAPI 的生态中,Pydantic 几乎是不可或缺的——它负责请求/响应数据的校验、序列化和转
阅读全文在 AI 音乐创作领域,近期一款名为 ACE-Step 的开源音乐生成模型正引起广泛关注。ACE-Step 是由国际知名音乐创作工具 ACE Studio 与 国内知名大模型 StepFun(阶跃星
阅读全文unsetunset前言unsetunset在做多Agent系统时,因为整个系统可能会经过多次Agent处理,耗时会比较高,如果不给前端展示Agent处理的过程,那么用户的体验就会非常不好,在用户的视
阅读全文1、破除迷思:重新定义"运势"的科学内涵你有没有想过,为什么有些人好像总是好运连连,而自己却总与机会擦肩而过?别再把这归结于命运!科学家发现,运气其实是可以用科学解释,还能靠后天努力提升的!作为产品经
阅读全文市场上的海外动态IP池大都按流量收费,每GB动辄几美元,数据采集成本实在太高。LLM大模型训练、 出海应用需要采集Google、YouTube、 Tiktok、Instagram、Facebook、A
阅读全文学术论文阅读常因晦涩的内容和语言壁垒让人望而却步,尤其对非英语母语者或新手研究者而言,理解复杂论文更是挑战。Mad-Professor 是一款开源的 AI 驱动学术论文阅读工具,集成 PDF 处理、
阅读全文你有没有发现,好朋友之间总会不约而同地买同款衣服,用同样的表情包,甚至连口头禅都一模一样?过去,心理学家们认为,这是因为人们在主动选择跟自己相似的人做朋友(俗称“物以类聚”)。但2024年发表在PNA
阅读全文NotebookLM 之前只能生成英文版的博客音频,但现在终于支持更多语言了,自然也包括中文。我们选择强化学习之父的一篇文章来体验下这种形式。这篇文章讨论了人工智能的新时代,即人工智能系统将主要通过与
阅读全文概要2015 年开始使用 Python 作为主力的开发语音,现在是 2025 年整整 10 年过去了。我想说、当年写的 Bug 社区也有责任。十年后修终于还是来了,自 python-3.14 开始 f
阅读全文deepwiki.com最近,独角兽 AI 公司 Cognition Labs 推出了一个开源项目——DeepWiki,旨在为 GitHub 上的公共代码仓库生成 AI 驱动的交互式文档,堪称「Git
阅读全文声明本文章中所有内容仅供学习交流使用,不用于其他任何目的,不提供完整代码,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关!本文章未经许可禁
阅读全文摄影:产品经理回锅肉当我们采购数据集时,有时候供应商会以JSON Lines的形式交付给我们。这种格式,本质上是文本格式,它每一行是一个JSON。例如,供应商给我们了一个文件小红书全量笔记.json
阅读全文哇,这太疯狂了。VS Code 的新 Agent 编辑模式简直太棒了。我想我可能又要把它作为我的主要集成开发环境了。它是你不知疲倦的自主编码伙伴,完全了解你的整个代码库。在你的命令下执行复杂的多步骤任
阅读全文Python 最近出了个大新闻:PEP-750 t-string 语法被正式采纳了!这意味着 Python 将在今年 10 月发布的 3.14 版本中引入一种新的字符串前缀 t,称为模板字符串(Tem
阅读全文在解析处理 PDF 文档时,我们经常要借助 OCR 工具提取内容,用于搜索、问答或数据整理。但大部分 OCR 工具存在许多痛点,比如:配置繁琐、模型庞大、图表识别差、精度低、识别结构乱、不能图文结合
阅读全文Trae 国际版越来越强了,刚刚更新后发现又多了两强。这几个模型都支持图片理解,因此可以附上图。本文主要第一时间提供这个情报,具体怎么玩儿大家自己去操作吧。 Trae 国际版是由字节跳动旗下新加坡公司
阅读全文在使用大模型的工具调用时,我们需要编写JSON Schema,例如下图的tools字段的值:这个Schema写起来非常麻烦,括号太多了,看着眼花。不信你肉眼看看,你需要几秒钟才能分清楚type: "
阅读全文推荐一个大模型周边项目一、项目简介Crawl4AI 是一款专为大语言模型(LLM)和 AI 应用设计的开源网页爬虫与数据抓取工具。它不仅能高效采集网页数据,还能直接输出结构化、干净的 Markdown
阅读全文文本转语音(TTS)领域又迎来一位重磅新星!由 Nari Labs 开发的 Dia-1.6B 以其超逼真的对话生成能力引发热议,仅开源两天便在 GitHub 收获 6.5K+ Star!据说其能力超
阅读全文本教程只用于学习探讨,不允许任何人使用技术进行违法操作,阅读教程即表示同意!为什么要学习加密算法在搞逆向进行抓包的时候,可以经常发现一些莫名其妙的字符串,可能是81dc9bdb52d04dc20036
阅读全文该篇主要分析某app的shield参数,该篇包含了unidbg补环境如何补okhttp3相关,trace算法分析,AES魔改算法,hmac+魔改md5算法,RC4算法,最新版本混淆力度加大,但算法中每
阅读全文支付宝开放平台近期推出的 MCP Server(@alipay/mcp-server-alipay)为开发者提供了一种高效便捷的解决方案,可将支付宝的交易创建、查询、退款等核心支付能力快速集成至 LL
阅读全文随着在线视频平台的普及,整理网课、教程或讲座内容成为许多人的需求,但手动记录耗时费力。今天推荐一款在 GitHub 上开源的 AI 视频笔记助手:BiliNote。只需输入 B 站或 YouTube
阅读全文本文将毫无保留地给你把 MCP(Model Context Protocol)的三大核心概念——Resources、Tools 和 Prompts——掰开揉碎讲清楚。MCP 是 2024 年底由 A
阅读全文今天要讨论一个让无数人抓狂的话题:如何高效导入百万级Excel数据。去年有家公司找到我,他们的电商系统遇到一个致命问题:每天需要导入20万条商品数据,但一执行就卡死,最长耗时超过3小时。更魔幻的是,重
阅读全文大表优化是一个老生常谈的话题,但随着业务规模的增长,总有人会“中招”。很多小伙伴的数据库在刚开始的时候表现良好,查询也很流畅,但一旦表中的数据量上了千万级,性能问题就开始浮现:查询慢、写入卡、分页拖沓
阅读全文