AI大模型调参指北笔记

查找二进制数中最长连续0序列
作者：AI大模型调参指北笔记发布日期：2026-01-08 22:00:00
def longest_consecutive_zeros(n): count = 0 max_count = 0 while n > 0: if n & 1 ==
阅读全文
LM-as-a-judge：LLM评估指南
作者：AI大模型调参指北笔记发布日期：2026-01-06 21:13:00
LM-as-a-judge 是一种常见的评估基于 LLM（语言模型）技术的产品的方法。它之所以受欢迎是有原因的：在评估开放式文本输出时，它是一种相较于昂贵的人工评估而言切实可行的替代方案。评判生成文
阅读全文
LLM Sequence Packing
作者：AI大模型调参指北笔记发布日期：2026-01-05 21:00:00
训练大型语言模型（LLMs）是一项计算量极大的任务。这需要大量的数据、强大的硬件以及巧妙的优化技术。其中有一种不太常被提及的技术，那就是使用压缩序列，以便在每次训练步骤中充分利用所选的上下文长度。想
阅读全文
深入了解SmoothQuant：大模型高效量化背后的数学原理
作者：AI大模型调参指北笔记发布日期：2026-01-04 22:06:23
在这里插入图片描述@torch.no_grad()def smooth_gemm(gemm_weights, act_scales, la
阅读全文
Pygame RPG Tutorial 21 – Creating a new Enemy type
作者：AI大模型调参指北笔记发布日期：2026-01-01 21:22:00
只有一种敌人类型的游戏注定是乏味的。在这个Pygame RPG教程中，我们将在游戏中添加一种新的敌人类型。它不仅看起来会完全不同，我们还会改变它的攻击方式，从近战到远程。我创造了下面的敌人，比第一个敌
阅读全文
中文LLM指令微调动态机制
作者：AI大模型调参指北笔记发布日期：2025-12-29 21:00:00
指令调优是一种新兴的方法，正以其独特的魅力激发着大型语言模型（LLM）的无限智能潜能。此前，众多学者围绕数据量、模型规模等要素，对英语模型展开了深入剖析。然而，指令调优在其他语言领域的拓展特性，却
阅读全文
Pygame RPG Tutorial 19 – Magic Attacks
作者：AI大模型调参指北笔记发布日期：2025-12-28 21:00:00
还记得我们之前在教程中创造的魔法系统吗？现在我们将使用它，在Pygame RPG中植入Magic Attacks。其理念是使用魔法攻击需要固定数量的法力值。正如我们之前在系列中所解释的，我们通过击败敌
阅读全文
Pygame RPG Tutorial – Code Review 3
作者：AI大模型调参指北笔记发布日期：2025-12-27 21:00:00
正如承诺的那样，我们每6个教程都会举行一次代码审查，在那里我们将所有代码编译在一起供您查看。您还可以在页面底部找到一个下载链接，其中包含一个文件，其中包含到目前为止我们使用的所有代码+图像和动画。尝试
阅读全文
理解 memory order
作者：AI大模型调参指北笔记发布日期：2025-12-26 21:00:00
在C++多线程编程中，a.load(std::memory_order_acquire) 和 a.store(is_last, std::memory_order_release) 这一对操作的核心
阅读全文
VSCode C++插件
作者：AI大模型调参指北笔记发布日期：2025-12-25 21:00:00
下载安装离线安装包到下面的URL中下载 VSIX：https://github.com/microsoft/vscode-cpptools/releasesVSCode打开插件中心，通过 insta
阅读全文
TensorRT-LLM 0.5.0 源码
作者：AI大模型调参指北笔记发布日期：2025-12-24 21:00:00
安装依赖# .gitmodules[submodule "3rdparty/cutlass"] path = 3rdparty/cutlass url = https://github.
阅读全文
ART·E: How We Built an Email Research Agent That Beats o3
作者：AI大模型调参指北笔记发布日期：2025-12-23 21:00:00
OpenAI 的 Deep Research 版本展示了强化学习（RL）在教导智能体完成特定任务方面的有效性。与之前的智能体相比，这是在效果上迈出的一大步。在我们的新项目“ART·E”中，我们将这种
阅读全文
Pygame RPG Tutorial 18 – Pause button
作者：AI大模型调参指北笔记发布日期：2025-12-20 21:00:00
不管你事先做了多少计划，总有一些问题只有在你开发游戏的过程中才会暴露出来。同样地，当我们开发这款游戏时，我注意到它缺少一些功能。最明显的是，我们目前缺乏中途暂停游戏的能力，也没有任何方法让我们在进入地
阅读全文
Pygame RPG Tutorial 17 – Item Drops
作者：AI大模型调参指北笔记发布日期：2025-12-19 21:00:00
我们已经成功地创造了一个非常基本的RPG环境，包括敌人、关卡通关提示和状态栏等。然而，我们忽略了一个非常“RPG”的元素，即道具掉落。道具掉落是一个非常棒的功能，因为它可以带来灵活性和广泛的功能。从恢
阅读全文
std::jthread 和 std::stop_token
作者：AI大模型调参指北笔记发布日期：2025-12-16 21:45:49
#ifdef __cpp_lib_jthread/** * @brief The type of threads to use. In C++20 and later we use `std::jt
阅读全文
Windows 安装 ubuntu VMware 开发环境
作者：AI大模型调参指北笔记发布日期：2025-12-15 21:45:55
安装 WMwavre 和 Ubuntu在 https://github.com/skrik2/VM-download?tab=readme-ov-file 中下载 17.6.3 的 WM Work
阅读全文
Pygame RPG Tutorial 16 – Stage Clear Display
作者：AI大模型调参指北笔记发布日期：2025-12-14 21:00:00
我们很好地添加了“Next Stage”显示，即在我们按下“n”按钮后继续进行下一阶段。我们这么做的原因当然是为了给下一阶段的进展添加一些视觉指示。但我们仍然缺少一个视觉指标。在这篇Pygame RP
阅读全文
[[nodiscard]] 的用法
作者：AI大模型调参指北笔记发布日期：2025-12-12 22:07:59
在 C++17 及更高版本中，[[nodiscard]] 是一个编译器属性，用于标记不应被忽略的函数返回值、类或枚举类型。其核心作用是提升代码健壮性，避免因忽略关键返回值导致的逻辑错误或资源泄漏。以
阅读全文
用了shared_ptr为何还会内存泄漏？你可能需要weak_ptr这把钥匙
作者：AI大模型调参指北笔记发布日期：2025-12-11 21:00:00
std::weak_ptr 是 C++ 标准库中一个非常重要的智能指针，用于解决 std::shared_ptr 的循环引用问题，并作为共享资源的观察者而不影响其生命周期。下面这个表格帮你快速把握
阅读全文
最长有效括号
作者：AI大模型调参指北笔记发布日期：2025-12-10 22:00:11
困难给你一个只包含 '(' 和 ')' 的字符串，找出最长有效（格式正确且连续）括号子串的长度。示例 1：输入：s = "(()"输出：2解释：最长有效括号子串是 "()"示例 2：输入：s = "
阅读全文
LLM权重量化导论
作者：AI大模型调参指北笔记发布日期：2025-12-08 21:39:21
在这里插入图片描述大型语言模型（llm）以其广泛的计算需求而闻名。通常，模型的大小是通过将参数的数量（大小）乘以这些值的精度（数据类型）来计算的。但是，为了节省内存，可以通过称为量化的过程使用精度较
阅读全文
Pygame RPG Tutorial 15 – Status Bar
作者：AI大模型调参指北笔记发布日期：2025-12-07 21:00:00
在上一篇教程中，我们在游戏中引入了两个新的“系统”，Mana和Experience。目前，法力值和经验值只会在后台累积，没有任何视觉指示；也没有任何实际使用的法力和经验，我们收集。这是我们计划在接下来
阅读全文
如何在 docker 中配置 CST 时间
作者：AI大模型调参指北笔记发布日期：2025-12-06 21:00:00
问题：docker中date的时间是UTC，怎么用UTC+8的呢？在Docker中设置UTC+8（中国标准时间）时区，可通过以下方式实现，具体选择取决于使用场景和需求：FROM ubuntu:lat
阅读全文
流操控器函数
作者：AI大模型调参指北笔记发布日期：2025-12-05 21:00:00
std::ostream& (*f)(std::ostream&) 是 C++ 中一个重要的概念，它与标准输出流的高级用法密切相关。简单来说，这是一个函数指针，通常用于实现或使用流操控器。下面这个表
阅读全文
intro to GRPO an efficient policy optimization method
作者：AI大模型调参指北笔记发布日期：2025-12-04 21:49:00
Introduction强化学习（RL）在大型语言模型（LLMs）完成初始训练后，已成为提升其性能的强大工具，尤其在需要大量推理的任务中表现突出。DeepSeek 公司近期推出的 DeepSeek-
阅读全文
GPTQ 4-bit量化
作者：AI大模型调参指北笔记发布日期：2025-12-02 22:02:59
在这里插入图片描述权重量化的最新进展使我们能够在消费级硬件上运行大量大型语言模型，例如在RTX 3090 GPU上运行LLaMA-30B模型。这要归功于性能降低最小的新颖4-bit量化技术，如GPT
阅读全文
一张表搞定C++三种继承方式，程序员必备
作者：AI大模型调参指北笔记发布日期：2025-12-01 22:21:20
在C++中，继承是面向对象编程的核心特性之一，它允许我们基于已有的类（基类）来创建新的类（派生类），从而实现代码的复用和层次的构建。理解三种继承方式（公有、保护和私有）对于设计清晰的类关系至关重要。
阅读全文
Pygame RPG Tutorial 14 – Player Experience and Mana
作者：AI大模型调参指北笔记发布日期：2025-11-30 21:00:00
是时候“充实”我们的游戏并添加一些新机制了。大多数RPG游戏都有两个特别之处，即玩家升级系统以及各种不同的特殊攻击动作。在执行这些功能之前，我们还需要另外两个支持功能，“Mana”和“Experien
阅读全文
Pygame RPG Tutorial 13 – Next Stage Display
作者：AI大模型调参指北笔记发布日期：2025-11-28 21:00:00
在过去的几个教程中，我们创建了一个完整的关卡系统，每个关卡有固定数量的敌人。为了“推进”到下一个stage，我们将“advance stage”代码绑定到键盘上的“n”键。还有许多其他方法可以做到这一
阅读全文
网络端口复用
作者：AI大模型调参指北笔记发布日期：2025-11-27 21:00:00
在现代操作系统中，通过特定的套接字选项，允许多个线程（或进程）同时监听同一个网络端口，这是一种常见的高性能服务器设计模式。int bds_create_listen_socket(const cha
阅读全文