深度涌现

如何用 4×RTX4090 + AMD EPYC 7B13 跑 Qwen3.5-122B：基于 KTransformers AVX2 的低显存推理实践
作者：深度涌现发布日期：2026-04-06 20:41:50
默认情况下，122B 级别模型（如 Qwen3.5-122B）基本等同于“多机多卡+百GB显存”的代名词。但随着 2026年3月27号 KTransformers 推理的 CPU-GPU 异构推理
阅读全文
LLM Proxy Inspector：OpenClaw 大模型 API 调用调试利器
作者：深度涌现发布日期：2026-03-26 22:05:41
OpenClaw 一个真实的痛点你有没有遇到过这种情况：OpenClaw 调用大模型 API，返回结果不对——但你不知道是请求写错了，还是模型返回有问题，还是你的流式解析逻辑出了 bug？print
阅读全文