全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    如何用 4×RTX4090 + AMD EPYC 7B13 跑 Qwen3.5-122B:基于 KTransformers AVX2 的低显存推理实践

    作者:深度涌现发布日期:2026-04-06 20:41:50

    默认情况下,122B 级别模型(如 Qwen3.5-122B)基本等同于“多机多卡+百GB显存”的代名词。但随着 2026年3月27号 KTransformers 推理的 CPU-GPU 异构推理

    阅读全文
  • 文章封面

    LLM Proxy Inspector:OpenClaw 大模型 API 调用调试利器

    作者:深度涌现发布日期:2026-03-26 22:05:41

    OpenClaw 一个真实的痛点你有没有遇到过这种情况:OpenClaw 调用大模型 API,返回结果不对——但你不知道是请求写错了,还是模型返回有问题,还是你的流式解析逻辑出了 bug?print

    阅读全文