全部安全开发新闻数码摄影汽车北京AIIT其他
  • 文章封面

    SmolVLM2: 让视频理解能力触手可及

    作者:Hugging Face发布日期:2025-03-21 23:00:00

    一句话总结: SmolVLM 现已具备更强的视觉理解能力📺SmolVLM2 标志着视频理解技术的根本性转变——从依赖海量计算资源的巨型模型,转向可在任何设备运行的轻量级模型。我们的目标很简单: 让视频

    阅读全文
  • 文章封面

    社区供稿 | 阶跃星辰 Step-Video-TI2V 图生视频模型开源,运动可控,动漫效果尤佳!

    作者:Hugging Face发布日期:2025-03-20 19:00:00

    在今年 2 月,阶跃星辰开源了两款 Step 系列多模态大模型——Step-Video-T2V 视频生成模型和 Step-Audio 语音模型,为开源社区贡献了自己的多模态力量。今天,我们再接再厉,继

    阅读全文
  • 文章封面

    在 Hugging Face Spaces 上使用 Gradio 免费运行 ComfyUI 工作流

    作者:Hugging Face发布日期:2025-03-18 22:30:00

    简介在本教程中,我将逐步指导如何将一个复杂的 ComfyUI 工作流转换为一个简单的 Gradio 应用程序,并讲解如何将其部署在 Hugging Face Spaces 的 ZeroGPU 无服务器

    阅读全文
  • 文章封面

    在 Hugging Face 上部署语音转语音模型

    作者:Hugging Face发布日期:2025-03-11 10:30:00

    介绍S2S (语音到语音)是 Hugging Face 社区内存在的一个令人兴奋的新项目,它结合了多种先进的模型,创造出几乎天衣无缝的体验: 你输入语音,系统会用合成的声音进行回复。https://g

    阅读全文
  • 文章封面

    LayerSkip: 使用自推测解码加速大模型推理

    作者:Hugging Face发布日期:2025-03-10 10:30:00

    自推测解码是一种新颖的文本生成方法,它结合了推测解码 (Speculative Decoding) 的优势和大语言模型 (LLM) 的提前退出 (Early Exit) 机制。该方法出自论文Layer

    阅读全文
上一页