Hugging Face

用开源模型强化你的 OCR 工作流
作者：Hugging Face发布日期：2025-12-01 13:52:39
我们在这篇文章中新增了 Chandra 和 OlmOCR-2，并附上了它们在 OlmOCR 基准上的得分 🫡Chandrahttps://hf.co/datalab-to/chandraOlmOCR-
阅读全文
用 AI Sheets 解锁图像的力量
作者：Hugging Face发布日期：2025-11-19 11:00:00
🧭简要概览：Hugging Face AI Sheets 是一款开源工具，能够用 AI 模型增强数据集的处理能力，无需编写任何代码。现在新增视觉功能：可以从图像 (如收据、文档) 中提取数据、根据文本
阅读全文
HF Papers 直播 AI Insight Talk｜ Omni全模态专场
作者：Hugging Face发布日期：2025-11-17 17:30:00
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第五场 - Omni全模态大模型专场就在明
阅读全文
社区供稿丨Hugging Face创始人 x 小红书技术副总裁：关于开源、AI与技术人成长
作者：Hugging Face发布日期：2025-10-31 22:00:00
今年的1024程序员节，小红书@REDacademy和@科技薯办了一场直播。小红书技术副总裁凯奇、小红书语音模型技术负责人风龙，携手Hugging Face联合创始人Thomas Wolf，以AMA（
阅读全文
LeRobot v0.4.0 正式发布：全面提升开源机器人的学习能力
作者：Hugging Face发布日期：2025-10-29 08:10:00
我们非常高兴地宣布，LeRobot 迎来一系列重大升级，让开源的机器人学习比以往更强大、更可扩展、也更易用！从重构的数据集到灵活的编辑工具、新的仿真环境，以及面向硬件的全新插件系统，LeRobot 正
阅读全文
社区供稿丨RoboChallenge全球首发：重塑具身智能基准测试，开启真机评测新纪元
作者：Hugging Face发布日期：2025-10-16 18:00:00
近日，全球首个大规模、多任务的在真实物理环境中由真实机器人执行操作任务的基准测试——RoboChallenge重磅推出；通过科学的评估体系构建一个开放、公正、可复现的「真实考场」，克服真实环境下的性能
阅读全文
开源点燃具身智能——前行者的炉边对谈
作者：Hugging Face发布日期：2025-10-15 22:10:00
阅读全文
中秋快乐🎑
作者：Hugging Face发布日期：2025-10-06 10:00:00
阅读全文
社区供稿丨MiniCPM-V 4.5 技术报告正式出炉
作者：Hugging Face发布日期：2025-09-24 22:45:00
上个月，面壁小钢炮带来了最新的多模态模型 MiniCPM-V 4.5，成为行业首个具备“高刷”视频理解能力的多模态模型。模型一经开源广受社区好评，直接登上 HuggingFace Trending T
阅读全文
Gaia2 与 ARE：赋能社区的智能体评测
作者：Hugging Face发布日期：2025-09-23 22:05:00
在理想情况下，AI 智能体应当是可靠的助手。当接收到任务时，它们能够轻松处理指令中的歧义，构建逐步执行的计划，正确识别所需资源，按计划执行而不被干扰，并在突发事件中灵活适应，同时保持准确性，避免幻觉。
阅读全文
社区供稿丨基座上新：MiniCPM 4.1 将「高效深思考」引入端侧
作者：Hugging Face发布日期：2025-09-12 18:00:00
💡 MiniCPM 4.1 亮点一览 🏃首个原生稀疏架构的深思考模型，通过可训练稀疏注意力创新，代码、数学推理等任务的推理速度比同尺寸开源模型快 3 倍以上；🌟在知识、推理、编程、指令遵循等综合能
阅读全文
社区供稿丨揭秘端到端文档OCR模型 POINTS-Reader
作者：Hugging Face发布日期：2025-09-11 18:00:00
目前论文已经被 EMNLP 2025 主会录取，同时模型已经开源论文: https://huggingface.co/papers/2509.01215Github: https://github.c
阅读全文
ZeroGPU Spaces 加速实践：PyTorch 提前编译全解析
作者：Hugging Face发布日期：2025-09-04 21:00:00
ZeroGPU 让任何人都能在 Hugging Face Spaces 中使用强大的 Nvidia H200 硬件，而不需要因为空闲流量而长期占用 GPU。它高效、灵活，非常适合演示，不过需要注意
阅读全文
社区供稿 | 具身智能家务机器人黑客松报名开启！
作者：Hugging Face发布日期：2025-09-03 18:00:00
【黑客松双城启幕】全球首创家务机器人开发者黑客松，由 Hugging Face、NVIDIA 与 Seeed Studio 联合举办！我们将在深圳以及美国湾区举办两场开发者黑客松，中美双城联动。两大赛
阅读全文
社区供稿 | 开源SOTA：阶跃发布端到端语音大模型Step-Audio 2 mini！
作者：Hugging Face发布日期：2025-09-02 18:00:00
大家好，今天阶跃星辰正式发布最强开源端到端语音大模型 Step-Audio 2 mini，该模型在多个国际基准测试集上取得 SOTA 成绩。它将语音理解、音频推理与生成统一建模，在音频理解、语音识别、
阅读全文
社区供稿 | 开源多模态大模型新突破，书生·万象3.5发布，通用能力、推理能力与部署效率全面升级
作者：Hugging Face发布日期：2025-09-01 18:00:00
通往通用人工智能（AGI）的探索，不仅是技术的突破，更关乎体验的革新。多模态大模型通过融合视觉与语言等多维信息，让AI能够像人一样理解世界、解决问题，为用户带来更流畅、更可信赖的交互体验。在多模态大模
阅读全文
社区供稿 | VibeVoice实现90分钟、多角色播客生成，拓展语音合成新边界
作者：Hugging Face发布日期：2025-08-28 18:00:00
编者按：AI 自动生成播客早已不是新鲜事，但常见的 AI 播客只局限于几分钟的双人对话，这是因为传统语音生成模型大多基于离散化方法，更擅长生成短句、单一音色、结构规整的语音内容。近日，微软亚洲研究院提
阅读全文
社区供稿 | 多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快
作者：Hugging Face发布日期：2025-08-27 17:00:00
今天，我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型，成为行业首个具备“高刷”视频理解能力的多模态模型，看得准、看得快，看得长！高刷视频理解、长视频理解、OCR、文档
阅读全文
社区供稿 | 阿里国际Ovis2.5重磅发布：以小博大，刷新开源模型性能新高度
作者：Hugging Face发布日期：2025-08-26 21:30:00
阿里国际正式发布新一代多模态大模型Ovis2.5。Ovis2.5 是一款面向原生分辨率视觉感知、深度推理与高性价比场景设计的多模态大模型。在主流多模态评测套件 OpenCompass 上的综合得分相较
阅读全文
直播预告｜开源生态如何引领具身智能的未来？
作者：Hugging Face发布日期：2025-08-25 22:00:00
阅读全文
HF Papers 直播｜多模态专场
作者：Hugging Face发布日期：2025-08-20 21:30:00
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场，即将开播！近期各
阅读全文
开源开发者须知：欧盟《人工智能法案》对通用人工智能模型的最新要求
作者：Hugging Face发布日期：2025-08-19 19:00:00
⚠️ 本文不构成任何法律意见或建议。快速摘要 (TL;DR): 自 2025 年 8 月 2 日起，欧盟《人工智能法》将对通用人工智能（GPAI）模型的提供者模型提供者提出新的合规要求。但是对于用于科
阅读全文
社区供稿 | MiniCPM-V4.0开源，多模态能力进化，手机可用，还有最全CookBook！
作者：Hugging Face发布日期：2025-08-08 19:03:32
面壁小钢炮新一代多模态模型 MiniCPM-V 4.0 现已开源。依靠 4B 参数，取得在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩，且
阅读全文
欢迎 GPT OSS —— 来自 OpenAI 的全新开放模型家族！
作者：Hugging Face发布日期：2025-08-06 16:30:00
GPT OSS 是 OpenAI 推出的重量级开放模型，面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型：拥有 117B 参数的gpt‑oss‑120b和拥有 21B 参数的gpt‑os
阅读全文
社区供稿 | GLM-4.5技术博客：原生融合推理、编码和智能体能力
作者：Hugging Face发布日期：2025-07-29 21:00:00
我们正式介绍两个新的 GLM 系列成员：GLM-4.5 和 GLM-4.5-Air——我们最新的旗舰模型。GLM-4.5 拥有 3550 亿总参数和 320 亿激活参数，而 GLM-4.5-Air 拥
阅读全文
社区供稿 | 全能高手&科学明星，上海AI实验室开源发布『书生』科学多模态大模型 Intern-S1 | WAIC 2025
作者：Hugging Face发布日期：2025-07-26 20:31:01
7 月 26 日，2025 世界人工智能大会（WAIC 2025）正式开幕。在当天下午举行的科学前沿全体会议上，上海人工智能实验室（上海AI实验室）发布并开源『书生』科学多模态大模型 Intern-S
阅读全文
Hugging Face 开源机器人 Reachy Mini 开启预定
作者：Hugging Face发布日期：2025-07-09 22:00:00
我们最新的开源机器人 Reachy Mini 正式亮相 🎉 这款富有表现力的开源机器人由 Pollen Robotics 与 Hugging Face 联合打造，专为人机交互、创意编程和 AI 实验而
阅读全文
社区供稿 | Jina Embeddings V4: 为搜索而生，多模态多语言向量模型
作者：Hugging Face发布日期：2025-06-27 21:30:00
今天，我们正式发布 jina-embeddings-v4，一款全新的多模态向量模型，参数规模达到 38 亿，并首次实现了对文本与图像的同步处理。为了在各类检索任务中发挥极致性能，我们在模型内置了一套面
阅读全文
nanoVLM: 简洁、轻量的纯 PyTorch 视觉-语言模型训练代码库
作者：Hugging Face发布日期：2025-06-18 10:30:00
nanoVLM是使用纯 PyTorch 训练你自己的视觉语言模型 (VLM) 的最简单方式。它是一个轻量级工具包，让你可以在免费的 Colab Notebook上启动 VLM 训练。nano
阅读全文
HF Papers 直播｜ AI Insight Talk 强化学习专场
作者：Hugging Face发布日期：2025-06-12 22:00:00
由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流联合发起的【AI Insight Talk】系列活动重磅来袭！本期我们将聚焦强化学习（RL）与推
阅读全文