社区供稿 | 阿里国际Ovis2.5重磅发布:以小博大,刷新开源模型性能新高度
阿里国际正式发布新一代多模态大模型Ovis2.5。Ovis2.5 是一款面向原生分辨率视觉感知、深度推理与高性价比场景设计的多模态大模型。在主流多模态评测套件 OpenCompass 上的综合得分相较
阅读全文阿里国际正式发布新一代多模态大模型Ovis2.5。Ovis2.5 是一款面向原生分辨率视觉感知、深度推理与高性价比场景设计的多模态大模型。在主流多模态评测套件 OpenCompass 上的综合得分相较
阅读全文由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 等联合发起的【AI Insight Talk】系列直播活动第四场 - 多模态专场,即将开播!近期各
阅读全文⚠️ 本文不构成任何法律意见或建议。快速摘要 (TL;DR): 自 2025 年 8 月 2 日起,欧盟《人工智能法》将对通用人工智能(GPAI)模型的提供者模型提供者提出新的合规要求。但是对于用于科
阅读全文面壁小钢炮新一代多模态模型 MiniCPM-V 4.0 现已开源。依靠 4B 参数,取得 在 OpenCompass、OCRBench、MathVista 等多个榜单上取得了同级 SOTA 成绩,且
阅读全文GPT OSS 是 OpenAI 推出的 重量级开放模型,面向强推理、智能体任务以及多样化开发场景。该系列包含两款模型:拥有 117B 参数的gpt‑oss‑120b和拥有 21B 参数的gpt‑os
阅读全文我们正式介绍两个新的 GLM 系列成员:GLM-4.5 和 GLM-4.5-Air——我们最新的旗舰模型。GLM-4.5 拥有 3550 亿总参数和 320 亿激活参数,而 GLM-4.5-Air 拥
阅读全文7 月 26 日,2025 世界人工智能大会(WAIC 2025)正式开幕。在当天下午举行的科学前沿全体会议上,上海人工智能实验室(上海AI实验室)发布并开源『书生』科学多模态大模型 Intern-S
阅读全文我们最新的开源机器人 Reachy Mini 正式亮相 🎉 这款富有表现力的开源机器人由 Pollen Robotics 与 Hugging Face 联合打造,专为人机交互、创意编程和 AI 实验而
阅读全文今天,我们正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。为了在各类检索任务中发挥极致性能,我们在模型内置了一套面
阅读全文nanoVLM是使用纯 PyTorch 训练 你自己的视觉语言模型 (VLM) 的 最简单 方式。它是一个轻量级 工具包 ,让你可以在免费的 Colab Notebook上启动 VLM 训练。nano
阅读全文由 Hugging Face × OpenMMLab × ModelScope × 知乎 × 机智流 联合发起的【AI Insight Talk】系列活动重磅来袭!本期我们将聚焦 强化学习(RL)与推
阅读全文🧭 TL;DR今天,我们希望向大家介绍一个新的模型: SmolVLA,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运
阅读全文🌟 欢迎参加 Gradio & MCP 智能体主题黑客松!准备好了吗?一场以智能体 (Agent) 和模型上下文协议 (Model Context Protocol,简称 MCP) 为核心的全球在线黑
阅读全文B 站升级动画视频生成模型 Index-AniSora 技术并开源,支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成!整个工作技术原理基于 B 站提出的 A
阅读全文这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章:关于推理关于 公式解析关于可复现性假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什
阅读全文2025 年 5 月 6 日,智源研究院在法国巴黎举行的 GOSIM 全球开源创新论坛上发布大型开源文本数据集 CCI 4.0,为全球的大模型创新发展再次提供重要的开源资源,并积极推动全球开源合作。C
阅读全文这是 大模型评估排障指南 系列文章的第二篇,敬请关注系列文章:关于推理关于 公式解析关于可复现性解析 LaTeX 很难。这个问题在评估输出为 的模型时经常会遇到,例如 Hugging Face 的
阅读全文Hugging Face Hub 已成为 AI 协作的核心平台,托管了数万个模型、数据集以及交互式应用程序 (Hugging Face Space)。 在开放生态系统中,用户知情同意的管理方式与那些更
阅读全文阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。该模型总参数量为 19B (7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控
阅读全文这是 大模型评估排障指南 系列文章的第一篇,敬请关注系列文章:关于推理关于 公式解析关于可复现性模型运行非常慢怎么办?调整 batch size如果你想要评估结果完全可复现 (在特定的输入 prom
阅读全文驱动科学研究的人工智能正逐渐改变科学研究的模式,在探索以通专融合实现通用人工智能 (AGI) 的进程中,通用基座大模型,尤其是具备跨模态理解能力的多模态大模型至关重要——多模态大模型的创新突破,将大幅
阅读全文近年来,大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而,要实现其高效部署,精细的超参数优化至关重要。为了探究最佳超参数的规律,我们开展了大规模的实证研究,通过在不同配置上进行网格搜索
阅读全文今天,我们正式发布jina-reranker-m0。这是一款多模态、多语言重排器 (reranker),其核心能力在于 对包含丰富视觉元素的文档进行重排和精排,同时兼容跨语言场景。当用户输入一个查询
阅读全文这是 让 LLM 来评判 系列文章的第六篇,敬请关注系列文章:基础概念选择 LLM 评估模型设计你自己的评估 prompt评估你的评估结果奖励模型相关内容技巧与提示LLM 评估模型已知偏差及缓解措施缺
阅读全文原文发布于 2025 年 3 月 11 日本次更新带来三大突破性进展:CodeForces-CoTs 数据集: 通过 R1 模型蒸馏生成近 10 万条高质量编程思维链样本,同时包含 C++ 和 Pyt
阅读全文原文发布于 2025 年 2 月 10 日我们启动 Open R1 项目已经两周了,这个项目是为了把 DeepSeek R1 缺失的部分补齐,特别是训练流程和合成数据。https://github.c
阅读全文DeepSeek R1 发布已经两周了,而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊:https://github.com/huggingf
阅读全文作者:Thomas Wolf, Hugging Face 联合创始人和首席科学家发布日期:2025 年 2 月 26 日原文链接:🔭 The Einstein AI modelhttps://thom
阅读全文来源:https://blog.ngxson.com/common-ai-model-formats过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在Hugging
阅读全文