Seed Research|理解与生成统一模型 BAGEL 开源,All-in-One Model!
BAGEL 是字节跳动 Seed 最新开源的多模态基础模型,支持文本、图像和视频的统一理解和生成。团队实验发现,随着预训练用到的跨模态交错数据不断扩展,模型还涌现出了更强的复杂推理和组合能力,为更广泛
阅读全文BAGEL 是字节跳动 Seed 最新开源的多模态基础模型,支持文本、图像和视频的统一理解和生成。团队实验发现,随着预训练用到的跨模态交错数据不断扩展,模型还涌现出了更强的复杂推理和组合能力,为更广泛
阅读全文字节跳动 Seed 近日公开了以模型为中心的代码预训练数据构建流水线(Model-centric Data Pipeline)实现方法。通过研究,我们验证了——基于 LLM 即可实现对代码数据的评分、
阅读全文Seed1.5-VL 是字节跳动 Seed 团队最新发布的视觉-语言多模态大模型,具备更强的通用多模态理解和推理能力,且推理成本显著降低,在 60 个公开评测基准中的 38 个上取得 SOTA 表现。
阅读全文字节跳动 Seed 团队最新向量模型 Seed1.5-Embedding 公布技术细节,该模型基于 Seed1.5 (Doubao-1.5-pro) 进一步训练。在权威测评榜单 MTEB 上,Seed
阅读全文ICLR 2025 即将在新加坡拉开帷幕。作为机器学习领域的顶级学术会议之一,ICLR 聚集了来自全球的学者与产业界代表。今年,字节跳动 Seed 团队共有 23 篇成果被接收或邀请分享,包含 1 篇
阅读全文今天,我们发布并开源 UI-TARS-1.5,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5 已在 7 个典型的 GUI 图形用户界面
阅读全文字节跳动 Seed 团队正式发布 Seedream 3.0 技术报告。Seedream 3.0 是一个原生高分辨率、支持中英双语的图像生成基础模型,对比 Seedream 2.0,这一版本的整体性能表
阅读全文字节跳动 Seed 最新思考模型 Seed-Thinking-v1.5 技术报告发布,涵盖我们在数据体系、奖励模型、RL 算法、基础设施等维度的探索:通过数据层面的精细化处理提升推理能力,融合可验证数
阅读全文字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上,Multi-SWE-benc
阅读全文今天,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。该报告针对 Seedream 2.0 原生中
阅读全文当前,MoE 架构是业界拓展模型规模的重要方向,然而,其在分布式训练中存在的大量通信开销,仍严重制约了训练效率和成本。为攻克这一瓶颈,豆包大模型团队提出了一个全新的通信优化系统 COMET,通过更精准
阅读全文近日,豆包大模型团队开源 SuperGPQA,一个领域全面且具备高区分度的知识推理基准测试。该数据集构建了覆盖 285 个研究生级学科、包含 26529 道专业问题的评估体系,不仅涵盖主流学科,更将轻
阅读全文近日,豆包大模型团队提出 BFS-Prover,一个基于大语言模型 (LLM) 和最优先树搜索 (BFS) 的高效自动形式化定理证明系统。团队通过该成果发现,简单的 BFS 方法经过系统优化后,可在大
阅读全文