基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案,助力短剧出海
本文作者:孙康、丁杨。当短剧出海、跨境电商等新兴领域打造全球化内容时,面临着一个棘手的基础问题——原始视频的中文字幕。原始字幕对于海外观众来说,不仅是无效信息,还严重干扰观看体验。传统方案——直接添加
阅读全文本文作者:孙康、丁杨。当短剧出海、跨境电商等新兴领域打造全球化内容时,面临着一个棘手的基础问题——原始视频的中文字幕。原始字幕对于海外观众来说,不仅是无效信息,还严重干扰观看体验。传统方案——直接添加
阅读全文导读本文旨在阐述火山引擎在模型上下文协议(Model Context Protocol, MCP)全生命周期中的安全保障实践。首先介绍MCP的核心概念、技术原理及生态发展现状,随后通过一个交互案例详细
阅读全文写在前面关于 MCP 协议的技术细节和实现方案,业界已有诸多优秀文档,本文不再赘述,而是从 AI 应用开发者的视角,分享对 MCP 工具的一些经验与思考。配图 by doubao ai1. MCP 诞
阅读全文2025年,AI Agent赛道进入爆发式增长的新阶段。在基础模型能力进步的推动下,AI Agent正在从「概念验证」走向「大规模部署」。为了让更多开发者和组织受益于前沿技术,真正降低AI Agent
阅读全文一、概述本文主要介绍了如何通过 Devtools 的 Memory 内存工具排查 JavaScript 内存泄漏问题。先介绍了一些相关概念,说明了 Memory 内存工具的使用方式,然后介绍了堆快照的
阅读全文概述云游戏作为一种新兴的游戏模式,将游戏的存储、计算和渲染任务从本地终端迁移至云端服务器,使玩家无需配备高性能的硬件,仅通过网络实时接收来自云端服务器的游戏音视频流,即可畅玩各类大作。云游戏突破了设备
阅读全文导读SIGMOD (ACM Special Interest Group on Management Of Data) 是数据库三大国际顶级学术会议之一,也是数据库领域影响力最大的顶级会议,中国计算机
阅读全文🔥 简介:深度推荐模型统一训练系统Primus搜索、广告、推荐是互联网业务的重要组成部分。在模型日益庞大、用户基数不断增长的背景下,如何高效完成数万亿样本的训练,已成为业界公认的技术挑战。字节跳动基础
阅读全文1、前言随着大模型(Large Language Models, 以下简称LLM)迅猛发展的浪潮中,幻觉(Hallucination)问题逐渐成为业界和学术界关注的焦点。所谓模型幻觉,指的是模型在生成
阅读全文音频编码器是多模态大模型的重要组件,优秀的音频编码器在构建多模态系统中至关重要。在此背景下,小米集团、萨里大学与海天瑞声联合主办的 ICME 2025 Audio Encoder Capability
阅读全文导读SIGMOD (ACM Special Interest Group on Management Of Data) 是数据库三大国际顶级学术会议之一,也是数据库领域影响力最大的顶级会议,中国计算机
阅读全文基于 UI-TARS 多模态视觉模型,结合 MCP(模型上下文协议)构建下一代跨平台的自主感知 GUI Agent 智能体系统,抛砖引玉,和大家一起探讨 GUI Agent 的技术、场景和未来!UI-
阅读全文数据管理领域的顶级会议SIGMOD'25近日在德国柏林召开。来自世界各地的顶尖高校、学者和科技公司汇聚在柏林参与这一年一度的数据管理盛会。字节跳动3篇论文入选,包括1篇research track(被
阅读全文当下,域名不仅仅是企业互联网基础设施的基石,支撑着互联网服务的稳定与安全,更是品牌认知放大器,决定了用户的第一印象和访问意愿。然而,遵循着「先注先得」原则,域名成为珍稀资源。据统计,63% 的企业在注
阅读全文本文作者为字节跳动研发负责人洪定坤。在前些天的火山引擎 Force 原动力大会上,我介绍了一款用三天时间开发的英语学习应用「积流成江」(体验地址:https://sstr.trae.com.cn)。跟
阅读全文在当前大模型即服务(Language-Model-as-a-Service, LMaaS)的发展浪潮中,用户对于定制化微调专属大模型的需求日益迫切。然而,个人数据隐私问题依然不容忽视。在此背景下,来自
阅读全文6月11日,火山引擎 Force 原动力大会在北京举行。在大会前一周,字节跳动技术副总裁洪定坤决定,自己用字节的 AI 编程产品 TRAE,花三天,开发一个英语学习的应用,并用自己的亲身经历,来聊聊他
阅读全文*本音频由豆包·语音播客模型生成,该功能已在豆包电脑版开启小流量测试,并上线扣子空间在今天召开的火山引擎Force原动力大会上,豆包大模型升级为1.6版,推理、数学、指令遵循、Agent等能力有较大提
阅读全文导读本文的核心思想是利用预训练语言模型通过语义信息来做开箱即用的NDV估计,已经被SIGMOD25接收,SIGMOD25 Reviewer给出的评价:本文是第一个基于语义信息做NDV估计的工作。论文标
阅读全文DeepSeek-R1 凭借其优秀的深度推理能力,一经推出便在 AI 市场掀起热潮。然而,DeepSeek-R1 包含 671B 的模型参数,基于 FP8 的数据精度,权重显存消耗接近 700GB,单
阅读全文即日起至6月30日,掘金 AI 编程社区携手 Trae AI 编程工具和掘金 MCP 功能,邀你加入 2025 AI 编程竞赛!用代码点燃创意,探索 VibeCoding 的无限可能,成为 AI 编程
阅读全文在大规模云数据中心中,虚拟机(VM)调度是保障计算资源高效利用的关键环节。尽管初始调度(VMS)已被广泛研究,但运行一段时间后的虚拟机重调度(VMR)问题却长期被忽视。VMR 指的是在已有资源使用状态
阅读全文当前,MCPs 及其 marketplace 已经层出不穷,但许多小伙伴仍然困惑于如何高效地利用这些工具。为此,Trae 推出了全新的 Agent(智能体) 一键分享和导入功能,结合 prompt 与
阅读全文本播客由扣子空间(coze.cn)一键生成划重点:关键提示词——“生成播客”在当今信息爆炸的时代,播客作为一种新兴的音频媒体形式,正以其独特的魅力吸引着越来越多的听众。然而,对于许多播客创作者来说,制
阅读全文在人工智能技术爆发式发展的当下,大模型(Large Language Models, 以下简称LLM)凭借其强大的自然语言处理能力,广泛渗透于智能助手、内容创作、代码生成等诸多关键领域,深度重塑着人们
阅读全文哈喽大家好呀,「玩转 MCP」系列不知不觉已经到了第三弹,在之前的系列教程中我们分别向大家介绍了如何通过使用 MCP 将你的 Figma 设计稿转换为前端代码以及如何用 MCP 实现网页自动化测试,还
阅读全文大语言模型在语言理解方面表现出卓越的能力,但在处理视频等复杂任务时仍存在明显局限,模型上下文协议(MCP)的引入,为突破这一限制提供了全新路径。MCP 通过连接大模型与本地服务器,使得模型能够动态调用
阅读全文前言在日常开发中会涉及到各种按钮请求,测试人员经常怼着一个按钮狂点不止。这样导致很多数据重复提交!「前端人员经常怼着测试说」:你能不能不要点那么快啊!(由于有时候接口返回比较慢)「测试回怼」:我不知道
阅读全文25年,随着大模型技术及理念的快速演进,AI应用正跨越第三个分水岭——它们开始像真正的“专家”一样思考:理解业务背景、自主规划路径、调用工具执行,甚至从结果中持续学习。这一变革恰逢企业对数据价值挖掘的
阅读全文前言近日,ACM SIGCOMM正式公布今年的入选论文,字节跳动旗下的火山引擎多媒体实验室与香港科技大学合作的论文“ACE: Sending Burstiness Control for High-Q
阅读全文