音频生成范式新突破,腾讯 AI Lab 开源神经声码器 BridgeVocoder
在语音合成、歌声合成、音频编辑等AIGC核心领域,神经声码器作为生成高质量波形的最后一步,其性能至关重要。近年来,扩散模型虽能生成自然度极高的音频,但其“从噪声到数据”的生成范式通常需要上百步迭代,导
阅读全文在语音合成、歌声合成、音频编辑等AIGC核心领域,神经声码器作为生成高质量波形的最后一步,其性能至关重要。近年来,扩散模型虽能生成自然度极高的音频,但其“从噪声到数据”的生成范式通常需要上百步迭代,导
阅读全文大语言模型(LLM)的“炼丹师”们,或许都曾面临一个共同的困扰:为不同任务、不同模型手动调整解码超参数(如temperature和top-p)。这个过程不仅耗时耗力,而且一旦模型或任务发生变化,历史经
阅读全文近日,腾讯AI Lab推出SongGeneration音乐生成大模型的升级版本,此次更新聚焦三大核心更新:显著提升的英文生成质量、支持4分钟以上长歌曲生成、开源数据生成方案SongPrep。这一升级进
阅读全文深度研究智能体(Deep Research Agents)不仅需要从网络环境、文件和多模态输入等多种来源进行「信息收集」(Information Seeking)来检索信息,更重要的是需要对知识进行「
阅读全文近日,腾讯 AI Lab携手香港中文大学(深圳)、南京大学联合研发的歌曲生成模型SongBloom,不仅成功实现开源,更凭借突破性技术成果,相关研究成果被全球顶级人工智能会议NeurIPS 2025录
阅读全文智能体与语音研究的结合,可以碰撞出怎么样的火花。最近,腾讯AI Lab与港科大(广州)共同推出的两项研究给出了答案。 【研究1】AudioGenie: 一个多样化多模态到多音频生成的无需训练的多智能体
阅读全文深度研究智能体(Deep Research Agents)凭借大语言模型(LLM)和视觉-语言模型(VLM)的强大能力,正在重塑知识发现与问题解决的范式。然而,现有开源智能体框架多依赖付费工具,限制了
阅读全文今天,腾讯AI Lab推出并开源音乐生成大模型SongGeneration,专注解决AIGC音乐中音质、音乐性与生成速度这三大难题,基于LLM-DiT的融合架构,模型在保持生成速度的同时,显著提升了音
阅读全文