«

采用我们最新的音乐生成模型Lyria 3进行创作。

qimuai 发布于 阅读:0 一手编译


采用我们最新的音乐生成模型Lyria 3进行创作。

内容来源:https://blog.google/innovation-and-ai/technology/developers-tools/lyria-3-developers/

内容总结:

谷歌发布新一代音乐生成模型Lyria 3,现面向全球开发者开放公测。该模型通过Gemini API及Google AI Studio的全新音频体验提供,旨在将深度音乐理解与结构连贯性相结合,帮助开发者构建能够生成高保真度、包含人声及完整段落结构的音乐应用。

本次推出的模型包含两个版本:Lyria 3 Pro专注于生成长约三分钟的完整歌曲,具备专业级结构感知能力;Lyria 3 Clip则针对速度与高并发需求优化,可生成30秒高质量音频片段,适用于快速原型设计、背景循环及社交媒体内容制作。两款模型均支持富含表现力的人声合成、多语言演唱及跨流派音乐创作,涵盖流行、放克、摩城等多种风格。

Lyria 3引入了精细控制功能,开发者可通过自然语言指令精准调节节奏、设定歌词时间对齐,甚至上传图片以影响音乐的情绪与风格。为展示应用场景,谷歌在AI Studio中构建了多个示例,包括为视频生成同步背景音乐、结合日历与天气信息生成个性化闹钟铃声等。

目前,开发者可在Google AI Studio中通过付费API密钥体验Lyria 3的文本创作与分段作曲两种模式。所有生成的音频均包含SynthID数字水印,以确保技术使用的透明度与可追溯性。谷歌表示,该工具在与行业专家合作下开发,旨在以人工智能增强人类创造力。

中文翻译:

基于Lyria 3——我们最新的音乐生成模型进行创作

我们的音乐生成模型Lyria 3与Lyria 3 Pro现已通过Gemini API及Google AI Studio的全新音频体验功能,面向开发者开放公测。

Lyria 3旨在将深度的音乐理解与结构连贯性相结合。开发者可借此构建能够创作高保真音乐作品的应用,这些作品包含人声、主歌与副歌,并能从首个音符至结尾始终保持音乐风格的一致性。

专业品质与高效速度

开发者现可根据具体制作需求与延迟要求,选择两种不同的模型变体:

两款模型均支持富有表现力细节的真实人声,并提升音质清晰度以呈现更自然的声音效果。开发者还可探索全球多种语言与音乐流派,生成不同语言的人声,创作涵盖流行、放克、摩城等多元风格的音乐作品。

精准控制与多模态输入

Lyria 3引入精细化控制功能,支持通过自然语言指令精准引导模型:

Lyria 3应用实例

为展示如何将该模型集成至应用中,我们在Google AI Studio构建了若干示例:

在Google AI Studio体验Lyria 3

为助力开发者即刻开始探索,我们同步在AI Studio推出全新音乐生成体验。通过付费API密钥,这个专属工作区为使用Lyria 3进行创作提供了优质环境,并可体验图像转音乐等高级功能。

在操作平台中,开发者可探索两种强大的音乐创作模式:

即刻开启创作之旅

Lyria 3 Clip与Lyria 3 Pro现已面向全球开发者开放公测。

我们始终与行业专家紧密合作开发音乐生成工具,确保人工智能成为人类创造力的增强力量。此外,每段由Lyria 3生成的音轨均包含SynthID数字水印技术。该技术通过可识别验证谷歌AI生成音频的机制(即使音频经过修改),持续保障透明度与可信度。

英文来源:

Build with Lyria 3, our newest music generation model
Lyria 3 and Lyria 3 Pro, our music generation models, are rolling out now to developers in public preview through the Gemini API and a new audio experience in Google AI Studio.
Lyria 3 is designed to combine deep musical awareness with structural coherence. This allows developers to build apps that offer high-fidelity compositions, including vocals, verses and choruses, that maintain musical consistency from the first note to the last.
Studio quality and speed
Developers can now choose between two distinct model variants designed to meet specific production and latency requirements:

谷歌新消息

文章目录


    扫描二维码,在手机上阅读