阿里开源ThinkSound：AI自动为视频加音效，影视与游戏创作迎来大变革！

𝕷𝖎𝖑𝖏𝖆𝖈𝖐 发表于 2025-7-11 09:54:53

2025年7月，阿里巴巴通义实验室正式开源其首款音频生成模型ThinkSound，为视频内容创作带来革命性突破。这款多模态AI模型能够基于视频、文本或音频输入，生成高保真的音效与音景，完美适配画面内容，为影视制作、游戏开发及多媒体创作注入全新活力。AIbase结合最新信息，深入剖析ThinkSound的独特优势与行业影响，带您一探AI音效生成的新前沿。
ThinkSound是阿里巴巴通义实验室推出的一款创新性音频生成模型，采用先进的链式推理（Chain-of-Thought， CoT）技术，能够深入分析视频画面的场景、动作与情感，生成与之高度匹配的音效。无论是自然风声、城市喧嚣，还是角色对话与物体碰撞音，ThinkSound都能实现音画高保真同步，生成效果逼真自然。官方展示的案例显示，其生成的音效在真实感与场景适配度上表现优异，堪称“专业AI音效师”。

该模型支持多种输入模态，包括视频、文本、音频或其组合，极大地拓宽了应用场景。用户可以通过简单的文字描述或视频片段，快速生成符合特定场景的音效，甚至支持通过语言指令进行精准的音效编辑与优化。

体验地址:https://www.modelscope.cn/studios/iic/ThinkSound

IT618发布 发表于 2025-7-11 09:55:36

你早晚要满级

浅生发表于 2025-7-11 09:55:59

试试生成如何，魔搭

页: [1]

DZ插件网's Archiver

阿里开源ThinkSound：AI自动为视频加音效，影视与游戏创作迎来大变革！