3月16日消息,通义实验室今日正式发布并开源Fun-CineForge,该模型为全球首个支持影视级多场景配音的多模态大模型,同时开放其配套高质量数据集构建方法CineDub,旨在解决AI在专业影视配音中长期存在的“口型不同步、情绪不匹配、音色不一致、时间对不准”四大核心难题。
目前,模型已在GitHub、HuggingFace、ModelScope三平台开源,支持30秒以内视频片段推理。
3月16日消息,通义实验室今日正式发布并开源Fun-CineForge,该模型为全球首个支持影视级多场景配音的多模态大模型,同时开放其配套高质量数据集构建方法CineDub,旨在解决AI在专业影视配音中长期存在的“口型不同步、情绪不匹配、音色不一致、时间对不准”四大核心难题。
目前,模型已在GitHub、HuggingFace、ModelScope三平台开源,支持30秒以内视频片段推理。