[CV]《ToonComposer: Streamlining Cartoon Production with Generative Post-Keyframing》L Li, G Wang, Z Zhang, Y Li... [The Chinese University of Hong Kong & Tencent PCG] (2025)
ToonComposer革新传统动画制作,融合补间与上色为一体的后关键帧生成流程,极大简化人工劳动,提升制作效率和质量。
• 统一后关键帧阶段:以稀疏关键帧草图与单一彩色参考帧为输入,生成高质量、风格统一的卡通视频,避免补间与上色阶段误差累积。
• 稀疏草图注入机制:将关键帧草图编码为与视频潜空间兼容的稀疏草图令牌,结合位置编码,支持任意时点精确控制,多关键帧灵活调节动画动作。
• 卡通域适配:创新空间低秩适配器(SLRA),仅调节空间注意力部分,保持强大时间先验,有效适配DiT视频基础模型至卡通风格。
• 区域控制机制:支持局部草图绘制,空白区域由模型根据上下文和文本提示自动生成,显著减轻绘制负担。
• 大规模多样风格草图数据集PKData及真实人绘草图基准PKBench,确保模型训练与评测均贴近真实应用场景。
• 多项定量指标与用户调研均显著优于AniDoc、LVCD和ToonCrafter,表现出更优视觉质量、动作连贯性与美学一致性。
• 灵活支持不同数量关键帧草图,满足复杂动作与创意自由度需求;并兼容3D动画生成,拓展应用边界。
ToonComposer为卡通视频制作注入前所未有的自动化与创作自由,推动动画产业进入智能生成新时代。
论文🔗 arxiv.org/abs/2508.10881
详细解读👉 lg-li.github.io/project/tooncomposer
人工智能视频生成卡通动画生成模型深度学习