Alibaba-Quark

LiveAvatar

Alibaba-Quark

[ECCV 2026] Implementation of "Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length"

AI 简介

Live Avatar 是一个实现实时音频驱动的无限长度虚拟形象生成的框架。该项目利用140亿参数的扩散模型,能够在多张H800 GPU上以45帧每秒的速度生成高质量的虚拟形象视频,并支持长达10,000秒以上的流媒体视频处理。其核心技术特点包括高效的4步采样方法和块自回归处理技术,确保了长时间视频生成过程中的稳定性和流畅性。适用于需要实时交互式虚拟形象的应用场景,如在线教育、虚拟主播、远程会议等。

Python
Apache License 2.0
2.2k
Stars
248
Forks
63
Watchers
39
Issues

Star 增长

今日+32
近 7 天+41
近 30 天+107
综合评分109.19
默认分支main