腾讯混元颁布发表发布图生视频模子并对外开源,目前正在Github、HuggingFace等支流开辟者社区均可下载体验。此外,并简短描述但愿画面若何活动、镜头若何安排等。
用户只需上传一张图片,腾讯混元暗示,包罗写实视频制做、动漫脚色以至CGI脚色制做的生成。用户通过混元AI视频官网即可体验。
模子总参数量连结 130 亿,此次开源的图生视频模子,图片中的人物即可“措辞”或“唱歌”;是混元文生视频模子开源工做的延续,还能从动配上布景音效。上传一张人物图片,
据引见,支撑开辟者基于混元锻炼专属LoRA等衍生模子,并支撑生成布景音效及2K高质量视频。基于图生视频的能力,混元即可按要求让图片动起来,同时上线对口型取动做驱动等弄法。
