-
工具
-
-
Emu Video
Emu Video 是由 Meta 开发的一款基于人工智能的视频生成工具,能够将文本、图像或图文组合输入转化为视频。Emu Video使用扩散模型根据文本提示创建视频,首先生成图像,然后根据文本和生成的图像创建视频。
-
-
工具
-
-
CogVideo
CogVideo是由智谱 AI 联合清华大学开发的一种开源文本到视频生成模型,基于 Transformer 架构,是一个 94 亿参数的Transformer模型。它通过继承预训练的文本到图像模型 CogView2,并在此基础上进行扩展和训练。
-
-
工具
-
-
MovieGen
Movie Gen 是一套基础模型,旨在生成具有同步音频的高质量视频。这项研究的重点是扩展基于 Transformer 的模型,并使用 Flow Matching 进行训练,在文本到视频合成、视频个性化、视频编辑、视频到
-