无言以对 发表于 2024-11-25 09:17:15

LTX-Video - 高质量文本生成视频、参考图生成视频的视频生成模型 本地一键整合包下载



LTX-Video 是第一个能够实时生成高质量视频的基于 DiT 的视频生成模型。它以 768x512 的分辨率生成 24 FPS 视频,速度比观看速度快。该模型在包含各种视频的大规模数据集上进行训练,可生成具有逼真和多样化内容的高分辨率视频。LTX-Video为文本到视频以及图像 + 文本到视频用例提供了一个模型。
LTX-Video 支持生成多种尺寸和时长的视频,且生成速度快、资源占用低,从官方提供的demo来看,效果还可以,丰富的提示词生成的效果细节也很饱满。目前支持文生视频和图生视频两种模式。

LTX-Video 相较其他视频生成类模型,具备以下特点:

1、可扩展的长视频制作
能够生成具有可扩展性一致性的扩展高质量视频,从而提供更大的灵活性和控制力。

2、更快的处理和渲染时间
LTXV 针对 GPU 和 TPU 系统进行了优化,可大幅缩短视频生成时间,同时保持高视觉质量。

3、无与伦比的运动和结构一致性
LTXV 独特的帧到帧学习可确保帧之间的连贯过渡,从而消除场景中的闪烁和不一致等问题。



使用教程:(建议N卡,显存12G起)
输入提示词,选择生成视频分辨率和时长以及高级参数,生成即可
支持参考图生成视频,操作类似。

编写提示时,请专注于动作和场景的详细、按时间顺序的描述。包括特定的动作、外观、摄像机角度和环境细节 - 所有这些都在一个流畅的段落中。直接从操作开始,并保持描述的字面意思和准确性。像电影摄影师一样描述镜头列表。保持在 200 字以内。为了获得最佳结果,请使用以下结构构建提示:
[*]从一句话的主要动作开始
[*]添加有关动作和手势的特定详细信息
[*]精确描述角色/对象外观
[*]包括背景和环境详细信息
[*]指定摄像机角度和移动轨迹
[*]描述光照和颜色
[*]记录任何变化或突发事件
查看示例以获得更多灵感.参数指南
[*]分辨率预设:较高的分辨率适用于详细的场景,较低的分辨率可加快生成速度并简化场景
[*]种子:保存种子值以重新创建您喜欢的特定样式或构图
[*]引导尺度:3-3.5 是推荐值
[*]推理步数:质量步骤更多 (40+),速度步骤更少 (20-30)


下载地址:
夸克网盘:https://pan.quark.cn/s/52ff1442d1be
百度网盘:
**** 本内容需购买 ****

nsctt 发表于 2024-11-25 09:42:48

又出新AI不错,期待一键包
页: [1]
查看完整版本: LTX-Video - 高质量文本生成视频、参考图生成视频的视频生成模型 本地一键整合包下载