LTX-Video量化版 - 速度超快的高质量文本生成视频模型本地一键整合包下载 - AI软件 - 前沿AI软件资源站

无言以对 发表于 2024-12-3 17:52:02

LTX-Video量化版 - 速度超快的高质量文本生成视频模型本地一键整合包下载

LTX-Video 是第一个能够实时生成高质量视频的基于 DiT 的视频生成模型。它以 768x512 的分辨率生成 24 FPS 视频，速度比观看速度快。该模型在包含各种视频的大规模数据集上进行训练，可生成具有逼真和多样化内容的高分辨率视频。LTX-Video为文本到视频以及图像 + 文本到视频用例提供了一个模型。
LTX-Video 支持生成多种尺寸和时长的视频，且生成速度快、资源占用低，从官方提供的demo来看，效果还可以，丰富的提示词生成的效果细节也很饱满。目前支持文生视频和图生视频两种模式。

之前分享的是官方原版，因为对显卡要求高，且速度略慢。今天看到了十字鱼大佬改良的量化版，测试了下，不但速度快（一段5s的视频40步只要30s左右生成），且显存占用只有10G左右，也就是10G显存的显卡也能使用，之前的版本最少12G显存。这个感谢十字鱼大佬的分享！

LTX-Video 相较其他视频生成类模型，具备以下特点：

1、可扩展的长视频制作
能够生成具有可扩展性一致性的扩展高质量视频，从而提供更大的灵活性和控制力。

2、更快的处理和渲染时间
LTXV 针对 GPU 和 TPU 系统进行了优化，可大幅缩短视频生成时间，同时保持高视觉质量。

3、无与伦比的运动和结构一致性
LTXV 独特的帧到帧学习可确保帧之间的连贯过渡，从而消除场景中的闪烁和不一致等问题。

使用教程：(建议N卡，显存10G起)

输入提示词，选择生成视频分辨率和时长以及高级参数，生成即可
支持参考图生成视频，操作类似。参数按照页面推荐值设置即可。

编写提示时，请专注于动作和场景的详细、按时间顺序的描述。包括特定的动作、外观、摄像机角度和环境细节 - 所有这些都在一个流畅的段落中。直接从操作开始，并保持描述的字面意思和准确性。像电影摄影师一样描述镜头列表。保持在 200 字以内。为了获得最佳结果，请使用以下结构构建提示:
[*]从一句话的主要动作开始
[*]添加有关动作和手势的特定详细信息
[*]精确描述角色/对象外观
[*]包括背景和环境详细信息
[*]指定摄像机角度和移动轨迹
[*]描述光照和颜色
[*]记录任何变化或突发事件
查看示例以获得更多灵感.参数指南
[*]分辨率预设：较高的分辨率适用于详细的场景，较低的分辨率可加快生成速度并简化场景
[*]种子：保存种子值以重新创建您喜欢的特定样式或构图
[*]引导尺度：3-3.5 是推荐值
[*]推理步数：质量步骤更多（40+），速度步骤更少（20-30）

下载地址：
夸克网盘：https://pan.quark.cn/s/41e8498513af
百度网盘：
**** Hidden Message *****

nsctt 发表于 2024-12-3 19:52:25

这个量化版不错，体积减少了，希望速度上也能改善下，谢谢分享

AjaxTian 发表于 2024-12-7 12:01:18

thanksthanksthanks！

USERATM 发表于 2024-12-8 09:31:57

想試試，謝謝

viktor1982 发表于 2025-2-19 04:30:03

页: [1]

前沿AI软件资源站's Archiver

LTX-Video量化版 - 速度超快的高质量文本生成视频模型 本地一键整合包下载

LTX-Video量化版 - 速度超快的高质量文本生成视频模型本地一键整合包下载