LTX-Video量化版 - 速度超快的高质量文本生成视频模型 本地一键整合包下载
LTX-Video 是第一个能够实时生成高质量视频的基于 DiT 的视频生成模型。它以 768x512 的分辨率生成 24 FPS 视频,速度比观看速度快。该模型在包含各种视频的大规模数据集上进行训练,可生成具有逼真和多样化内容的高分辨率视频。LTX-Video为文本到视频以及图像 + 文本到视频用例提供了一个模型。
LTX-Video 支持生成多种尺寸和时长的视频,且生成速度快、资源占用低,从官方提供的demo来看,效果还可以,丰富的提示词生成的效果细节也很饱满。目前支持文生视频和图生视频两种模式。
之前分享的是官方原版,因为对显卡要求高,且速度略慢。今天看到了十字鱼大佬改良的量化版,测试了下,不但速度快(一段5s的视频40步只要30s左右生成),且显存占用只有10G左右,也就是10G显存的显卡也能使用,之前的版本最少12G显存。这个感谢十字鱼大佬的分享!
LTX-Video 相较其他视频生成类模型,具备以下特点:
1、可扩展的长视频制作
能够生成具有可扩展性一致性的扩展高质量视频,从而提供更大的灵活性和控制力。
2、更快的处理和渲染时间
LTXV 针对 GPU 和 TPU 系统进行了优化,可大幅缩短视频生成时间,同时保持高视觉质量。
3、无与伦比的运动和结构一致性
LTXV 独特的帧到帧学习可确保帧之间的连贯过渡,从而消除场景中的闪烁和不一致等问题。
使用教程:(建议N卡,显存10G起)
输入提示词,选择生成视频分辨率和时长以及高级参数,生成即可
支持参考图生成视频,操作类似。参数按照页面推荐值设置即可。
编写提示时,请专注于动作和场景的详细、按时间顺序的描述。包括特定的动作、外观、摄像机角度和环境细节 - 所有这些都在一个流畅的段落中。直接从操作开始,并保持描述的字面意思和准确性。像电影摄影师一样描述镜头列表。保持在 200 字以内。为了获得最佳结果,请使用以下结构构建提示:
[*]从一句话的主要动作开始
[*]添加有关动作和手势的特定详细信息
[*]精确描述角色/对象外观
[*]包括背景和环境详细信息
[*]指定摄像机角度和移动轨迹
[*]描述光照和颜色
[*]记录任何变化或突发事件
查看示例以获得更多灵感.参数指南
[*]分辨率预设:较高的分辨率适用于详细的场景,较低的分辨率可加快生成速度并简化场景
[*]种子:保存种子值以重新创建您喜欢的特定样式或构图
[*]引导尺度:3-3.5 是推荐值
[*]推理步数:质量步骤更多 (40+),速度步骤更少 (20-30)
下载地址:
夸克网盘:https://pan.quark.cn/s/41e8498513af
百度网盘:
**** Hidden Message *****
这个量化版不错,体积减少了,希望速度上也能改善下,谢谢分享 thanksthanksthanks! 想試試,謝謝 попробуем
页:
[1]