LTX-2.3 - 图像加音频生成视频,音画一体 支持50系显卡 一键整合包下载
LTX-2.3 是 Lightricks 推出的最新一代音视频生成模型,它能在同一个模型里同时生成画面和声音,效果更清晰、更贴合提示词,适合做高质量的多模态内容创作。
LTX-2.3 是一个强大的“文字/图像到音视频”生成工具,适合做AI影视生成领域。如果你想要快速生成带声音的视频,它是一个非常有潜力的选择。
今天分享的 LTX-2.3 音频驱动图像生成视频 一键包基于社区大佬的GGUF模型打包制作,支持自定义上传音频生成音画同步对口型视频,最低8G显存(32G运行内存)即可使用。支持WebUI小白模式和ComfyUI专业模式。
主要特点
音视频同步生成:不仅能生成视频,还能同时生成匹配的音效或音乐,保证画面与声音协调。
更高质量:相比上一代 LTX-2,LTX-2.3 在画面清晰度和音频质量上都有明显提升。
提示词理解更好:对输入的文字描述(prompt)响应更准确,生成结果更符合预期。
简单易用:不需要你会编程或视频剪辑,写好提示词(prompt)就能用,适合新手。
多种工具支持:有空间放大器(提升分辨率)、时间放大器(提升帧率),适合多阶段生成流程。
应用领域
内容创作:YouTuber、抖音博主可以用它快速生成短视频素材,比如旅行风景、剧情片段。
广告营销:商家可以用它做产品宣传片,展示产品在各种酷炫场景中的效果。
影视预览:导演或编剧可以用它来快速生成概念视频,测试剧本的视觉效果。
教育和培训:老师可以用它制作生动教学视频,比如历史场景重现或科学实验模拟。
游戏和虚拟世界:开发者可以用它生成游戏背景视频或虚拟场景,节省制作成本。
使用教程:(建议N卡,显存8G起,支持50系显卡)
下载主程序和模型(ComfyUI文件夹),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可
WebUI:启动后自动跳转WebUI,上传图像和音频,输入提示词,设置生成视频宽和高等参数,生成即可。
支持自定义切换模型,模型下载,下载后,放到ComfyUI\models\unet目录,前台切换
ComfyUI工作流:整合包包含所需所有节点。
双击启动,浏览器输入 https://127.0.0.1:8188,点击左侧的 工作流,选择对应的工作流
进入工作流后,上传图像和音频,输入提示词,设置生成视频的宽度和高度,最后运行即可。
关于提示词:提示词越详细,生成的效果越好,尤其是分镜,建议使用大模型生成分镜镜头,再提交生成。
显存8G+运存32G起,如果低于这个配置,建议使用参数更低的模型,比如Q2,Q3,生成效果质量略低。建议显存12G起
软件目录结构:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 unet/
│ │ └── LTX-2.3-distilled-Q4_K_M.gguf
│ ├── 📂 text_encoders/
│ │ └── gemma-3-12b-it-Q4_K_M.gguf
│ └── 📂 vae/
│ └── LTX23_video_vae_bf16.safetensors
📂 deepface/
......
下载地址:
UC网盘:
主程序:https://drive.uc.cn/s/d8aa6d7766e04
模型:https://drive.uc.cn/s/89cc5906168b4
夸克网盘:
**** 本内容需购买 ****
百度网盘:
**** 本内容需购买 ****
大佬,请问这个图生视频的时候,必须放入音频么?它能不能像即梦seedance2那样,图生视频同时自己生成音频啊 YQD17D 发表于 2026-3-16 20:49
大佬,请问这个图生视频的时候,必须放入音频么?它能不能像即梦seedance2那样,图生视频同时自己生成音频 ...
使用图生视频那个版本
这个AI。好像不错。视频有长度的限制吗?可以涩涩吗?
页:
[1]