LTX-2.3 - 图像加音频生成视频，音画一体支持50系显卡一键整合包下载 - AI软件 - 前沿AI软件资源站

无言以对 发表于 2026-3-11 17:49:07

LTX-2.3 - 图像加音频生成视频，音画一体支持50系显卡一键整合包下载

LTX-2.3 是 Lightricks 推出的最新一代音视频生成模型，它能在同一个模型里同时生成画面和声音，效果更清晰、更贴合提示词，适合做高质量的多模态内容创作。
LTX-2.3 是一个强大的“文字/图像到音视频”生成工具，适合做AI影视生成领域。如果你想要快速生成带声音的视频，它是一个非常有潜力的选择。

今天分享的 LTX-2.3 音频驱动图像生成视频一键包基于社区大佬的GGUF模型打包制作，支持自定义上传音频生成音画同步对口型视频，最低8G显存（32G运行内存）即可使用。支持WebUI小白模式和ComfyUI专业模式。

主要特点

音视频同步生成：不仅能生成视频，还能同时生成匹配的音效或音乐，保证画面与声音协调。
更高质量：相比上一代 LTX-2，LTX-2.3 在画面清晰度和音频质量上都有明显提升。
提示词理解更好：对输入的文字描述（prompt）响应更准确，生成结果更符合预期。
简单易用：不需要你会编程或视频剪辑，写好提示词（prompt）就能用，适合新手。
多种工具支持：有空间放大器（提升分辨率）、时间放大器（提升帧率），适合多阶段生成流程。

应用领域

内容创作：YouTuber、抖音博主可以用它快速生成短视频素材，比如旅行风景、剧情片段。
广告营销：商家可以用它做产品宣传片，展示产品在各种酷炫场景中的效果。
影视预览：导演或编剧可以用它来快速生成概念视频，测试剧本的视觉效果。
教育和培训：老师可以用它制作生动教学视频，比如历史场景重现或科学实验模拟。
游戏和虚拟世界：开发者可以用它生成游戏背景视频或虚拟场景，节省制作成本。

使用教程：（建议N卡，显存8G起，支持50系显卡）

下载主程序和模型（ComfyUI文件夹），解压主程序一键包，将ComfyUI文件夹移动到主程序目录下即可

WebUI：启动后自动跳转WebUI，上传图像和音频，输入提示词，设置生成视频宽和高等参数，生成即可。
支持自定义切换模型，模型下载，下载后，放到ComfyUI\models\unet目录，前台切换

ComfyUI工作流：整合包包含所需所有节点。
双击启动，浏览器输入 https://127.0.0.1:8188，点击左侧的工作流，选择对应的工作流
进入工作流后，上传图像和音频，输入提示词，设置生成视频的宽度和高度，最后运行即可。

关于提示词：提示词越详细，生成的效果越好，尤其是分镜，建议使用大模型生成分镜镜头，再提交生成。
显存8G+运存32G起，如果低于这个配置，建议使用参数更低的模型，比如Q2,Q3，生成效果质量略低。建议显存12G起

软件目录结构：

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 unet/
│ │    └── LTX-2.3-distilled-Q4_K_M.gguf
│ ├── 📂 text_encoders/
│ │    └── gemma-3-12b-it-Q4_K_M.gguf
│ └── 📂 vae/
│       └── LTX23_video_vae_bf16.safetensors
📂 deepface/
......

下载地址：
UC网盘：
主程序：https://drive.uc.cn/s/d8aa6d7766e04
模型：https://drive.uc.cn/s/89cc5906168b4

夸克网盘：
**** 本内容需购买 ****

百度网盘：
**** 本内容需购买 ****

YQD17D 发表于 2026-3-16 20:49:36

大佬，请问这个图生视频的时候，必须放入音频么？它能不能像即梦seedance2那样，图生视频同时自己生成音频啊

无言以对 发表于 2026-3-16 22:46:20

YQD17D 发表于 2026-3-16 20:49
大佬，请问这个图生视频的时候，必须放入音频么？它能不能像即梦seedance2那样，图生视频同时自己生成音频 ...

使用图生视频那个版本

yersamdy 发表于 2026-3-17 23:28:15

这个AI。好像不错。视频有长度的限制吗？可以涩涩吗？

页: [1]

前沿AI软件资源站's Archiver

LTX-2.3 - 图像加音频生成视频，音画一体 支持50系显卡 一键整合包下载

LTX-2.3 - 图像加音频生成视频，音画一体支持50系显卡一键整合包下载