v1.3
版本发布时间: 2024-09-28 20:15:24
Huanshere/VideoLingo最新发布版本:v2.0(2024-11-17 17:02:12)
主要更新:
- 加入中文输入支持!需要手动下载模型放在model中
- 增加了一步骤的UVR人声分离,效果更好
- 在WhisperX转录之前进行人声分离,保证转录质量(仅WhisperX本地版)
- 改进配音流程,修复了音频时间比视频长的问题
- 大幅修复了phrase错误!!!
- 补充了trim后的检查
详细更新:
-
新增功能:
- 增加中文语言支持
- 新增 UVR 模型,提高音频质量
-
性能优化:
- 设置访问 GPT 超时
- 使用 pip 安装 torch,取代 conda
- WhisperX 本地版会在转录前进行 UVR 处理,保证质量
- 根据显存自动调整 WhisperX 本地运行的 batch size
-
用户体验改进:
- 缩减 prompt,备选方案从 3 个变成 2 个
- 最大长度更新至 70
- 字号更大,每行更短
- 侧边栏加入输入语言选项
- 上传时检查视频名
-
配音优化:
- 修复了中文转英文配音时的一些问题
-
依赖优化:
- 移除了大部分的 ffmpeg 依赖
- 不再需要 ffprobe
- Mac 用户无需手动安装 ffmpeg
-
文档更新:
- 更新 README.md
- 更新 config.example.py
小细节:
- 取消了大部分 ffmpeg 依赖,简化安装流程
- 完善了配置文档