简单易用
pyVideoTrans 的目标是为用户提供一个操作简便/解压即用的视频翻译工具,尤其适合技术小白或对技术了解有限的用户。为此,软件在功能实现上尽量简化,比如,虽然 Whisperx 在语音识别和角色区分方面更强,但由于其安装复杂且容易出错,pyVideoTrans选择了更容易使用的方案,确保用户能够轻松上手。
功能多样
除了支持多语言间的视频翻译,软件还集成了语音转录、文字配音和字幕翻译等功能。对于只需要语音转录或配音的用户,也可以单独使用这些功能,无需完整翻译视频,避免了额外下载其他软件的麻烦。
跨平台支持
软件支持多平台,Windows 用户可以直接下载解压使用,而 MacOS 和 Linux 用户可以通过一键安装源码方便快捷地启动。
丰富的第三方接口支持
视频翻译分为语音识别、字幕翻译、文字配音三个阶段,软件在每个阶段都支持多种第三方接口。
例如,语音识别阶段可以选择使用 faster-whisper 或 openai-whisper,也可以选择在线 API 接口或自建的语音识别服务;
字幕翻译阶段支持 Google 翻译、ChatGPT、或本地大模型等方式。
配音阶段也同样灵活,用户可以选择默认的 edgetts 配音,或集成其他 API,例如 OpenAI、ElevenLabs、Azure 等。
每个阶段可支持使用自己的api接口,如果你有自己开发的api服务的话。
高度自定义
软件提供几十项自定义选项,用户可以根据需求调整翻译渠道、配音方式、语音识别引擎、音调、语速、字幕样式(字体、颜色、大小)、视频输出质量等。支持对翻译和配音任务的并发量控制,实现高度个性化的翻译体验。
支持完全离线使用
如果你需要离线处理,软件支持完全本地运行,语音识别可以使用 faster-whisper 或 openai-whisper,配音可以通过 Clone-voice 或 GPT-SoVITS 等工具,无需联网即可完成所有操作。
免费与商业 API 灵活结合
软件默认提供完全免费的方案,所有核心功能均不需要任何费用。语音识别、翻译和配音均有免费选项,如 faster-whisper 和 Edge-TTS。而对于有更高需求的用户,软件同样支持三方商业 API,例如 ChatGPT、Azure 以及其他高级语音合成服务,提供更高质量的翻译和配音。
API 集成支持
软件提供便捷的 API 调用功能,方便开发者将其集成到其他工具或流程中使用。
完善的文档与支持社区
pyVideoTrans提供了完整的使用教程和参考文档,用户可以通过 文档站点 (https://pyvideotrans.com) 学习如何使用软件。此外,遇到技术难题,还可以在 社区论坛 (https://bbs.pyvideotrans.com) 提问,获取帮助。