精品应用软件与实用教程
轻松将文字转为语音:ChatTTS WebUI 全面教程,快速生成多语种语音!
在本教程中,我们将深入探讨 ChatTTS WebUI,一个强大的在线文字转语音(TTS)工具,帮助用户将文字合成为语音。无论是需要进行文本语音合成,还是想要生成高质量的语音输出,ChatTTS 都能满足你的需求。我们将介绍如何使用 ChatTTS 的语音生成功能,涵盖网页 TTS 工具的基本操作,以及如何调整语速和音调等自定义参数。
此外,教程将展示如何通过 ChatTTS 进行多语种支持的语音合成,确保你能够生成适合各种语言的语音文件。无论你是进行视频配音、制作学习材料,还是想要创建语音广播,这个在线工具都能为你提供便捷的解决方案。加入我们,探索如何使用 ChatTTS 在线语音合成工具,轻松生成文本转语音服务,让你的文字内容变得生动有趣!
ChatTTS WebUI 是一种基于网页的用户界面,允许用户直接通过浏览器使用文本转语音(TTS)功能。它为用户提供了一种简单、方便的方式,通过网络访问语音生成工具,无需复杂的本地安装或配置。
ChatTTS WebUI 的主要功能和特点:
- 便捷的网页操作:无需安装任何软件,用户可以直接在浏览器中输入文本并生成语音。
- 多语种支持:支持多种语言的文本转语音,适合全球用户。
- 语音自定义:通常提供自定义语音参数的选项,如语速、音量、音调等,让用户能够根据需求生成个性化语音。
- 高效生成:ChatTTS WebUI 提供快速的语音生成体验,适合需要频繁生成语音文件的场景。
- 下载和保存:生成的语音文件可以直接下载,用于各种项目或应用中。
使用场景:
ChatTTS WebUI 适用于需要将文字内容转化为语音输出的用户,如语音广播、视频配音、学习语言等。它的网络访问性和多功能性使其成为生成语音的便捷工具。
ChatTTS WebUI 一个简单的本地网页界面,直接使用ChatTTS将文字合成为语音,同时支持对外提供API接口。从 Releases中下载压缩包,解压后双击 app.exe 即可使用,某些安全软件可能报毒,请退出或使用源码部署。
ChatTTS 是一款用于将文本转换为语音的工具(Text-to-Speech,简称 TTS)。它允许用户输入文字并生成自然、流畅的语音输出。这款工具可以用于多种场景,包括教育、播客、语音助手、无障碍访问等。ChatTTS 支持多种语言和语音风格,提供高质量的语音合成服务。
ChatTTS使用方法
安装和配置
下载和安装:
- 访问 ChatTTS 的官方网站或应用商店,下载并安装 ChatTTS 应用程序。
- 根据提示进行安装,并启动应用。
创建账户并登录:
- 如果需要高级功能或云端合成服务,建议创建账户并登录。
- 一些功能可能需要订阅或购买。
生成语音
输入文本:
- 在应用程序的文本框中输入你想转换为语音的文字内容。
选择语言和语音:
- 从下拉菜单中选择所需的语言和语音风格。
- 可以选择默认选项或根据需要自定义音调、语速和音量。
生成语音:
- 点击“生成”按钮,ChatTTS 会将输入的文本转换为语音。
- 你可以实时试听生成的语音,并根据需要进行调整。
保存和导出:
- 生成的语音可以保存为音频文件(如 MP3、WAV 格式),方便在其他场景中使用。
- 选择“保存”或“导出”选项,选择文件格式和保存路径。
高级功能
批量处理:
- 对于需要转换大量文本的用户,ChatTTS 提供批量处理功能。
- 导入文本文件或文档,批量生成语音文件。
API 集成:
- 开发者可以使用 ChatTTS 提供的 API,将 TTS 功能集成到自己的应用或服务中。
- 访问 ChatTTS 开发者文档,了解 API 调用方法和使用示例。
软件更新
ChatTTS webUI windows-v0.90 更新内容
- 优化中文文本归一化
- 添加 speed 1-9
- 固定音色
- env中增加
compile=true
,为true启用推理优化,为false禁用,某些情况下禁用将提高GPU速度,并减少报错 - 数字转为对应语言的读法
- torch降低到2.1.2
ChatTTS webUI 下载
一个简单的本地网页界面,在网页使用 ChatTTS 将文字合成为语音,支持中英文、数字混杂,并提供API接口。下面提供ChatTTS下载
GitHub:https://github.com/jianchang512/ChatTTS-ui
0.96版起,源码部署必须先安装ffmpeg ,之前的音色文件csv和pt已不可用,请填写音色值重新生成
v1.0完整包下载(1.7G含模型)
百度网盘下载: https://pan.baidu.com/s/1ch8dUXhOtK0VOnvq5FnJWw?pwd=vagn
123网盘下载:https://www.123pan.com/s/03Sxjv-s9VB3.html
GitHub: https://github.com/jianchang512/ChatTTS-ui/releases/download/v1.0/win-ChatTTS-ui-v1.0.7z
v1.02升级补丁包下载(190M)
补丁包仅用于覆盖旧版本升级,不可独立使用,如果未下载过完整包,请先下载完整包并解压,然后再下载补丁包覆盖。
升级补丁包GitHub下载地址: https://github.com/jianchang512/ChatTTS-ui/releases/download/v1.0/win-PatchUpdate-v1.02.7z
全部模型下载
默认将在第一次运行时自动下载模型,如果网络问题下载失败,请手动下载
GitHub 下载地址: https://github.com/jianchang512/ChatTTS-ui/releases/download/v1.0/all-models.7z
百度网盘下载: https://pan.baidu.com/s/1yGDZM9YNN7kW9e7SFo8lLw?pwd=ct5x
下载后解压后,会看到asset文件夹,该文件夹内有多个pt文件,将所有pt文件复制到本目录下,然后重启软件
v0.89完整包下载(2.7G含模型)
百度网盘下载: https://pan.baidu.com/s/1GKa9pBq_MYtOPVJxCnZLJw?pwd=p8d5
123网盘下载:https://www.123pan.com/s/03Sxjv-GoyB3.html
huggingface link: https://huggingface.co/spaces/mortimerme/s4/resolve/main/ChatTTS-UI-0.89.7z?download=true
v0.90升级补丁包下载(190M)
补丁包仅用于覆盖旧版本升级,不可独立使用,如果未下载过完整包,请先下载完整包并解压,然后再下载补丁包覆盖。
修复torch清除缓存bug
补丁包内含 app.exe
、.env
和templates
.speaker
文件夹,解压后将这些文件文件夹复制到旧版目录下覆盖同名。
升级补丁包下载地址: https://github.com/jianchang512/ChatTTS-ui/releases/download/v0.89/win-PatchUpdate-v0.90.zip
在pyVideoTrans软件中使用
升级 pyVideoTrans 到 1.82+ https://github.com/jianchang512/pyvideotrans
- 点击菜单-设置-ChatTTS,填写请求地址,默认应该填写 http://127.0.0.1:9966
- 测试无问题后,在主界面中选择
ChatTTS
ChatTTS-WebUI测试页面项目
原项目模型整合了一下,封装成一个带有测试页面的项目。
可以直接使用,github地址:https://github.com/Hy-1990/ChatTTS-hy
需要下载模型,解压到项目下,放在百度云盘了。
模型下载链接:https://pan.baidu.com/s/1RjxJFM9N_PSMA468MQcICg 提取码:om8p
按照README步骤执行webui py文件。
测试效果如下:
页面参数说明
文本预处理
表示是否对输入的文本先进行预处理后再进行生成音频。默认勾选。勾选此选项可以对输入文本进行优化或修改,提升语音的自然度和可理解性。
Audio Seed
用于初始化随机数生成器的种子值,可用于生成不同音色的音频文件。设置相同的 Audio Seed 可以确保重复生成一致的语音,便于实验和调试。点击旁边的骰子按钮,可对音色进行随机抽卡。
Text Seed
类似于 Audio Seed,在文本生成阶段用于初始化随机数生成器的种子值。点击旁边的骰子按钮,可对文本进行随机抽卡。,处理后会随机加一些更细粒度的控制,比如调整笑声、停顿和口音等。
Audio Temperature
用于控制输出的随机性。数值越高,生成的语音越可能包含意外变化;数值较低则趋向于更平稳的输出。
Top_P 和 Top_K
Top_P: 核采样策略,定义概率累积值,模型将只从这个累积概率覆盖的最可能的词中选择下一个词。
Top_K: 限制模型考虑的可能词汇数量,设置为一个具体数值,模型将只从这最可能的 K 个词中选择下一个词。
进阶使用技巧
除了基本的参数设置,还可以进行更细粒度的控制,比如调整笑声、停顿和口音。以下是一些常用的控制标记:
[oral_(0-9)]: 控制口音强度
[laugh_(0-2)]: 控制笑声
[break_(0-7)]: 控制停顿时间
试试不同的组合,比如 [oral 2][laugh 0][break 4],探索更多有趣的语音效果。
可以男声变女声吗