今天七夜在逛github的时候发现了一个特别优秀的语音合成模型ChatTTS,语音合成效果太炸裂了,停顿都极其自然,真有点担心,之后会被诈骗利用,伪装成真人,着实可怕。
特点
ChatTTS的设计初衷是服务于对话场景,特别是为大型语言模型(LLM)助理等提供支持。它通过以下几个方面展现了其卓越的性能:
-
对话式语音合成:ChatTTS优化了对话任务,使得合成的语音不仅自然,而且富有表现力。它支持多角色朗读,为互动式对话提供了真实的声音体验。 -
细粒度控制:模型能够预测和控制包括笑声、停顿和插话在内的细粒度韵律特征,这为合成的语音增添了更多的真实性和多样性。 -
优越的韵律表现:在韵律表现上,ChatTTS超越了大多数开源TTS模型,提供了预训练模型以支持进一步的研究和开发。 -
多语言支持:ChatTTS支持中英文混合输入,满足了多语言环境下用户的全球化沟通需求。 -
易用的Python接口:简洁的Python接口使得开发者可以轻松集成和使用ChatTTS,无论是研究、开发还是实际应用,都能迅速上手。 -
可定制化的语音风格:用户可以根据需要调整生成语音的速度、音调和情感等,以适应不同场合的需求。
安装与使用
在线体验
https://chattts.com/zh
pip install git+https://github.com/2noise/ChatTTS
如果使用的是conda
则使用下面的方式进行安装:
git clone https://github.com/2noise/ChatTTS
cd ChatTTS
conda create -n chattts
conda activate chattts
pip install -r requirements.txt
2. 拉取项目:
git clone https://github.com/2noise/ChatTTS
3.启动webui
通过运行examples/web/webui.py
来启动webui界面来体验该项目
python examples/web/webui.py
命令行方式也可以:
python examples/cmd/run.py "输入需要生成音频的文字."
Python调用示例
# 导入依赖
import torch
import ChatTTS
from IPython.display import Audio
# 初始化ChatTTS
chat = ChatTTS.Chat()
chat.load_models()
# 准备一段内容
texts = ["待生成音频的内容",]
# 生成音频
wavs = chat.infer(texts, use_decoder=True)
# 播放音频
Audio(wavs[0], rate=24_000, autoplay=True)
最后
https://github.com/2noise/ChatTTS
原文始发于微信公众号(七夜安全博客):ChatTTS:一款效果炸裂的语音合成模型,居然听不出是AI,停顿呼吸极其自然
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论