ChatGpt+Vits使用体验

admin 2023年2月22日02:15:14评论833 views字数 1169阅读3分53秒阅读模式



网安引领时代,弥天点亮未来   





 

ChatGpt+Vits使用体验

0x00故事是这样的



声学模型

(1).声学模型是声音合成系统的重要组成部分。

ChatGpt+Vits使用体验


(2).主流的声学模型主要有Tacotron,FastSpeech。

VITS也是一个声学模型

(1).VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一种语音合成方法,它使用预先训练好的语音编码器 (vocoder声码器) 将文本转化为语音。

ChatGpt+Vits使用体验


VITS 的工作流程如下: 

(1).将文本输入 VITS 系统,系统会将文本转化为发音规则。

(2).将发音规则输入预先训练好的语音编码器 (vocoder),vocoder 会根据发音规则生成()


(3).语音信号的特征表示。


(4).将语音信号的特征表示输入预先训练好的语音合成模型,语音合成模型会根据特征表示生成合成语音。


(5).VITS 的优点是生成的语音质量较高,能够生成流畅的语音。但是,VITS 的缺点是需要大量的训练语料来训练 vocoder 和语音合成模型,同时需要较复杂的训练流程。 


语音模型的训练教程可以参考下面这篇文章

(1).https://www.bilibili.com/read/cv20598500。


(2).选择这篇文章的理由,过程简单好理解,废话少。


训练好的模型可以使用下面的工具合成语音


(1).GUI版本:

https://github.com/CjangCjengh/MoeGoe

ChatGpt+Vits使用体验


(2).python版本:

https://github.com/CjangCjengh/MoeGoe

ChatGpt+Vits使用体验

(3).在线API接口

https://github.com/fumiama/MoeGoe

ChatGpt+Vits使用体验

别人训练好的模型效果视频演示

(1).在线地址:

https://huggingface.co/spaces/sayashi/vits-models


8.欢迎大家关注弥天安全实验室公众号。


9.文章来源参考:

(1).https://huggingface.co/spaces/sayashi/vits-models

(2).https://www.bilibili.com/read/cv20598500

(3).https://www.bilibili.com/read/cv20837189

(4).https://www.bilibili.com/read/cv21342054/

(5).https://github.com/CjangCjengh/MoeGoe

(6).https://github.com/CjangCjengh/MoeGoe_GUI


ChatGpt+Vits使用体验 


知识分享完了

喜欢别忘了关注我们哦~


学海浩茫,

予以风动,
必降弥天之润!


   弥  天

安全实验室

ChatGpt+Vits使用体验


原文始发于微信公众号(弥天安全实验室):ChatGpt+Vits使用体验

  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2023年2月22日02:15:14
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   ChatGpt+Vits使用体验https://cn-sec.com/archives/1563137.html

发表评论

匿名网友 填写信息