
MS-TTS
免費可用的微軟Azure的文本轉(zhuǎn)語音,聲音感情豐富,和真人朗讀無異。
使用教程
1、打開軟件,默認是不能用的,需要在設(shè)置里面填寫微軟的接口,然后保存配置。
微軟:
“wss://eastus.tts.speech.microsoft.com/cognitiveservices/websocket/v1
Edge:
“wss://speech.platform.bing.com/consumer/speech/synthesize/readaloud/edge/v1
2、現(xiàn)在來分析一下這兩個不同的引擎的區(qū)別,總的來說就是,微軟的效果更好但是不夠穩(wěn)定。
3、修改好語音、風格、角色、語速、音調(diào),在右側(cè)輸入好文本,點擊試聽可以先聽聽看,最后再合成。
4、上面是最基礎(chǔ)的用法,如果有一段話,想要用多個不同的角色讀出來,不需要分別生成再進行拼接,只需要先在左側(cè)設(shè)定好角色音速等,點擊【添加角色】
添加好多個角色以后,在右側(cè)的編輯框添加好文字,選中文字右擊可以設(shè)定文字的角色。
5、但是要注意,設(shè)定多個角色時,【試聽】只能聽到第一個,【合成】才能聽到全部的,生成的文件保存在軟件同目錄下的audio文件夾。
6、如果需要生成的在多個文本里面,可以從超長文本里面導入,文本大小不能超過5MB,且編碼必須是UTF-8。
7、如果這些還是不能滿足使用需要,可以使用SSML模式,這是一種類似于HTML的標記語言,通過代碼可以控制所有內(nèi)容。