重磅干貨,第一時(shí)間送達(dá) 一篇文章帶你了解文本到語(yǔ)音轉(zhuǎn)換步驟 在《這篇文章》中,我們有簡(jiǎn)單提到“文本語(yǔ)音轉(zhuǎn)換”的相關(guān)內(nèi)容,本文將繼續(xù)講述其詳細(xì)實(shí)現(xiàn)步驟。 這里小編將介紹文本到語(yǔ)音翻譯的基礎(chǔ)知識(shí)。簡(jiǎn)要介紹文本語(yǔ)音轉(zhuǎn)換,然后介紹如何開始安裝Google文本語(yǔ)音轉(zhuǎn)換(gTTS)模塊。然后繼續(xù)了解gTTS模塊的工作原理,并編寫一個(gè)簡(jiǎn)單的程序以更好地掌握總體概念。最后將探索更多有關(guān)使用此模塊可以完成的工作的想法,然后嘗試?yán)斫饪梢允褂胓TTS完成的許多實(shí)際用例。 P.S 本文將通過(guò)互聯(lián)網(wǎng)使用Google API進(jìn)行文本到語(yǔ)音的翻譯,所以請(qǐng)大家保持網(wǎng)絡(luò)連接正常。 注意:這是語(yǔ)言建模教程的第一部分。在本教程系列中,我們將介紹如何使用gTTS進(jìn)行語(yǔ)音轉(zhuǎn)換,光學(xué)字符識(shí)別,深度學(xué)習(xí)模型(如序列到注意力序列模型)以及其他有趣的東西。 TTS簡(jiǎn)介 文本語(yǔ)音轉(zhuǎn)換(TTS)是將單詞轉(zhuǎn)換為語(yǔ)音形式的過(guò)程。程序,工具或軟件從用戶處獲取輸入文本,并使用自然語(yǔ)言處理方法來(lái)理解所用語(yǔ)言的語(yǔ)言學(xué),并對(duì)文本進(jìn)行邏輯推斷。該處理后的文本被傳遞到下一個(gè)塊,在該塊中對(duì)處理后的文本執(zhí)行數(shù)字信號(hào)處理。經(jīng)過(guò)一些算法的處理,最終轉(zhuǎn)換為語(yǔ)音格式。這整個(gè)過(guò)程涉及語(yǔ)音的合成。下面是一個(gè)簡(jiǎn)單的流程框圖,可以幫助理解上述過(guò)程。 乍一看,這似乎是一個(gè)相當(dāng)復(fù)雜的過(guò)程,但是有了python和gTTS模塊,該過(guò)程可以簡(jiǎn)化為僅僅幾行代碼。從框圖中了解到,首先通過(guò)自然語(yǔ)言處理對(duì)傳遞的文本進(jìn)行預(yù)處理,然后使用數(shù)字信號(hào)處理將其轉(zhuǎn)換為語(yǔ)音。 事不宜遲,讓我們快速開始~ 安裝gTTs模塊: 在本教程的其余部分中都將使用python。請(qǐng)保證電腦中有安裝Python哦~ gTTS模塊的安裝非常簡(jiǎn)單,可以在命令提示符中使用以下命令來(lái)完成: pip install gTTS 轉(zhuǎn)換: 安裝完成后,我們可以繼續(xù)編寫一個(gè)非常簡(jiǎn)單的程序,以了解如何使用此模塊將輸入的文本轉(zhuǎn)換為語(yǔ)音。 來(lái)看一下我們的示例程序:
gTTS(Google文本語(yǔ)音轉(zhuǎn)換)是一個(gè)Python庫(kù)和CLI工具,可與Google的文本語(yǔ)音轉(zhuǎn)換API進(jìn)行交互。我們將從gtts模塊導(dǎo)入gTTS庫(kù),并用該庫(kù)進(jìn)行語(yǔ)音翻譯。 文本變量是用于存儲(chǔ)用戶輸入的字符串。文本可以替換為引號(hào)內(nèi)的任何內(nèi)容。另一種方法是在每次運(yùn)行程序時(shí)使用input語(yǔ)句讓用戶自己輸入。上述過(guò)程可按如下方式進(jìn)行: text = input('Enter your text: ') tts = gTTS(text) tts.save('user_input.mp3') tts變量用于對(duì)用戶的輸入執(zhí)行Google文本到語(yǔ)音轉(zhuǎn)換。轉(zhuǎn)換后的文本以語(yǔ)音形式存儲(chǔ)在tts變量中。 tts.save函數(shù)允許以聲音格式文件的形式來(lái)保存轉(zhuǎn)換后得到的語(yǔ)音。在這里保存為一個(gè)名為user_inpurt,格式為.mp3的文件。當(dāng)然也可以使用其他格式,如.wav等。 經(jīng)過(guò)上述步驟已成功完成文件的保存。 讀?。?/span> 1. 直接從文件夾運(yùn)行保存的文件:可以在運(yùn)行python程序的同一文件夾下找到保存的文件,并且直接播放。 2. 使用Python中的OS模塊:使用python的OS模塊直接從程序中運(yùn)行文件。這樣做的命令如下:
3. 使用playsound模塊:playsound模塊可以用一個(gè)簡(jiǎn)單的命令'pip install playsound'安裝,然后使用以下命令繼續(xù)播放文件中的音頻: from playsound import playsound os.system('user_input.mp3') 結(jié)論: gTTS模塊也可以廣泛用于其他語(yǔ)言,例如法語(yǔ),德語(yǔ),印地語(yǔ)等。當(dāng)存在通信障礙并且用戶無(wú)法將其消息傳達(dá)給人們時(shí),這個(gè)模塊就顯得非常有用了。文字轉(zhuǎn)語(yǔ)音對(duì)視力障礙者或其他殘疾人士也有很大的幫助,因?yàn)樗梢酝ㄟ^(guò)協(xié)助文字到語(yǔ)音的翻譯來(lái)幫助他們。 · END · |
|