要使用模型進行推理的話你首先需要一段已經(jīng)演唱好的聲音墊進去,然后使用模型把原來的音色換成你模型訓練好的音色,所以我們需要先對你墊進去的聲音進行處理,去掉原始音樂的BGM,只留下人物的干聲。 1、音頻文件準備 準備一首歌曲文件,mp3、wav、m4a等常用聲音格式文件均可以 打開https:///,這個網(wǎng)站可以在線分離人聲和背景音樂 上傳文件,等待解析分離(這里可能需要等待幾分鐘) 分離好后,分別下載人聲干音和背景音 下載好后,再打開一個在線音頻分離軟件https://pose.app/audio/splitter/mp3 ,將人聲按一分鐘間隔分離,也可不分離,該步驟主要作用是防止后期推理時因聲音太長,發(fā)生錯誤 分割好后,導出文件,導出的是一個分割的音頻壓縮包,下載后解壓備用(這里也需要等待幾分鐘) 2、打開coloab,按順序安裝環(huán)境 https://colab.research.google.com/drive/11syId1sx5vaoX1V_gmvC0E4uTUBnpmwr 安裝到第二步,可能需要重啟colab環(huán)境 然后繼續(xù)安裝,該過程可能需要幾分鐘 繼續(xù)到這一步,這里填寫我上傳好的孫燕姿模型: https:///file/xBdg0ayL#NNWOmULIeEGCmmteLepngWNrU5D-6qtqWxBQabCn1o0 當然你也可以上傳其他聲音模型或者自己訓練模型,注意模型版本需要4.0 然后繼續(xù)安裝,到最后一步時,上傳你的音頻文件到目錄 然后點擊Convert開始推理,等待推理完成,會在你的聲音目錄生成轉(zhuǎn)換后的聲音文件,下載到本地 3、最后導入到視頻或者音頻軟件,將生成的AI音頻和之前分離的背景音合并在一起,這樣一個AI音色的歌曲便生成成功了 歡迎加入AI&ChatGPT玩法知識星球社區(qū),學習ChatGPT技術(shù),了解最新AI動態(tài),賺取更多的收入! |
|
來自: 勇敢的芯2 > 《網(wǎng)文》