VoxCPM:tokenizer-free 擴散式架構的開源 zero-shot 語音克隆 TTS
過去要做語音克隆,多半得把音檔上傳到某個雲端 API,付費、排隊、還得把自己的聲音交給別人的伺服器。VoxCPM 把這條路徑整個收回到本地:一段數秒的參考音檔,加上一句要合成的文字,模型就能產出帶著相同音色的語音。它由 OpenBMB 釋出,採 Apache-2.0 授權,權重與推論程式碼都公開在 GitHub。
標籤「OpenBMB」相關文章共 1 篇 — Tony.Wu Blog
過去要做語音克隆,多半得把音檔上傳到某個雲端 API,付費、排隊、還得把自己的聲音交給別人的伺服器。VoxCPM 把這條路徑整個收回到本地:一段數秒的參考音檔,加上一句要合成的文字,模型就能產出帶著相同音色的語音。它由 OpenBMB 釋出,採 Apache-2.0 授權,權重與推論程式碼都公開在 GitHub。