久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    TTS之Seed-VC:Seed-VC的簡介、安裝和使用方法、案例應用之詳細攻略

     處女座的程序猿 2024-11-18 發布于上海

    TTS之Seed-VC:Seed-VC的簡介、安裝和使用方法、案例應用之詳細攻略


    Seed-VC 項目簡介

    2024年9月,Seed-VC是一個先進的零樣本語音轉換和唱歌語音轉換模型,它利用上下文學習技術無需任何訓練即可克隆語音。只需提供1到30秒的參考語音,Seed-VC就能轉換任意語音到目標語音風格。該項目目前支持零樣本語音轉換、零樣本實時語音轉換和零樣本唱歌語音轉換。

    GitHub地址:https://github.com/Plachtaa/seed-vc

    1、Seed-VC 的特點

    >> 零樣本語音轉換:無需針對目標說話人進行訓練,即可將語音轉換成目標說話人的聲音。
    >> 零樣本實時語音轉換:支持實時語音轉換,能夠進行即時的語音克隆。
    >> 零樣本唱歌語音轉換:能夠將語音轉換成目標說話人的歌聲。
    >> 高性能:在客觀評估中,Seed-VC在語音清晰度和說話人相似度方面顯著優于OpenVoice和CosyVoice等基準模型,甚至在某些情況下也優于一些非零樣本語音轉換模型(如So-VITS-4.0)。
    >> 多語言支持:項目提供英文、簡體中文和日語的README文檔。
    >> 多種接口:提供命令行接口、Gradio網頁界面和實時語音轉換GUI。

    Seed-VC 的安裝和使用方法

    1、安裝

    建議使用Python 3.10版本在Windows或Linux系統上運行。安裝依賴包:

    pip install -r requirements.txt

    2、使用方法:

    T1、命令行接口???????

    python inference.py --source <source-wav>
    --target <referene-wav>
    --output <output-dir>
    --diffusion-steps 25 # recommended 50~100 for singingvoice conversion
    --length-adjust 1.0
    --inference-cfg-rate 0.7
    --f0-condition False # set to True for singing voice conversion
    --auto-f0-adjust False # set to True to auto adjust source pitch to target pitch level, normally not used in singing voice conversion
    --semi-tone-shift 0 # pitch shift in semitones for singing voice conversion

    參數說明:

    source:待轉換語音文件的路徑。

    target:目標語音(參考語音)文件的路徑。

    output:輸出目錄的路徑。

    diffusion-steps:擴散步驟數,默認25,唱歌語音轉換建議使用50-100,快速轉換可以使用4-10。

    length-adjust:長度調整因子,默認1.0,小于1.0加快語音速度,大于1.0減慢語音速度。

    inference-cfg-rate:對輸出有細微影響,默認0.7。

    f0-condition:是否根據源音頻的音高調整輸出音高,默認False,唱歌語音轉換設置為True。

    auto-f0-adjust:是否自動調整源音頻音高到目標音高水平,默認False,唱歌語音轉換通常不使用。

    semi-tone-shift:唱歌語音轉換的音高偏移(半音),默認0。

    T2、Gradio 網頁界面

    運行 python app.py,然后在瀏覽器打開 http://localhost:7860/ 使用網頁界面。

    python app.py

    T3、在線測試

    測試地址Seed-VC

    3、實時語音轉換GUI

    運行 python real-time-gui.py。強烈建議使用GPU進行實時語音轉換。 項目中提供了不同GPU配置下的參數建議,以優化性能和質量。

    python real-time-gui.py

    Seed-VC 的案例應用

    項目提供了大量的客觀評估結果,包括零樣本語音轉換和零樣本唱歌語音轉換的評估。

    1、零樣本語音轉換評估

    使用LibriTTS-test-clean數據集的100個隨機語句作為源音頻,以及12個隨機選擇的真實語音作為參考音頻。評估指標包括說話人嵌入余弦相似度(SECS)、詞錯誤率(WER)和字符錯誤率(CER)。結果表明,Seed-VC顯著優于OpenVoice和CosyVoice基準模型。 還與非零樣本模型(So-VITS-4.0)進行了比較,結果顯示Seed-VC即使未在目標說話人上進行訓練,也能取得更好的結果。

    python eval.py 
    --source ./examples/libritts-test-clean
    --target ./examples/reference
    --output ./examples/eval/converted
    --diffusion-steps 25
    --length-adjust 1.0
    --inference-cfg-rate 0.7
    --xvector-extractor "resemblyzer"
    --baseline ""  # fill in openvoice or cosyvoice to compute baseline result
    --max-samples 100  # max source utterances to go through

    2、零樣本唱歌語音轉換評估

    使用M4Singer數據集進行評估,比較了Seed-VC與針對每個說話人訓練的RVCv2-f0-48k模型。評估指標包括F0CORR、F0RMSE、SECS和CER。結果顯示,Seed-VC在說話人相似度和清晰度方面優于RVCv2模型,但音頻質量略低,項目組表示未來會優先改進音頻質量。

      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 无码AV免费永久免费永久专区| 免费无码国产欧美久久18| 一区二区三区精品不卡| 精品国产中文字幕在线| 深夜精品免费在线观看| 日韩中文字幕人妻精品| 精品乱码一区二区三四五区| 亚洲高清WWW色好看美女| 国产毛1卡2卡3卡4卡免费观看| 国产欧美在线一区二区三| 樱花草在线社区WWW韩国| 国产SM重味一区二区三区| 久久精品亚洲乱码伦伦中文| 成A人片亚洲日本久久| 亚洲综合色婷婷六月丁香宅男大增| 日日摸夜夜添夜夜添高潮喷水| 97人妻人人做人碰人人爽| A级大胆欧美人体大胆666| 亚洲第一精品一二三区| 亚洲欧美中文字幕日韩一区二区| 巨茎中出肉欲人妻在线视频| 亚洲AV区无码字幕中文色 | 国产精品自拍中文字幕| 怡红院一区二区三区在线| 性欧美老人牲交XXXXX视频| 麻豆一二三区精品蜜桃| 高清破外女出血AV毛片| 国产精品无码久久综合网| 国内不卡一区二区三区| 国产精品点击进入在线影院高清 | 6080午夜三级中文在线观看| 国产精品自产拍在线观看中文| 亚洲国产日韩一区三区| 在厨房被C到高潮A毛片奶水| 高清破外女出血AV毛片| 精品亚洲麻豆1区2区3区| 无码免费大香伊蕉在人线国产| 一个人免费视频观看在线WWW| 亚洲欧美人成网站在线观看看| 国产精品 视频一区 二区三区| 亚洲中文字幕日产无码成人片|