# Style-Bert-VITS2ライブラリの使用例

`pip install style-bert-vits2`を使った、jupyter notebookでの使用例です。Google colab等でも動きます。

In [None]:
# PyTorch環境の構築(ない場合)
# 参照: https://pytorch.org/get-started/locally/

!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

In [None]:
# style-bert-vits2のインストール

!pip install style-bert-vits2

In [None]:
# BERTモデルをロード(ローカルに手動でダウンロードする必要はありません)

from style_bert_vits2.nlp import bert_models
from style_bert_vits2.constants import Languages


bert_models.load_model(Languages.JP, "ku-nlp/deberta-v2-large-japanese-char-wwm")
bert_models.load_tokenizer(Languages.JP, "ku-nlp/deberta-v2-large-japanese-char-wwm")
# bert_models.load_model(Languages.EN, "microsoft/deberta-v3-large")
# bert_models.load_tokenizer(Languages.EN, "microsoft/deberta-v3-large")
# bert_models.load_model(Languages.ZH, "hfl/chinese-roberta-wwm-ext-large")
# bert_models.load_tokenizer(Languages.ZH, "hfl/chinese-roberta-wwm-ext-large")

In [None]:
# Hugging Faceから試しにデフォルトモデルをダウンロードしてみて、それを音声合成に使ってみる
# model_assetsディレクトリにダウンロードされます

from pathlib import Path
from huggingface_hub import hf_hub_download


model_file = "jvnv-F1-jp/jvnv-F1-jp_e160_s14000.safetensors"
config_file = "jvnv-F1-jp/config.json"
style_file = "jvnv-F1-jp/style_vectors.npy"

for file in [model_file, config_file, style_file]:
 print(file)
 hf_hub_download(
 "litagin/style_bert_vits2_jvnv",
 file,
 local_dir="model_assets"
 )

In [None]:
# 上でダウンロードしたモデルファイルを指定して音声合成のテスト

from style_bert_vits2.tts_model import TTSModel

assets_root = Path("model_assets")

model = TTSModel(
 model_path=assets_root / model_file,
 config_path=assets_root / config_file,
 style_vec_path=assets_root / style_file,
 device="cpu"
)

In [None]:
from IPython.display import Audio, display

sr, audio = model.infer(text="こんにちは")
display(Audio(audio, rate=sr))