--- license: apache-2.0 language: - ja datasets: - cc100 --- これはひらがなに変換して逆向きに並べ替えたデータセットで事前学習した言語モデルです。 ひらがなを文字単位でトークンに分割しているため、回文や川柳のような音の数を重視するタスクに適しています。 This is a language model pre-trained on a dataset converted into Japaneses-Hiragana and reversed. Since it tokenizes Hiragana at the character level, it is suitable for tasks that emphasize the number of sounds, such as palindromes or senryu (a form of Japanese poetry).