Aratako@Aratako_LMハーメルンという小説投稿サイト(https://syosetu.org)から収集した192万4940件、102億4893万3456文字の小説データセットを作成し、公開しました。 学習に利用しやすいように様々なメタ情報を付与しています。 LLMの事前学習など機械学習向けにご利用ください。Aratako/Hameln-Japanese-Novels-1.9m · Datasets at Hugging Facehuggingface.coから午後5:35 · 2024年4月24日·2.8万 件の表示40 リポスト18 件の引用109 件のいいね103 ブックマーク103