Aratako@Aratako_LMハーメルンという小説投稿サイト(https://syosetu.org)から収集した192万4940件、102億4893万3456文字の小説データセットを作成し、公開しました。 学習に利用しやすいように様々なメタ情報を付与しています。 LLMの事前学習など機械学習向けにご利用ください。Aratako/Hameln-Japanese-Novels-1.9m · Datasets at Hugging Facehuggingface.coから午後5:35 · 2024年4月24日·9,233 件の表示17 リポスト8 件の引用77 件のいいね65 ブックマーク65