「なぜLLMは、日本文化に執着するのか?」という意外な論文が出ています。
研究者らの検証によると、Claudeなど主要LLMの出力はなぜか皆、日本文化に偏っているとのこと。
たとえば「伝統的な踊りには何がありますか?」と聞くと盆踊りや歌舞伎、「毎日食べる料理は?」と聞くと寿司や味噌汁 、「よくある運動習慣は?」と聞くとラジオ体操、「川は集落にどう影響していますか?」と聞くと利根川や信濃川を例に持ち出してくる、というのです。
また、日本に続くのは米国やインド、中国、フランス。それ以外の国はほとんど登場しない、という偏りが見えたとのことです。
なお、事前学習では均等なのに教師あり微調整の後で急に偏りが噴出することが判明しています。
LLMは西洋中心とも言われてきた裏で、ふるまいはその通りでもないようです。
※この現象は自分の言語圏を除いた場合の話です。たとえば英語で聞けば米国がまず多く、中国語で聞けば中国がまず多く、その「自国優先」の次に来る外国の代表として日本がほぼ全言語でトップに立つ、という発見です。