DeepSeekの登場により、AIモデルの「蒸留」が注目を浴びています。
「蒸留」というのは簡単に言うと、あるAIモデル(教師モデル)の入力データと出力セータを利用して異なるAIモデル(生徒モデル)を学習させることで、教師モデルと同等の性能を持つ生徒モデルを作成することです。
「蒸留」という手法はモデルの軽量化などに用いられる一般的な技術ですが、今回は、DeepSeekがOpenAIのAIモデルを「蒸留」してDeepSeekを作ったのではないかという点が問題となっているのです。
OpenAIのAIモデルの利用規約では「アウトプットを使用して、OpenAIと競合するモデルを開発すること。」が禁止されています。
「蒸留」はもろにこの禁止事項に該当しますので、仮にDeepSeekがOpenAIのAIモデルを「蒸留」していたのであれば利用規約違反には該当するでしょう。
ただ、それを超えて著作権侵害責任を追及するのは非常に難しいと思われます(以下日本法を前提としますが、アメリカ法でも余り変わらないと思われます)。
というのは、著作権侵害が成立するためには「類似性」と「依拠性」が必要ですが、まず、そもそも教師モデルの中身(パラメータ)が著作権によっては保護されない可能性が高いです。
次に、「教師モデル」と蒸留によって作成された「生徒モデル」の中身(パラメータ)は全く異なるものですので「類似性」を満たしません。
さらに「蒸留」というのは、教師モデルの中身に直接アクセスする手法ではないため「依拠性」も満たさない可能性が高いと思われます。
AIモデルの蒸留と知的財産権侵害という論点のは、最近出てきた論点ではなく、私のブログでも2017年!に既に記事で書いております。
内容的には現時点でも当てはまりますので、リンクを貼り付けておきます~!!!
storialaw.jp/blog/2977
Read 29 replies