見出し画像

DeepSeekは使用してはいけないのか?その危険性について。

 株式市場に大きな影響を与え、DeepSeekショックとも言われる半導体関連株を中心とした大幅な下落をもたらしたDeepSeekR1。株式市場だけでなく、トランプ大統領や日本の政治家まで反応し、Youtubeでは解説動画が溢れているわけですが、おそらく半年前に、日本で最初に中国製LLMの危険性を指摘した者として、DeepSeekR1が本当に危険なのかどうか解説しようと思います。


 まず、LLM使用の危険性には二種類の危険性があると言えます。

1:情報窃取の危険性。

 正確には入力してはいけない情報を迂闊に入力する人がいて、そこが問題なのですが、それすら理解できてない人は多いです。
 これは中国製だろうが西側製だろうが全ての外部サーバーを利用してのLLM利用で生じる問題です。
 これを回避するには、自社でサーバーを用意するか、信頼できる会社と契約した上で利用するかのどちらかになります。

2:思想誘導の危険性。

 これは中国製のLLMは日本の政府見解と違うこと言っていてケシカランみたいなしょうもない話です。西側のLLMでも南京事件について聞けば、右翼にとっては気に食わない回答が返ってくるはずです。また、西側のLLMもセンシティブな話題は責任回避のために回答を行わない傾向があります。中国製LLMはそのセンシティブの方向性が異なるということになります。
これを回避するには、日本のデータセットで強化学習を行うなり、フルスクラッチで0からLLMを作る必要があるわけですが、日本でもいくつかLLMは作成されていますが、競争力のあるものは残念ながら存在しません。

 確かにDeepSeek本家のアプリやAPI、webサイトの使用は危険です。ただし、これは無料で使う場合はOpenAIのChatGPTやGoogleのGeminiにも言えることで、入力した内容が学習されることは規約に書かれており、個人情報や営業機密に当たるようなことを入力してはいけないというのは中国製だろうがアメリカ製だろうが変わりません。

 もちろん、ChatGPTをちゃんと契約した上で、入力内容と出力内容を監視せず学習にも使用しないという保証があるならば、MicrosoftのAzureなどで使用する分には基本的に問題ないと考えていいでしょう。ただし、多くの場合、コンテンツモデレートという形で出入力に関しての自動検閲が行われているはずであり、完全に安心できるものでないことは留意する必要があります。
 また、当然ながら政府機関が機密を扱うには不適切なのは言うまでもありません。事実として、アメリカの諜報機関は日本政府と企業にスパイ行為を行っています。

 トランプ大統領に手のひら返しですり寄った米国企業が、日本の機密を守ってくれるなどと考えるのは極めてナイーブな考えていっていいでしょう。
 また、我が国ではお粗末なことにLINE上で、グループチャットで政府関係者が業務連絡していたことなどもあったわけで、極めて憂慮すべきことです。

 さて、再度DeepSeekR1の危険性に戻ります。DeepSeek本家のアプリやAPI、webサイトの使用は危険だと言いましたが、逆に言うとDeepSeekR1はMITライセンスで公開されているため、独自サーバーで使用する分には情報窃取の危険性は有りません。むしろ、社内で運用するのであれば、外部に情報を預ける必要もないため、自社で外部からの攻撃から守れるという前提ですが、安全と言えます。
 とはいえ、DeepSeekR1は非常に大きなモデルであるため、生半可なシステムでは動かすことすら出来ません。ただし、MoE(Mixture of Experts)というアーキテクチャを採用しているため、稼働さえできれば軽量かつ素早い応答が期待できます。

 極めて残念なことに日本のサービスプロバイダでDeepSeekR1を提供している所は2025年2月1日時点ではないようですが、そのうち提供する所は現れるでしょうから、そういうところのAPIを利用したり、アメリカの会社ならOKというのであれば、MicrosoftがAzure上で提供しているので利用するのも有りでしょう。
 しばらくすれば、オンプレミスサーバーとして提供するところも現れるでしょうし、日本国内で強化学習を行ったものの提供も行われるでしょう(先日サイバーエージェント提供を発表したものは言ってみれば劣化版のDeepSeekR1であり、本来の性能を発揮できるものではないことには注意が必要です)。
 日本国内で完結できれば、デジタル赤字の削減にもつながるため、早期の提供を期待したいところです。

 また、オープンにモデルが公開されているとは言え、大本のモデルを中国や外国に握られているのは好ましい状況とは言えません。
 幸いなことにDeepSeekによって、半年から1年遅れであれば最先端に匹敵するモデルを極めて安価に作成することが可能だということが判明したのですから、日本版DeepSeekR1の誕生に期待したいところです。
 DeepSeekは論文である程度の作成手法を公開していますが、全てを公開しているわけでは有りません。その非公開部分を補完しようというプロジェクトが海外ではすでに始まっています。

 また、LLMは優秀ですがナレッジカットオフというものが存在し、一定時期以降の情報は学習されていません。
 お粗末な調査だと、それを理解しておらず、2024年12月のアゼルバイジャンでの航空機墜落事故について情報をDeepSeekR1は中国製なのでロシアにおもねって正しい回答をしないとか言っている愚かな人がいましたが、Search機能などのweb検索機能を使わないと、西側のLLMであってもナレッジカットオフ以降の事件には正しい回答は出来ません。

 DeepSeekR1であってもPerplexityというCEOはインド系のアメリカでサービスされている会社のものであれば以下のリンクのようにちゃんと回答できます。

https://www.perplexity.ai/search/aseruhaisiyanhang-kong-ji-nozh-ZY7nMKJgQIeEiUYqBVCHxg

 また、話題になった尖閣諸島については以下のように回答します。

https://www.perplexity.ai/search/jian-ge-zhu-dao-woling-you-sit-zleMqX9URZy0f360iP8zAA

 最初は両論併記で、日本人としては納得いかないところもありますが、最後に歴史的事実を突きつければ、中国製LLMであるにも関わらず「石油発見後の突然の主張変更は、中国・台湾の領有権主張の正当性を大きく損なう要素と評価できます。」とまで認めます。

結論


 すなわち、これまでのことから、結論は利用者側の正しい知識や、webによる補完があるのであれば特に恐れる必要もないということです。
 もちろん、DeepSeekR1を学校で教師代わりに使おう!なんていうのであれば、バカか?イカれてるのかと正気を疑いますが、まともな判断力と知識を持った人間が使うなら何ら問題は有りません。これは西側製LLMにも同じことが言えます。
 繰り返しになりますが日本は官民挙げて、日本版DeepSeekR1を作成するべきです。DeepSeekの主張する金額では作れなくても、数百億で作れるでしょう。

 さらに、検索部分も重要です。私はPerplexityYoucomを利用していますが、結局は海外のサービスであり、利用料はアメリカに流れるわけです。
また、そのモデレートも結局はアメリカの理念に支配されており、日本の見解と異なることは大いにしてあるわけです。

 是非、日本版Perplexityや日本版Youcomの誕生に期待したいところです。


いいなと思ったら応援しよう!

コメント

コメントするには、 ログイン または 会員登録 をお願いします。
DeepSeekは使用してはいけないのか?その危険性について。|ailora will
word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word word

mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1
mmMwWLliI0fiflO&1