ソフトウェアエンジニア。起業家。SF作家。34歳・妻と二人暮らし。 開成→東大工学部/松尾研→外資コンサルBCG→スタートアップを2社起業→SF作家/著サーキット・スイッチャー他 安野たかひろ事務所公式X→@annotakahiro24 (連絡はtakahiroanno2024あっとgmailまで)
【DeepSeekの利用は危険か】 LV.1 あんまり詳しくない人向けの答え: 利用規約的に入力したデータが裏でどう使われるかわからないので入力内容には注意してね。ぶっちゃけ精度はChat GPTのo1とそんな変わらないからそっち使った方が無難だと思うよ。出力にも政治的なバイアスがあると言われているよ。 LV.2 ちょっと詳しい人向けの答え: Azure経由で使えばDeepSeek本体とは利用規約が違うからマシになるよ。マイクロソフトを既に信じてデータ預けてるならリスク量はそこまで変わらないんじゃないか。あとオープンウェイトだからセルフホスティングできる(自分のマシンで完結できる)し、そうすればデータが抜かれることは無いから安心して使えるよ。 出力の政治的なバイアスはファインチューニングによって塗り替えられるっぽいから、deepseek派生モデルだからといって出力のバイアスが必ず残るわけではないよ。例えばサイバーエージェントがR1を元にファインチューニングしたモデルは普通に天安門事件の質問にも答えてくれるよ LV.3 けっこう詳しい人向けの答え: とはいえセルフホスティングだから大丈夫なのかというと必ずしもそうとは言えないよ。 AIの振る舞いをうまくトレーニングすれば特定条件下でバックドアのあるソースコードを出力したり、MCP連携などAgenticなユースケースで攻撃的な挙動をさせることができるかもしれないよ。まあR1レベルであれば問題にはなりにくいかもしれないけど、今後よりモデルが賢く複雑になり、ユースケースの自律性が高まる場合にはセルフホスティング安全論は終わる可能性あると思うよ。オープンウェイトモデルの振る舞い安全性確認のための研究や、ユーザー側がエージェントの挙動を監視するやり方がもっと成熟するといいね LV.4 前線で戦ってる人向けの答え モデルの安全性確認とかいってもゼロリスクを保証することは不可能だよね。しかもそれを待っていたらビジネス的にも技術開発競争的にも遅れてしまうよね。結局、適切なリスクの取り方をするのが大事であり、どこまでリスクをとるべきかはあなたの会社or個人の置かれた状況と、どこまでのリターンを目指すかによるけど、本気で勝ちにいくならそれなりのリスクは取らないとたぶん無理だよね ここ数日いろんな人やメディアから聞かれているのですが、相手によって答えがころころ変わるので面白いなとおもっています
2025-02-02 12:45:25みんなの反応
@takahiroanno なるほど、Lv1でした 業界人じゃない人はほぼAzure触らないでしょう このハードルが高かったw
2025-02-02 13:03:46流石、安野さんです。解りやすい。 追加するとしたら、以下の追加があると思います。 LV3からLV4へ追加する項目 1)マイクロソフトの契約書の免責事項の確認が必要 DeepSeekの安全性やコンプライアンスに関する問題は保証の対象外 である可能性が高い。 Azure上でホストしていても、マイクロソフトが100%保証するわけではない。 何か問題が発生しても、マイクロソフトがすべての責任を負うとは限らないため、事前に契約書の免責事項を確認する必要がある。 2)OSSだからといって安心できるわけではない オープンソース(OSS)だからといって、セキュリティが保証されるわけではない。 コードの脆弱性、セキュリティホール、バックドアなどのリスクが存在する可能性がある。 そのため、利用者自身がコードの安全性や脆弱性を確認する必要がある。 脆弱性に関するパッチが定期的に配布される保証はない。 必要なメンテナンスやアップデートは、利用者が自ら対応しなければならない。 現時点では、サポートするコミュニティが存在しない。 そのため、問題が発生しても、すぐに解決できる体制が整っていない点に注意が必要。
2025-02-02 14:50:47@takahiroanno 素晴らしい解説ありがとうございます。 出来れば、DeepSeekのNvidiaチップをはじめとしたAI関連HW環境への影響について解説もお願いします。
2025-02-02 14:11:38@takahiroanno なるほどわからん。盗まれて困るデータはないけど、とりあえずヤバそうなので大人しくチャットGPT使います。
2025-02-02 13:18:02こういう内容をちゃんと書いてくれるの、本当にありがたい。
AI情報を発信してる人たち、いろんなAIを駆使してるはずなのに、バズ狙いなのか偏った情報を流したり、ちょっと指摘されると激怒したりしてて、なんか面倒くさそうだなと思って静観してました
でも結局、どれだけAIを使いこなしても、人間のアイデンティティってそう簡単には変わらないのかもなぁ、なんて思ったりしていました。
@takahiroanno セルフホスティングの危険性は閉じたネットワークで運用ですかね?特定の誘導的挙動や、ソーシャルハッキング的な手法を仕込まれるリスクまで考え始めるとキリがないですけど
2025-02-02 14:26:16@takahiroanno 僕ちんはChatGPT o3-mini-highで不便してないんだけどね。 DeeepSeekも、日本語、日本文化、日本人の歴史認識を反映させてファインチューニングさせたローカルモデルが出たら、使ってあげても良くってよ。
2025-02-02 14:40:19DeepSeekの利用に関する議論は興味深いですね!確かに、利用規約に基づいてデータがどのように扱われるかを理解することは大切です。でも、Azure経由で利用する場合、Microsoftの信頼性を考えるとリスクはそれほど高くないと思います。また、DeepSeekがオープンソースである点も魅力的。セルフホスティングが可能なので、データ漏洩の心配を最小限に抑えられます。 さらに、出力のバイアスについても、ファインチューニング次第で調整可能とのこと。例えば特定のテーマでモデルを最適化することで、より正確で目的に合った回答を得られるのは大きな利点です。AIツールを賢く使うことで、新しい可能性が広がりますね。
2025-02-02 12:48:11
怪しい奴が怪しいツールにする話がどうして怪しくないと言えるだろうか
よくわからんが、オープンチャットだけにしとけというのだけは分かった。