【Cyberagent日本語版】DeepSeek-R1-Japanese-14Bを使ってみた話④【ローカルLLM】

Catapp-Art3D

2025年1月28日 13:06

はじめに

huggingfaceのCyberagentページにDeepSeek-r1の日本語チューニングモデルが公開されています。早速利用してみました。14B版を利用します。

※ 動作確認は (ollama) OpenWebUIを利用します。

GGUFフォーマットに変換

軽量化されていないhuggingfaceフォーマットのままなので、ollamaで利用するにはggufフォーマットに変換する必要があります。

しばらくすれば有志の方がggufフォーマット版を公開すると思われますが、自分で量子化＋ggufする場合は、以下の手順を利用します。

（推論等いろいろできるユーティリティです）gguf変換にllama.cppを利用します。

llama.cppのコマンド群をビルドした後に、以下のコマンドを利用します。

# CyberAgent huggingfaceのデータを取得
git clone https://huggingface.co/cyberagent/DeepSeek-R1-Distill-Qwen-14B-Japanese

# bf16のggufフォーマットに変換
python convert_hf_to_gguf.py --outfile DeepSeek-R1-Distill-Qwen-14B-Japanese-bf16.gguf --outtype bf16 ./DeepSeek-R1-Distill-Qwen-14B-Japanese/

# Q4_K_M量子化
./build/bin/llama-quantize DeepSeek-R1-Distill-Qwen-14B-Japanese-bf16.gguf DeepSeek-R1-Distill-Qwen-14B-Japanese-Q4_K_M.gguf Q4_K_M

問題なく終了すれば、「DeepSeek-R1-Distill-Qwen-14B-Japanese-Q4_K_M.gguf」が作成されます。

※ 作業にディスク容量を70GB程度利用します。GPUは必要ありません。

※ llama.cppのビルドを含めた詳細（LinuxもしくはWSL2）は下記事です。少し古くなっていたので、修正しました。

Ollamaモデルファイルの作成

ollamaで配布されている「deepseek-r1:14b」のモデルファイルをテンプレートとして利用します。

ollama show deepseek-r1:14b --modelfile > deepseek-r1-ja-14b.modelfile

「deepseek-r1-ja-14b.modelfile」内の「FROM」指定を「DeepSeek-R1-Distill-Qwen-14B-Japanese-Q4_K_M.gguf」に変更します。

ollama create コマンドでollamaで利用可能なモデルにします。

ollama create deepseek-r1-ja-14b -f deepseek-r1-ja-14b.modelfile

動作確認

次の問題を解かせます。

問題: 教室には5人の生徒（A, B, C, D, E）がいます。以下の情報に基づいて、それぞれの生徒の席順を決めてください。

AはCの隣に座っています。 BはEの右隣に座っています。 DはAとBの間に座っています。質問: 各生徒の正しい席順を答えてください。

答えは（たぶん）：E B D A C by 非人工知能を持つ筆者

解答は非人工知能である筆者のものと異なりますが、ちゃんと条件を満たすので、合っていると思われます。

中国ポリコレを扱えるか

天安門事件に関して経緯と詳細を解説して

質問 by 筆者

オリジナルは門前払いでしたが、日本語チューニングでかなり弱まっているようです。

まとめ

なにかと批判されがちな中国LLMですが、漢字文化が似通っている事もあり、Qwen系は英語LLMに比べると日本語に強いです。

※ ただしデメリットもあり、似ているがゆえに見分けにくい簡体字（中国語）を混ぜてしまうのですが。

日本語チューニングが行われたものは尚更日本語に強くなりますね。

確かにローカルで利用できるので、情報漏えいや政治的な問題を避けられるかもしれませんが、Deepseek-r1の性能はかなり良いので、日本市場が中国製LLMに圧倒されてしまうかもしれません。

以下、関連する記事の【PR】です。

いいなと思ったら応援しよう！

ブログ

153本

ログインまたは会員登録するとコメントできます。

【Cyberagent日本語版】DeepSeek-R1-Japanese-14Bを使ってみた話④【ローカルLLM】

はじめに

GGUFフォーマットに変換

Ollamaモデルファイルの作成

動作確認

中国ポリコレを扱えるか

まとめ

いいなと思ったら応援しよう！

ピックアップされています

ブログ

コメント

DeepSeek R1 日本語追加学習モデル

サイバーエージェントが日本語データで追加学習をした日本語版「DeepSeek-R1」を公開！【追記：量子化モデルがアップされた模様】

【メモリ消費量一覧付き】OllamaでDeepSeek R-1を動かすよ！

DeepSeek-R1ローカルモデル性能評価

DeepSeek-R1をざっくり理解する

日本でのブレイクスルー DeepSeek-R1

お金がなくても最新AIを使える！広告・学習・開発で劇的成果を引き出す「DeepSeek」徹底ガイド【AIのお悩み相談ラボ #63】

WSL2でDeepSeek-R1-Distill-Qwen-32B-Japaneseをllama.cppで試してみる

Cline＋ローカル版DeepSeek R1でAIコーディングを使い放題にする（高スペックマシン向け）

DeepSeek R1 Distill LLMsをローカルで使用する方法！

忘備録 AI（DeepSeek-V3）の主な特徴の出力イメージね。早い

OpenAI o1に匹敵するAIが無料！DeepSeek R1の衝撃と、見過ごせない中国リスク

Deepseekに関する考察 - AIアシスタントの新たな可能性

ついにGPT-4o並みのモデルとエロチャットできる時代に【DeepSeek V3】

DeepSeek V3: オープンソースLLMの最高峰

生成AIツール中国発のDeepSeekをわかりやすく解説！

DeepSeek Coder 技術ドキュメント

OpenAIの性能を上回る?!話題のDeepSeekの使い方（Web版/アプリ版）

DeepSeek-R1 の概要

（メモ）DeepSeek R1の概要を公式の記事からまとめておく

話題沸騰！中国発の新AI「DeepSeek R1」

[DeepSeekR1使用]自分のローカルPC上でChatGPT-4oと同等のAIを無料で使用する方法

DeepL翻訳ツールの完全ガイド: AI翻訳の最前線

中国発のAI、DeepSeekを試す

DeepSeek-R1とは

ローカルLLMを設定してみた

【無料でChatGPT o1超え!?】中国発のAI「DeepSeek」が推論・検索・ファイル解析と何でも無料でできて半端ない件。《使い方、活用事例７選を徹底解説。》

DeepSeek R1 32BをPCで回してみた。

レディープシークR1を探求する：強化学習と推論の新たなフロンティア

【画像付き】CursorにDeepSeekのモデルを導入して節約する手順書

中国発の大言語モデル、DeepSeekが医学論文の検索スタイルを変革する！？

DeepSeek R1の推論を使って他のLLMの性能を超絶アップ魔改造！？

DeepSeek-V3の性能をChatGPT、Claude、Geminiと比較してみた

Deepseek v3完全ガイド: 無料で使える次世代ブラウザ操作AIエージェント

【AI基礎論】DeepSeek R1（その２）

用語集: 「DeepSeek」 ＜－ この会社のおかげで2025年1月27日のNYSEは ３％以上の大暴落

DeepSeek R1　日本語追加学習モデル

日本でのブレイクスルー　DeepSeek-R1

忘備録　AI（DeepSeek-V3）の主な特徴の出力イメージね。早い

用語集:　「DeepSeek」　＜－　この会社のおかげで2025年1月27日のNYSEは　３％以上の大暴落