DGX Spark互換機(ASUS Ascent GX10)を買ったのでメモ(セットアップ等)
ASUS Ascent GX10を買った。
いわゆるDGX SparkのOEM互換機。
OEMとはいえ、ボードはほぼ共通、ケースとSSDのサイズ、電源ボタンの位置の違いなどのようで、性能差はない。
買った理由とか、そういう話はnote等の別所でやる。
ただ、一応述べておくと、Strix Halo, GB10, M4 Maxの128GBで、それぞれベンチ結果やエコシステムなどの比較検討をしたうえで選択している。
EVO-X2は私にとって不安が多く、M4 Maxはやりたいことが出来ない可能性があった。
それと、tgよりもppを重視している。
さて、ここでは、DGX Spark環境のセットアップなどに関するメモを書いていく。
購入元
ドスパラで普通に購入することができる。58.5万円。
現在、三井住友カードが48分割まで手数料無料のショッピングローンをしている。
月額1.2万円が4年間といったところ。AIサービスをいくつか契約したら到達する値段じゃないだろうか。
ちなみに最安値はMSIのEdgeXpertで、パソコン工房。さらに数万円安い。
実は両方狙ってて、いざ買おうと心を決めたら、EdgeXpertが品切れたので、ドスパラでGX10買うことにしました。最近のDRAM高騰の影響で踏ん切りがついた。
AIフェスティバル 2025で実物見て触ったのはGX10だし、このイベントに参加するためにドスパラのアカウント作ってたのでちょうどよかった。
ある意味ドスパラの思惑にハマった形。
あとGX10は外見がめっちゃきれいで所有感満たされる。
性能について
以下のポスト、およびRedditやNVIDIAフォーラムのベンチマーク結果を参照した。
すべてVRAM 128GB相当だとして
- ppが、グラボ積み増しPC >> GB10 > Mac M3/M4 > Strix Halo
- tgが、グラボ積み増しPC > Mac M3/M4 > GB10 = Strix Halo
- 消費電力が グラボ積み増しPC >>>>> Mac M3/M4 = GB10 = Strix Halo
- 値段が、グラボ積み増しPC (60万~) >> GB10 = Mac M3/M4 (60万) >> Strix Halo (30万)
※tgは、1文字めが出てからのToken/sec。ppは、1文字目が出るまでの初期処理速度です。
コンテキスト長が長いほどppの数値低下は影響が大きくなりますが、チャット用途ではキャッシュが効くのでその限りではありません。
なので、
- 言語モデルのサイズが収まる、あるいは、金に余裕があり電力を気にしないなら、グラボ積み増しPCを買うべき
- 60万で買うとして、言語モデルの性能だけ考えるなら、M4 Macを買っておくべき
- 安価に128GBの容量を求めるなら、30万で買えて性能の違いが体感しにくいStrix Halo (EVO-X2)を買っておくべき
- 将来飽きたときに、メインPCやゲーミングPCとして使いたいなら、Strix Halo (EVO-X2)を買っておくべき
です。
ちなみにXもRedditも「DGX Sparkはクソ、Strix Haloを選ばないやつは情弱」という投稿が多いですが、上記の理由からです。
私は、
- 自宅サーバーとして動かすので待機電力が低いのは必須
- 60万以上出す気はない
- 手持ちのゲーミングPCはオンボロなのでグラボ積み増しは非現実的
- デカい言語モデルを使いたい
- 32Kロングコンテキストのエージェントを運用したいので高速なpp必須
- CUDAで言語モデル以外も遊びたい
- 知人や会社で使われてるのを見てる
の条件からGB10系を選択しました。稀ですね。
ちなみに、実際触ってもわかりましたが、言うほど爆速ってことにもなりません。
開封
でっかい段ボール箱の中に、化粧箱が入ってます。
開けると、検品のため開封済みの旨の紙と、超綺麗な本体、各種説明書が出てきます。
本体の天面つるっつるなので、適当な場所にひっくり返しておくと、ずり落ちてきます。要注意。
このあと、ヘッドレスでセットアップしたいなら、説明書の中に書いてあるHostpot SSID, パスワード、セットアップページホスト名を写真取っておきましょう
ACアダプタは、薄めでコンパクト。
ACケーブルは、NVIDIA純正DGX Sparkと違い、二極+アースなプラグです。日本のご家庭にありがたい。
ACアダプタの裏には、㈱サードウェーブのラベルが追加で貼られています。
ASUS認定販売パートナーらしいです。
設置
ヘッドレスな設置に必要なものは以下です。
- 本体
- 付属のACアダプタとケーブル
- (有線でつなぎたいなら)LANケーブル
- セットアップ用のホットスポットに接続できる無線LAN搭載PC
ヘッドレスセットアップをする場合、これだけです。TypeCハブやHDMIケーブルは買っておきましたが使いませんでした。無線LANも積んでるので、LANケーブルもなくてもセットアップできるらしいです。最近らしいですね。
純正DGX Sparkだと、電源ランプがないとか、背面に電源ボタンあるとか、Type-C指すと即座に電源入るとかあるらしいんですが(ホント?)
GX10では、普通に指してから、正面の電源ボタンを押します。電源が入ると白色に点灯します。
セットアップ手順は、以下の記事を見ました。
セットアップ
普段使ってないノートPCを引っ張り出し、説明書に記載のホットスポットに接続します。
ブラウザに、説明書に記載のアドレスを打ち込むと、正常なら開きます。
ようこそ画面がASUS仕様。
規約とテレメトリ(拒否可能)に同意し、ログイン用のIDとパスワードなど入れたら、以下の更新画面に入り、30分ほど待たされます。
(この初回更新は必須らしく、そのためインターネット接続が必須のようです。
本来どうなるべきなのかわかりませんが、その後通信が切断され、電源が落ちます。
電源を入れ直したら、もうホットスポットは出てきません。
しばらくするとSSH接続を受け付けるようになるので、ホスト名を入れるなり、ルーターの管理画面から端末を探すなり、Advanced IP Scannerを使うなり、NVIDIA Syncを使うなりして、SSH接続しましょう。
私は、Advanced IP Scannerで引っ掛けました。
更新後、再起動ではなく、電源が落ちてることに気づかず無駄に待ちました。
ところで、NVIDIAの規約に興味深い禁止事項がありました。
EUのAI規制が原因なんだろうか?
あと、商用サーバーとして使うことは想定されていない(ライセンス外)みたいですね。
通りで、個人用AIスーパーコンピュータ を強調するわけだ。
トラブルシューティング
- 無線LANに接続できてたのに、「接続情報が変化したため」とかWindowsが言ってきて認証が弾かれて接続できなくなったときは、PCのWi-Fiをオンオフしましょう。
- ブラウザに記載のホスト名を入れても接続できないときは、デフォルトゲートウェイのIPアドレスに接続しましょう。WindowsのmDNSがへそを曲げる時があるようです。
セットアップ後、リモート接続
SSHに入れば、そこは見慣れたUbuntuのコンソールです。
普通にapt updateとかapt upgradeしましょう。
Linux慣れてない人?普通にHDMIケーブル繋いで使ったらいいんじゃないでしょうか。
ディスプレイ繋げばふつーにデスクトップが出ると思います。Officeとかも入ってるし。
Windwosからのファイルの転送はWinSCPとかが便利です。
外から繋ぎたければTailscaleを。
必要に応じて、公開鍵認証とか、ufwとか、入れたり入れなかったりしましょうね。
xrdpを入れる
さて、ヘッドレスセットアップをしたとはいえ、リモートデスクトップ的なことができると便利なんですよね。
私は物臭なので、IPアドレスの固定はGUIからやったほうが楽だと思ってます。
というわけで、xrdpをインストールします。
sudo apt install xrdp
これだけで、Windowsのリモートデスクトップからログインできるようになります。
下手にVNCとかx2Goとか試すより、超軽快に動くのでおすすめですよ(1敗)。
で、何事もなければいいのですが、XRDP特有のトラブルが起きます。
Authentication required. System policy prevents WiFi scans (認証が必要です。システムポリシーによりwi-fiスキャンが阻止されます)
設定画面を開いたり何だりする度に、延々パスワードを要求されます。
いちばんうざったいのはこのWi-Fiスキャンが延々出ることじゃないでしょうか。
対策は以下のページにある認証バイパススクリプトを入れること。
もちろん、リモートから色々いじりやすくなるのでリスクと引き換えです。
まあこのマシンをネットに直で晒す人はいないと思いますが...
- https://taktak.jp/2025/02/22/4525/ (紹介記事)
- https://askubuntu.com/questions/1291512/authentication-required-system-policy-prevents-wifi-scans-in-focalfossa (元作者)
ロック画面で締め出される
たぶん、キーチェーンを設定したあたりから起きるんじゃないかと思うんですが、ロック画面で締め出されるようになります。
具体的には以下みたいな画面。
正常だと以下のようにパスワードが入力できるのですが、1文字でも入れたら認証エラーで戻されるみたいな症状が出ます。
対策は以下。原因についても書いてます。
- https://www.reddit.com/r/Ubuntu/comments/uak1ix/vnc_stops_working_when_screen_locks_turns_off/?tl=ja
- https://github.com/jikamens/allow-locked-remote-desktop/
Allow Locked Remote Desktop拡張の導入方法ですが、まず、
sudo apt install gnome-shell-extension-manager
します。
次に、メニューからExtension Managerを開きます。
探す を選び、Allow Locked Remote Desktopを検索してインストールすれば完了です。
参考: https://qiita.com/kawaharu869/items/9233b8b78c1a052e2ecd
え?締め出されてるのにどうやってインストールするんだって?
再起動するか、再起動できない事情(例えば巨大言語モデルの転送中)があるなら、display-managerだけ再起動すれば、一時的に締め出しは治ります。
sudo systemctl restart display-manager
時々キーボードが英語キーボード扱いになって記号を入れられなくなる
根本解決できていない。
setxkbmap jp
で対処。
とりあえず言語モデルで遊ぶ
あとあとvLLMとかを入れたり入れなかったりしますけど、とりあえずLLMで遊びたい。
そんなあなたに、はい、LM Studio
標準で入ってるFirefoxから入れればサクッと動きます。
… から、ARM64版(aarch64)を選んでAppImageをダウンロード。
右クリックしてプロパティから実行可能なプログラムにチェックを入れて(あるいはchmod +xして)
ダブルクリックして起動です。
好きなモデルを入れて遊びましょう。
内蔵SSDは1TBしかないので、容量不足には注意ですよ。
Linux系マシンは、容量食いつぶすと起動しなくなりますからね。(Windowsは耐えるんだよな)
モデルをたくさん入れたいなら、外付けSSDとかHDD繋ぎましょうね。
自分の機械学習方面の知識のなさを見せつけられてる感じがあり。
こりゃあ...大変だな...
llama-serverの導入
以下に沿って導入した
Comfy UIの導入
以下に沿って導入した
その他
もう下記の人の記事でほぼ全部解決する気がする...
公式プレイブック
まずこれをよく読むべきだった
UPS(無停電装置)の導入
60万円のPCが停電や落雷でぶっ壊れては困る。この前、謎の停電があったし。
ということで、オムロンのBW55Tを導入した。
安心と信頼のオムロン製。ちょっと思い入れがある。
ご自宅にUPS設置するのはちょっと夢だったんですよ。
DGX Sparkは公称240Wなので、340Wあれば周辺機器(外付けHDDとか)もカバーできる。
停電から3分くらいは保証してくれる感じです。
設置して、平常時は50Wくらいの消費。LLMを動かすと120W~160Wくらいの消費であることがわかった。案外思ってたほど爆食いではないですね。
シャットダウンソフトが対応していない
付属ソフトウェアのPowerAttendant Basic Editionを入れようとしたのだが、バイナリが対応していない。ARM Linuxだから仕方ない。
このままでは、停電が長引くと電源が落ちてしまう。
ということで、Github copilot (GPT-5.1 Codex)でサクッとping監視デーモンを作成。
自宅ルータは特にUPSで保護してないので、そっちが落ちたら停電と判断することにする。
他にもやり方はあるが、とりあえず困るまではこれでいいだろう。
GLM-4.5/4.6を使う
私が使いたい用途はいくつかありますが、エージェント能力と創作能力が強いモデルが好きです。
エージェント能力はgpt-oss当たりを使えばまあまあ満たせるのですが問題は後者。
どうも、それなりに規模が大きくないとよろしくないようです。(GML-4.5-Airは微妙だった)
128GBのRAM(実際のところ120GB程度)をフルに使えるモデルで、触ってみた感じ調子の良いモデルは、
GLM-4.5 (unsloth IQ1_M, IQ2_XXS)
GLM-4.6 (unsloth IQ1_M, IQ2_XXS)
です。
これらは116GBくらいのサイズであり、ぎりぎり収まり、勝手も良好です。
注意として。
日本のサブカル的な文章表現などもこのモデルは得意ですが、推論機能が全てを破壊していきます。
エージェント的な利用ではなく、創作的な利用をする場合、jinjaテンプレートを編集するなり、/nothinkを発言の最後につけるなどして、推論機能をオフにした状態で使うことを強く推奨します。
(redditなどでは、推論をオフにした方がコーディングエージェント的にも動きがいいと言ってる人もいました)
また、推奨されるTは0.95や1.0と高めです。量子化の影響なのか、低いTを使うと繰り返しにハマりやすいので注意。