ムシャクシャしてポチった。今庶民がギリギリできるローカルLLMの限界を自分の手で試したかった。
欲しくなってしまった
この記事を読んでいたらとてもほしくなったよね。
【西川和久の不定期コラム】Ryzen AI MaxのLLMとAI画像生成の性能は?OCuLinkでどちらも快適に♪「GMKtec EVO-X2」(後編) - PC Watch
Stable Diffusionでお絵かきしたい場合、そのうちにLoRAとかもやりたくなるだろうし、高くてもNVIDIAのグラボで頑張ることになるのではないか。しかしLLMの場合、学習が闇かつ大規模パラメータに勝るものなしという実情がある。すると、学習はともかく推論さえできればいいということで、比較的安価なAMDも選択肢に入る。
とはいえグラボは高いし電気もすごいしこれに見合う基盤PCはそもそも高い。家も狭い。とても手が出ない。そこへ颯爽と登場した俺たちのRyzen AI Max+ 395が当面の覇権なのはそうだろう。大容量VRAMの高級グラボなんてイーロン・マスクにしか買えないという現実の中で、バス幅のあるユニファイドメモリにオフロードすることにより、120BとかそれなりのパラメータのLLMを動かせる。現状庶民ができるのはこれが精一杯だと思う。
30万円の中華なミニPCはかなり勇気のいるところではあるが、待っていてもこれ以上安くなると思えないし、なんならインフレと通貨安で高くなる可能性すらある。128GB RAMだとせいぜい120Bまでが限界だろうが、256GB RAMとか512GB RAMは現状しんどそうだ。まぁ金に糸目を付けなければ現状Mac Studio 512GB RAMなるものもあるが……。

150万円はいや、さすがに。震える。512GBだと671Bのやつも乗るんだろうね。
これを見た後にGMKtexのEVO-X2の30万円を見ると圧倒的に安く感じられる(錯覚)。
安いのでポチった(錯乱)。
正確には5%クーポンがあったので公式サイトからポチった。注文から10日くらいで届いたかな。
みんな大好きgpt-oss-120bをのせる
とりあえず1日かけて一通りセットアップした。VRAMの割り当てが初期設定だと64GBになっているのだが、BIOSで設定変更することで96GBになる。BIOSはESCキーで入って、それっぽいところから「UMA Frame Buffer Size」なるものを探して設定すればよし。AMDのソフトウェアでも設定変更できる……ことになっているが、実際にやってみたら永遠に設定反映されなかった。AMDェ……。
まぁ色々と苦労しつつ、例によってLM Studioでダウンロードして早速ロードする。コンテクスト長は16384。32768にしたらロードできんかった。

これで読み込んで実行。

35トークン/秒はなかなかでは。チャットとしても全然耐えられる。コンテクストも16384ならそれなりには話せそう。M2 Pro Mac mini(32GB RAM)だとDeepSeekの32Bでも死にそうになりながら数トークン/sだったことを思うと、かなり大きい。そういえばこのMac miniもたしか23万円くらいしたかな……。
Difyとも連携させる
LM Studioだとどこまでもチャットなので、セルフホストのDIfyとも連携する。これもDifyのマーケットプレイスにLM Studioがあるが使えないという罠にはまりつつ、OpenAI API Compatibleとして導入すると利用することができた。

やり方は「LM Studioを使ったgpt-oss-20bとDifyの連携方法【Mac】」の記事が参考になりました。
まぁAPI使うだけならDifyを使う必要もないのだけれど、色々なモデルを比較するにはやっぱりGUIでサクッとできたほうがよいので。ちなみにこのDifyは2年前にM2 Pro Mac miniを購入して前線を退いたIntel Mac mini 2018のコンテナ上で動いております。
なおollamaは……
ちょっと注意なのは、Ryzen AI Max+ 395でLLMを利用する場合、CUDAのパチモンことROCmではなくVulkan経由でやることになる。みんなの味方ollamaは、Vulkan対応まだ微妙なので、LM Studioを使っているのだね。それでこんな回りくどい構成に。
ポチった以上はやるしかない
ということで、2年ぶりとなる大型の買い物に震えつつポチりました。買ってしまった以上はやるしかないのである。ローカルLLMによる成果については、今後もボチボチ記事にしていきたい。30万円分は遊ばないと……。
(追記:似たようなのが出ていた。 Bosgame M5 AI Mini Desktop Ryzen AI Max+ 395 96GB/128GB+2TB GMKtecよりすこーし安い?高いけど)
<関連記事>




コメント