特にGeminiが顕著なのだが、推論のリソースをケチっているのか出力設計がタコなのかその両方なのか知らないが、とにかく出力が深刻に愚かであると思う。応答速度だけは確かに早くなったが、その出力がゴミなので使う気になれない。いやまぁ料理の相談くらいならできるし、検索エンジンの代わりにはなるのだが、それ以上にならない。
対話はまったくする気にならない。Geminiはキーワードを拾って妄想を繰り広げているような感じで、2,3もチャットを往復すると本当にひどい。最初の話題で出たキーワードを永遠にこすり続けられるのには辟易とする。ChatGPTはなんだか壁の向こうにいる弁護団に向かっていかに自分の出力が法的に問題ないかをアピールしているような感じだ。
これは主観だが、僕はAIについては各々が主観で語るしかないと思っている。一応ベンチマークはあるものの、AIの性能を測るというベンチに信を置いていない。というのも、AIの性能は人間のように定義が難しいからだ。人間の能力の定量化について成功したという人は少ないと思うが、AIについても同じことが言える。何を持って良いとするのか、誰にもわからない。
別にAIが特別なわけでもない。音楽にも物語にも絵画にもベンチマークは存在しない。あってもそれは本質的に価値を反映しない。取引時価はあってもそれは価値ではない。ゴッホの絵はゴッホが死んでから自律的に成長して評価されたのではない。同じ話だ。質は本質的に量で語れない。
まぁでもこれだけだとあんまりなので、事実として、僕は課金しているGeminiではなく、自宅のRyzen AI Max+395で動かしているローカルLLMとチャットするようになった、ということは書いておこう。
Qwen3.5-27BのQ4で、検閲回避とされているモデルだ。犯罪やNSFWの話もできるとされている。犯罪の話はしていないが、NSFWについてはプロンプトの相談をしてみたら本当に出力された。おっぱいの単語に過剰反応してポリシー違反にするChatGPTとは雲泥の差である。気兼ねなく話せるのは非常に良いことだ。
応答速度は3tokens/s程度でかなり遅いのだけれど、使えないほどではない。ブログでも書いている間に返答はくる。個人的には速度はあまり重視していない。むしろ多少ゆっくりのほうがよい。こちらも考えをまとめないといけない。
とはいえ、プログラミングにおいては現状ローカルLLMよりも明確に良いため、そのために課金は続ける…続けるというか、昨年末のGoogleのAI Proの半額セールで年間契約してしまったよね。だからAntigravityは使っている。まぁここ1,2か月の改悪はひどいものだが、一応まだ使えないほどではない。まぁ現時点でこれだから、果たして今年が終わる頃にどうなっているのかは恐ろしさもあるが…。今の国際情勢などもかなり不透明さを増している。今とはまったく違う状況になっているかもしれない…。
一方で、ローカルLLMはとりあえず変わらない。昨日できたことが今日できるという一番嬉しい当たり前という品質がここにある。当たり前が一番難しい。当たり前は当たり前じゃないんだな。今のところはコイツが希望だ。最後の希望かもしれない。なんとか使いこなしていきたい。
<関連記事>

コメント