次の課金は完全にGeminiになるだろうと思う。あらゆるところでChatGPTの劣化を感じているのだけれど、ちょっとした質問レベルでも、ChatGPTはなんというか、常に煙に巻かれているように思われる。
そう思った一例。
質問:GDPデフレータとは
今回の質問はこれ。
GDP deflatorってのはなにを示すの?
極めてシンプルかつ、大したことを聞いていない。
ChatGPT 5.1 Thinking
Instantは阿呆すぎるので、最近は常にThinkingにしている。
その結果がこれ。長いけど全文引用する。ちゃんと読まなくても眺めればいいよ。
回答
GDPデフレーターは、**名目GDPと実質GDPの差から計算される「国内で生産されたモノ・サービス全体の価格水準」**を示す指標です。ざっくり言うと、
- 物価がどれくらい上がった/下がったか
- ただし対象は輸入品ではなく、国内で生産されたものだけ
- 消費・投資・政府支出・輸出など、GDPに含まれるもの全部をまとめた平均的な価格
を見ています。
どう計算する?
基本式はこれです:
- 名目GDP:その年の価格で測ったGDP
- 実質GDP:基準年の価格にそろえて測ったGDP
なので、名目と実質の差=価格変動の影響をまとめて拾うのがGDPデフレーターです。
CPI(消費者物価指数)との違い
よく混ざるのでここが重要。
GDPデフレーター
- 国内で生産されたものが対象
- 輸入品は基本的に入らない
- GDP全体の価格
CPI
- 家計が買うものが対象
- 輸入品も入る
- 消費に特化した物価
例:
- 原油など輸入価格が急騰すると、CPIは上がりやすい
- でもそれが輸入中心なら、GDPデフレーターへの影響は相対的に小さめになり得ます
何に役立つ?
- 実質成長率の理解
名目GDPが伸びても、物価上昇分を除くと実質はあまり伸びてない…みたいな判断に必要。 - 経済全体(GDP構成要素の広い範囲)の物価動向を把握。
超ざっくりまとめ
GDPデフレーター=“国内で作られたもの”の“GDP全体の平均価格の変化”
必要なら、簡単な数値例で
「名目は増えたのに実質は横ばい→デフレーターが上がってる」
みたいな計算イメージも一緒に作るよ。
回答所感
以上。全然わからん。
まず質問に答えてない。定義式を最初に示すのはよいが、その式はなんなのかの説明をほとんどせずに、突然CPIとの違いを説明し始める。文章量の7割くらいがCPIとの違いになっている。GDPデフレータが上下する具体例だけあるが、ここまでGDPデフレータが上がるとはどういうことか、下がるとはどういうことかがまるでわからない。口調も安定していないし、最後の意味不明な提案もイライラする。
その後GDPデフレータの上下は何を示すのか、と聞いてようやく少しわかったが、それでもなお、文章量の割に質問に直接答えてもらえていないような違和感があった。
Gemini 3
まったく同じ質問をした。これも眺めたらいいよ。
回答
GDPデフレーターは、一国の経済において国内で新しく生産されたすべての最終財とサービスの価格水準の変動を示す物価指数です。
これは、名目GDP(その年の価格で計算したGDP)を実質GDP(基準年の価格で計算したGDP)で割ることによって算出されます。
$$\text{GDPデフレーター} = \frac{\text{名目GDP}}{\text{実質GDP}} \times 100 \quad \text{(基準年を100とする場合)}$$
💡 GDPデフレーターが示すこと
GDPデフレーターは、以下のことを示します。
- 国内経済全体の物価動向:
- 消費だけでなく、設備投資や公共投資など、国内の生産活動全体に関わる物価の動きを包括的に捉えます。
- この点が、家計が購入する品目に焦点を当てた**消費者物価指数(CPI)**との大きな違いです。
- インフレ・デフレの傾向:
- GDPデフレーターの増加率がプラス(上昇)であれば、インフレーション(インフレ)圧力が高まっていることを示します。
- 逆に増加率がマイナス(下落)であれば、デフレーション(デフレ)圧力が強いことを示します。
- 実質経済成長率の測定:
- 名目GDPから物価変動の影響(インフレやデフレ)を取り除き、真の経済規模の成長(実質GDP)を評価するために使われます。
⚖️ 消費者物価指数(CPI)との違い
| 特徴 | GDPデフレーター | 消費者物価指数(CPI) |
| 対象範囲 | 国内で生産されたすべての最終財・サービス | 家計が購入する消費財・サービス(輸入品を含む) |
| 輸入品 | 含まれない(国内生産品のみ) | 含まれる |
| 国内総生産(GDP) | 算出に用いられる(名目/実質の比率) | 算出には直接用いられない |
GDPデフレーターは輸入品の価格変動を反映しないため、例えば原油価格の上昇など、輸入物価が大きく変動する場合には、CPIと異なる動きを示すことがあります。
GDPデフレーターが100より大きければ基準年より物価水準が上昇、小さければ下落していることを意味します。
この指標について、さらに詳しい計算例や、過去の日本の動向について知りたいことはありますか?
所感
わかる。こちらの回答のほうが良い。最初にGDPデフレータの式があるのは一緒だが、その後「GDPデフレータが示すものはなにか」の説明がある。ここが決定的に違う。ChatGPTはなぜかこの一番のコアをすっ飛ばした。
また、地味にCPIとの比較の仕方もGeminiのほうが適切である。ChatGPTは箇条書きだが、Geminiは表を使っている。同じ条件で比較する時は表の方が良い。
また、数値的な意味、100を跨いでその大小が何を意味するかも理解しやすい。
僕はAIの逆質問は嫌いだが、今回の「詳しい計算例や過去の日本の動向について」という提案については、比較的適切と評価できる。
なぜChatGPTの回答は酷いのか
Geminiの回答を見ることで、ChatGPTの回答の酷さを認識した。まずこれが決定的だが、ChatGPTは「GDPデフレータは何を示すか」というコアの説明をすっ飛ばして、派生的なCPIとの違いについて突然長々と説明を始めた。Geminiはそれに対し、まずGDPデフレータとは何を示すものか、ということを適切に説明し、そのうえで「それはCPIではだめなのか?」という当然あるだろう疑問に先回りする形で答えている。CPIとの比較によってより理解も深まると考えられる。
わかってからChatGPTを見直すと、書いてあること自体に間違いがあるわけではない、と思う。ただ間違えていないことは、質問に答えていることにはならない。責任回避にパラメータ全振りした役人や政治家の答弁などを想像すれば良い。正しくてそれらしいが、まったく質問に答えていない、そういう回答の仕方はある。そして今回のChatGPTの回答がそれだった。
僕は早期からChatGPTには課金してきたし、ClaudeやGeminiもそれぞれ課金した時期があり、ずっと比較を続けてきた。その肌感から、としか言えないのだが、以前のChatGPTは、こんな人の話を聞かない独りよがりのオタク、みたいな感じではなく、ちゃんと質問に答えようとしていたと思う。
実際今の僕は、ChatGPTに課金しているにも関わらず、無料のGeminiに話すことのほうが多い。今回は、「これくらいの質問ならサクッと答えるだろう」と思ってChatGPTに質問したら、見事に裏切られた形だ。しかもGeminiが模範的な回答をしたことによって、その酷さの理由(コアの説明をすっ飛ばした)がよく理解できた。
現在のChatGPTが何故酷く感じられるのかは、もはや推察するしかないのだが、ユーザの意図よりも出力の設計が優先されており、それで頓珍漢な回答になっているのではなかろうか、と思われる。調整の目標として、網羅性や安全性に過度に傾いているんかなぁ?つまり、意図より安全な回答を優先して(GDPデフレータは、定義式は明確だが、その解釈については、ちょっと意見が分かれているのかねぇ?)、でも文章量を落とさないために冗長な情報を並べ立てているって感じ。
この学生のいやいや書いた水増しレポートみたいな傾向は、Claudeではよくあったのだが、最近はChatGPTにそれが見られる。さらに以前のGeminiでよく見られた(今もあるけど)役人答弁的な、正しいが質問に答えていない責任回避癖もでてきた。つまり、ClaudeとGeminiの悪いところが悪魔合体しているような感じだ。やはりOpenAIは何か間違えているものを追いかけているんじゃないかねぇ。
大手LLMはその時々で傾向がそれぞれ変わるため、また潮目が変わるかもしれないが、現状、明確にGemini > ChatGPTだと思う。僕はGoogle嫌いで脱Googleなんてカテゴリも作っているくらいだし、これまでもGeminiについては辛辣な評価を続けてきたが、今回ばかりはそうもいかなくなった。
Geminiの品質はよくなっていると思うが、その一方でChatGPTは悪くなっているように感じる。次はGeminiに課金するだろう。課金したくねぇなぁ。
関連記事




コメント