最近トップページに雑な画像を貼っている。たとえばこんなの。

このしょうもない画像を作るためにメモリが高騰していると考えると泣けてくるが、まぁきっと世の中には世のため人のため社会のために画像作っている人もいるんだろう知らんけど。
さてそれはともかく、ローカルでStable Diffusionなんかを使うのと違ってありがたいのはやはり「セリフ」と「吹き出し」まで生成してくれる手軽さだ。手軽といってもやはり難しいには違いないらしく、一発でクリアできないことが多い。なんならハマることもある。
今回はChatGPT 5.1でハマった事例。ついでにGemini 3もやった事例。
ChatGPT 5.1
雑なプロンプトは以下。
ブログのトップに使う漫画を作って。
このコマは毎日入れ替えるくらいの使い捨て。
少しクスッ、と思えるものがよい。
## 全体
コマ数: 1コマ
アスペクト比: 横長
スタイル: シンプルな白黒コミック
## 1コマ目
キャラクター: ダンベルを持っている猫
吹き出し:
暖房は甘え
背景: シンプルAuto(多分Instant)
この雑なプロンプトをChatGPTに投げてできたのたこれ。

マジか。これについて「文字を間違えている。「暖房は甘え」です」と雑に指摘。すると以下ができた。

マジなのか。恐らくアスペクト比ワイドでつくったのに、実際は正方形で出してしまっているのであろう混乱と、そして謎の漢字。
「文字が見切れている。また、暖房の文字もおかしい。」と指摘して出てきたのが以下。

もうええわ。多分文字が見切れていることは気づいたのだろうが、文字がいよいよ大変なことになっている。
まぁこれについては、ちゃんと指摘すれば修正される余地はある気がしたものの、このまま続けているとメモリの価格がさらに上がるのも残当なので撤退。
Thinkingでやりなおし
新しくチャットを開いて、今度はThinkingモードでやってみた。

今度はうまくいった。まぁなんか見切れているので、例によって生成と出力でアスペクト比に齟齬があるように見えるが、まぁ雑画像なら別にいいか、という感じ。
Autoでやりなおし
Thinkingの必要があるのだろうか?と思って、Autoにして再度チャットルームを開き、もう一度同じプロンプトを貼った。

やっぱりアスペクト比問題と思われる見切れは発生しているんだが、今度はうまくいった模様。
NanoBanana (Gemini)
ついでなのでNano Banana(Gemini)も試してみた。
高速モード
Flashのことだと思うが、いったんそれでプロンプトを投げた。一瞬でできた。

一瞬でできたが残念。何語?噂のNano Bananaこんなもんなんか。
思考モード
と思ったところで、思考モード(3 Pro) でやれというご指示をいただいた。そうかと思ってまったく同じプロンプトであげなおすと、以下が出力された。

おう。一応できている。ちょっと思ったよりワイド過ぎるが、アスペクト比については細かく指定しなかったのでしゃーなし。
高速モードでもう一回
ふと、これもガチャの影響が強いかもしれない、と思って、高速モードに切り替えて同じプロンプトをもう一回投げた。前と同じ画像が出てきた。キャッシュかな。
まぁ画像生成速度にあからさまな差があるし、Geminiで画像作るなら3 Proでやれ、ということだろう。
所感
雑なまとめ。
- 確かに文字出力もできるものの、やはり難しい
- ガチャがあるので、ハマったら変に粘らず撤退してルームやり直すほうがいい
- 連続してシリーズ的に作っているルームがあるなら、やり直しはしんどいかもしれないのだが、そんな人いるんだろうか
- Geminiで画像作るなら3 Pro
たったこれだけの1コマでも、やってみると試行錯誤が発生するので、巷でたまに見かけるよくできたAI漫画みたいなのは、どれだけの出力を試行したのだろうかと、メモリの高騰に想いを馳せて泣く。画像も動画もこれ以上いらないんだけどな。と言いつつ、あったら使いたくなるので雑な画像作って「ふーん」ってなってる。なんだかなぁ。
<関連するような>

他人様
Google「Nano Banana Pro」で“漫画”生成祭り開催中。一発出しでこの仕上がり……(生成AIクローズアップ) | テクノエッジ TechnoEdge

コメント