ChatGPTとGeminiで画像生成の使い分け

ChatGPTとGeminiで画像生成の使い分け

GeminiとChatGPTでは、作れる画像に強いもの弱いものがある。
そして一度の生成のお願いをしたところ一気に作れる枚数にも差がある。
ChatGPTの場合は1つしか基本的には作れない。
APIを設定して命令を出せば複数枚一気に出すこともできる。
ただ、あまりそこにはお金をかけたくないなと思っているので今は使わない。

GeminiとChatGPTの画像生成の違い

① 得意・不得意の領域

  • Gemini
     複雑な指示や一度に複数のバリエーションを出す点に比較的強い。Googleが得意とする検索的な文脈理解や「まとめて処理」に強みが出やすい。
     一方で、芸術的な表現や繊細なスタイル再現には限界が見える場面がある。
    (浮世絵は強いwww)
  • ChatGPT
     1枚ごとの生成クオリティや、ユーザーの細かい指示への追従性は高い。ただし標準的な使い方では基本的に1回に1枚しか出せないため、「まとめて作りたい」ときは不便さがある。

② 一度の生成枚数

  • Gemini:プロンプト次第で複数枚を一気に返すことが可能。ブログや記事用の素材をまとめて欲しいときに便利。
  • ChatGPT:通常UIでは1枚。APIを使えば複数枚まとめて生成できるが、設定やコスト管理が発生する。

③ コストと使い勝手

  • ChatGPT API利用
     複数枚を出すにはAPIを使う必要があり、その分課金のリスクやランニングコストが出る。1ヶ月に数百枚レベルを目指すなら固定費+従量課金でコストがかさむ。
  • Gemini
     現状の仕組みでは、比較的ユーザー側のコスト負担を抑えて複数枚生成できることが多い。

④ あなたの現状スタンス

  • 「毎回ブログ記事を書くたびに5〜6枚まとめて欲しい」ニーズがある。
  • ただし API利用にお金をかけたくない → ChatGPTでの複数枚同時生成は見送り。
  • そのため、今は Geminiでまとめて作らせるのが実用的な解。
  • ChatGPTは「1枚をじっくり作り込む」「細かいスタイル指定で品質を出す」場面で使い分けるのがよさそう。

👉 要するに、

  • Gemini = まとめ撮り(量産・スピード重視)
  • ChatGPT = ポートレート撮影(精度・表現重視)
    みたいな役割分担で考えると整理しやすいです。

ということで久々にGeminiをつかって浮世絵を書いてみました。

江戸時代に現代人がタイムスリップしたら、確かに面白い状況がたくさん生まれそうですね!浮世絵風に、そんな場面を3つ描いてみました。

スマホをかざす若者と驚く人々 江戸の町並みで、着物姿の町人たちがざわめく中、現代の若者がスマホを構えて写真を撮ろうとしている様子です。スマホの存在に戸惑い、興味津々に覗き込む人々の表情がポイントです。

コンビニのおにぎりを食べる武士 桜が舞い散る中で、刀を差した武士がコンビニのおにぎりを食べている場面です。厳かな武士の姿と現代のカジュアルな食べ物のギャップが面白い構図です。周りの人々は不思議そうに見ています。

スケートボードに乗る町娘 活気ある江戸の市場で、現代のストリートファッションに身を包んだ町娘がスケートボードに乗って通り過ぎています。魚を売る商人や買い物客が、突然現れた彼女の姿に目を丸くしている様子です。

    attrip

    attrip

    考えたことを、記事・AI・音楽に変えて発信しています。

    盆栽、音楽、ブログ運営、日々の試行錯誤について書いています。

    2010年から発信中

    コメントを残す