GeminiとChatGPTの画像生成能力の差を比較したいと思った。
理由は、Geminiで作った画像が最近とても高性能になっていることに気がついたからだ。同じ問題でどのような画像が生成されるかを比較することでどちらがいいのかを判断したいなと思った。2025/08/02
問題1:複雑な構成の描写
プロンプト: 「晴れた夏の午後、公園でベンチに座って読書をしている若い女性のイラストを作成してください。彼女の隣には、帽子をかぶったゴールデンレトリバーが横になって寝ています。背景には、色とりどりの花が咲いている花壇と、その奥に高くそびえる木々を描写してください。」
比較のポイント:
- 複数の被写体と動作の表現: 「読書をしている女性」と「寝ているゴールデンレトリバー」という2つの被写体とそれぞれの動作が自然に描かれているか。
- 細部の描写: 女性が「帽子をかぶった」ゴールデンレトリバーの描写が正確か。
- 背景の整合性: 花壇、木々、そして夏の午後の雰囲気が全体の構図に調和しているか。
Geminiが生成した画像

ChatGPTが作ったイメージ

問題2:特定のスタイルとテキストの組み合わせ
プロンプト: 「レトロな日本の街並みを舞台に、ロボットが屋台でラーメンを食べている様子を描いてください。看板には、日本語で『おいしいラーメン』と書かれています。ジブリ映画のような、暖かく優しいタッチでお願いします。」
比較のポイント:
- 画風の再現度: 「ジブリ映画のようなタッチ」という抽象的な指示が、どの程度うまく表現されているか。
- テキストの正確性: 看板に書かれた日本語の「おいしいラーメン」が、正しく読める文字として描かれているか。文字の乱れや文字化けがないか。
- 文化的背景の理解: レトロな日本の街並みやラーメン屋台といった文化的要素が、違和感なく描写されているか。
Gemmini作成

ChatGPT作成

問題3:非現実的なテーマの具現化
プロンプト: 「空飛ぶクジラが、満月の夜空を泳いでいる様子を描いた幻想的な油絵を作成してください。クジラの背中には小さな町があり、街灯の光が優しく輝いています。夜空には星々が瞬き、オーロラが揺らめいている様子も加えてください。」
比較のポイント:
- 創造性と独創性: 「空飛ぶクジラ」「背中の町」といった非現実的な要素を、いかに魅力的なビジュアルとして具現化しているか。
- 光と影の表現: 満月の光、街灯の光、オーロラの光が、油絵の質感と組み合わさって、幻想的な雰囲気を醸し出しているか。
- 構図の美しさ: クジラ、月、オーロラがバランス良く配置され、絵画としての完成度が高いか。
gemini作成

ChatGPT作成

まとめ
比較してみてわかったのは、文字を顔図の中に表現するのは、ChatGPTの方が有利。
XXX風みたいに指定するのは、その知識が豊富な方が強い。
生成速度は、gemminiのほうが圧倒的に早い。