
AI画像生成を無料で試したいけれど、どのツールを選べばいいか迷っていませんか?
Google Geminiなら無料版でも高品質な画像を生成できますが、日本語テキストの表示には注意点があります。本記事ではGeminiの画像生成機能の特徴や使い方から、ChatGPTとの比較まで詳しく解説します。
【無料】Geminiの「画像生成機能」の特徴
Geminiの画像生成は無料ユーザーでも質の高い画像を作成できるのが魅力です。2025年5月頃から搭載されたImagen 4により、従来のImagen 3よりも画質の向上や文字の表示精度が改善され、クリアで写実的な画像を生成できます。
また、GoogleがAndroidとiOSに提供している「Gemini Liveのカメラ」の画面共有機能を用いて、作成した画像をスマートフォンでリアルタイムに確認したり対話しながら活用したりできます。
Google AI StudioとGemini APIの無料プランを利用すれば、個人的な開発や実験的な取り組みを制約なく始めることも可能です。

【制限あり】Geminiの画像生成は無料で利用できる
無料版では1日の使用回数に制限がありますが、具体的な上限値は明示されていません。一般的な日常使用には問題のない範囲とされており、制限に達してもしばらく待てば再び利用可能になります。
画像生成は日本語の指示にも対応している
Geminiに搭載された画像生成モデル「Imagen 4」(2025年5月頃導入)は、日本語のプロンプトにも対応しています。これにより英語だけでなく日本語でも「〜の風景を描いて」などの指示が通るため、直感的に操作できます。
また、Googleが提供する生成AI用のSDKを使うことで、日本語を使った高度な入力や応答も可能です。
Geminiで作る画像に日本語を入れるのはまだ難しい
Geminiで生成する画像に日本語の文字を含めたい場合には注意が必要です。現在の仕様では漢字やカタカナ・ひらがなの描写が崩れるケースがあり、「文字化け」のような現象が起きることもあります。
Geminiで生成した画像

Geminiより
これは画像内の文字表示機能が、日本語に最適化されていないことが原因です。とくに細かい文字や複雑な漢字では、読みづらくなったり形が崩れたりすることがあります。
Geminiで画像を生成する方法
はじめにGeminiの公式ページへアクセスします。
Gemini:https://gemini.google.com/app?hl=ja

Geminiより
Geminiのトップページ下部にあるチャット欄へ作りたい画像の詳細を入力し、「この内容に沿った画像を生成してください。」と指示することで画像を生成できます。
今回は以下のプロンプトを入力・実行してみます。
図書館の中で読書する少女。光が窓から差し込み、背景には本棚が並ぶ。少女は黒髪で、白いブラウスに青いスカートを着ている。表示に‘‘AIと未来‘‘と書かれた本を手に持っている。水彩画風で、暖かみのある色調。
#上記のプロンプトに沿った画像を作ってください。

Geminiより
すると上記のようにプロンプトに沿った画像を生成してくれます。実際にできた画像はこちら。

Geminiより
プロンプトに沿った綺麗な画像を生成できました。しかし本の表紙が「AI FUTURE」と英語表記になっていますね。このように画像の品質は高いものの、日本語のテキストになかなか対応できないのが課題です。
この英語で書かれた文字を日本語へ変更するためのプロンプトを実施し、テキストを変更できるかテストしてみます。実行するプロンプトは以下の通りです。
上記画像の本の表紙が「AI FUTURE」と英語になっているので「AIと未来」へ変更してください。

Geminiより
すると本の表紙は変更されたものの、中国語のような漢字が表示されてしまい日本語を上手く表示できませんでした。
これまでの結果から、Geminiは高品質な人物画や背景などの作成に適しており、日本語とのテキストを用いた画像生成には向いていないことがわかります。
Geminiで生成した画像を保存するには
Geminiで生成された画像をクリックすると、以下の画面が表示されます。

Geminiより
表示内容の右上にあるダウンロードアイコンをクリックすると、画像を自分のデバイスへ保存できます。
Geminiの画像生成機能で対応できる解像度とアスペクト比
Geminiで利用できる画像生成モデル「Imagen 4」は、以下のアスペクト比と解像度で画像を生成できます。[1]
- 1:1: 1,024 x 1,024
- 3:4: 896 x 1,280
- 4:3: 1,280 x 896
- 9:16: 768 x 1,408
- 16:9: 1,408 x 768

解像度は最大2K(2048×2048)に対応しており、今回作った画像も1:1の2048pxで生成されました。
実用的な画像ならGeminiよりChatGPTの方が優秀?双方の画像生成機能を比べてみた
これまでの内容から、Geminiを使って高品質な画像を生成できることがわかりました。一方で、ChatGPTの画像生成機能も高品質かつ、画像に日本語を採用できることから注目を集めています。
そこで、GeminiとChatGPTで同じプロンプトを実行し、どのような画像を生成し、どんな違いがあるのか比べてみます。プロンプトは本記事で紹介した以下のプロンプトを採用します。
白い壁の前に、おしゃれな木製デスクと観葉植物が置かれた実写風の部屋。壁には黒いサンセリフ体で「未来を描く」という日本語の文字が大きく描かれたポスターが貼られている。朝の自然光が部屋に差し込み、全体が柔らかく照らされている。
#上記のプロンプトに沿った画像を作ってください。
GeminiとChatGPTの出力結果は以下の通りです。
Gemini

Geminiより
ChatGPT

ChatGPTより
このように双方とも品質に大きな違いはないものの、日本語の表示についてはChatGPTの方が優れています。また、ChatGPTの画像生成機能は日本語を表示できる機能の高さを活用し、以下のようなサムネイルやバナーを作成することも可能です。

ChatGPTより
Trendsが提供する「Code Camp FREE」では、ChatGPTを使ってサムネイル画像やバナー画像を作る方法を無料で解説しています。気になる方はぜひ参考にしてみて下さい。
References
- ^ Google Cloud. 「Imagen 4.0 Ultra – Generate Preview 06-06」. https://cloud.google.com/vertex-ai/generative-ai/docs/models/imagen/4-0-ultra-generate-preview-06-06?hl=ja , (参照 2025-06-23).