AI漫画を作る上で重要性の高いものが「画像生成モデル」と「プロンプト」です。特定の画像データを学習したモデルに作りたい漫画の内容をプロンプトで指定することにより、理想のAI漫画を作成できます。
そこで今回は、高精度なAI漫画を作るためのプロンプトのコツについて解説します。
プロンプトを使う際のポイントから、具体的にどのような点に気を付けるべきなのか紹介しているのでぜひ参考にしてみてください。
画像生成AIでプロンプトを使う際のポイント
画像生成AIでプロンプトを使う際のポイントは下記の通りです。
- 画像生成モデルに沿ったプロンプトを活用する
- プロンプトは英語で入力する
- 第三者のプロンプトを参考にする
各内容について詳しく解説します。
画像生成モデルに沿ったプロンプトを活用する
自分が使用したい画像生成モデルで最適な画像を出力するには、各モデルごとに高精度の画像が作られているプロンプトを参考にするのが最適です。
画像生成モデルを提供しているプラットフォーム「CIVITAI」では、各モデルごとにどのような画像を作成できるのか掲載されています。
CIVITAIより
画像生成モデルの詳細を表示して画面をスクロールすると、右側に掲載された画像を生成するためのプロンプトが記載されています。
CIVITAIより
上記は「Animagine XL」というモデルに掲載されているプロンプトです。本モデルでは各単語ごとにカンマ「,」で区切られているため、同様の方法でプロンプトを指定することが望ましいと考えられます。
Animagin XLモデルに沿って作成したプロンプトと出力結果が下記の通りです。
プロンプト
masterpiece, best quality, monochrome, lineart, 1girl, solo, 20 years old, flat chest, short hair, black hair, hair between eyes, black eyes, long-sleeves, white hoodie, long pants, blue jeans, open eyes, open mouth, standing, cowboy shot, from front, looking at viewer, white background, simple background
ネガティブプロンプト
Worst Quality, Low Quality, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, normal quality,signature, watermark, username, blurry, multiple legs, multiple hands, incorrect limb and crotch, less than surrealism, fused fusion, long body, bad perspective, logo
上記の内容を実行することで下記の画像が生成されました。
Stable Diffusionより
特徴ごとに単語で区切って英語で入力することにより、AI漫画として活用できる精度の画像を生成できています。
ほかの画像生成モデルも確認してみましょう。
CIVITAIより
上記のモデルでは描写やシーンを英文で記載する方法で問題なさそうです。もしプロンプトの特徴がわからない場合、ChatGPTやClaudeなどの生成AIに聞いてみることもおすすめです。
生成AIに聞く際のプロンプト例と出力結果は下記の通りです。
プロンプト内容
A man in Hanfu rides on the head of a koi, pointing his finger in the direction of the koi, and many koi follow behind the koi's tail, ancient Chinese rice paper scroll, ancient Chinese simple painting, blank view, yarn material, artistic conception ink painting, Buddhist artistic conception, song dynasty, minimum color gamut, layering, soft light, depth of field, blurred background, blurred edges, ink illustration, Dunhuang color system<lora:flux1-D\flux.1_lora_flyway_ink-dynamic.safetensors:0.3:1.0> <lora:flux1-D\Comic book V2.safetensors:0.5:1.0>
上記のプロンプト構成にはどのような特徴がありますか?また、上記のプロンプトが最適解の場合、どのようなポイントに気を付けてプロンプトを書くべきなのか教えて下さい。
出力結果
プロンプトを書く際のポイント
シンプルかつ明確に: 描写するシーンや動作(例えば「man in Hanfu rides on the head of a koi」)はシンプルで明確な表現を心がけ、細かいニュアンスを強調しすぎないことが重要です。視覚的なイメージが伝わりやすいシンプルさを保ちつつ、ディテールを増やすことが大切です。
統一感のあるスタイル選定: 色彩や技法の指定はプロンプト全体に統一感を持たせるため、混乱させない範囲で使います。例えば、仏教的なコンセプトとインクのイラスト表現を一貫して保持し、色の指定もDunhuang色彩に沿うようにして、イメージのブレを防ぎます。
詳細と抽象のバランス: 「blurred background」「soft light」などの要素は詳細な指示を与えつつも、背景や周辺に関しては柔らかく抽象的にすることで、フォーカスポイントがはっきりします。これにより、メインのキャラクターや動作に視線を集中させる効果があります。
ストーリー性のあるシーン構築: 描かれるシーンには動きやストーリーを持たせることで、ただの静止画ではなく、物語を想像させる効果があります。プロンプト内の「指を指す動作」「コイに続く他のコイたち」などは、動的な要素を含んでおり、シーン全体が生き生きとしたものに見えるよう工夫されています。
過度な指定を避ける: 一つのプロンプト内にあまりに多くの詳細を詰め込むと、生成される画像に混乱を招く可能性があります。LoRAやインクの指定、背景や色彩のコントロールなど、プロンプトの主軸をはっきりさせて、それ以外の要素は抑える方が効果的です。
上記のように生成AIへ聞くことで、プロンプトの特徴を言語化してくれます。
プロンプトは英語で入力する
AI漫画を生成する際のプロンプトは、英語で入力することがおすすめです。理由は下記の通りです。
- データ量と質: 英語はAIの学習データが豊富なので、精度が高い結果を得やすい傾向にあります。
- モデルのトレーニング: AIモデルは主に英語で開発されているため、英語のプロンプトの方がより正確に理解されやすいのが特徴です。
- 表現の豊富さ: 英語は単語が豊富で複雑な指示を簡単に伝えられます。AIが意味を理解しやすく結果も期待通りになることが多いです。
上記のように英語のプロンプトを想定してトレーニングされたモデルが多いため、翻訳ツールや生成AIなどで翻訳して英語入力する方法が最適です。
モデル次第では日本語でも生成できますが、品質が著しく落ちたり思っていた画像を生成できないこともあります。
現状は英語でのプロンプト入力が最適ですが、今後は日本初の日本語に最適化された画像生成モデルも登場するかもしれませんね。
第三者のプロンプトを参考にする
AI漫画を作成する際、ほかのクリエイターやユーザーが使用しているプロンプトを参考にする方法も効果的です。具体的には電子書籍やXでの投稿などが挙げられます。
Stable Diffusion Onlineで生成した画像
— 漆黒の堕天使 (@Nearby_Coffin) October 18, 2024
プロンプトは以下の通り
「Giant Artificial Intelligence Turns Against Humans」
意味は、人間に反旗を翻した巨大な人工知能
メタルマックスのノアをイメージしたけど出来上がった画像は全然違った
それもまた面白い#StableDiffusion pic.twitter.com/F6NnjQv8sz
AIマンガに使えるプロンプトをまとめましたー。
— けいすけ / 毎日18時に新作マンガ投稿 (@kei31) October 21, 2024
KindleUnlimitedなら無料でよめますー。
👇👇👇👇👇👇
https://t.co/uegFJcB619
👆👆👆👆👆👆
※Amazonに飛ぶPRリンクです pic.twitter.com/FqVZLWZGz7
投稿されているプロンプトと実際の画像を参考にすることで、漫画に取り入れられる英単語の表現を発見したりプロンプトに関する知見を深めたりできます。
特に同じツールやAIモデルを使っている場合、成功したプロンプト例を参考にすることで自分のプロンプト作成がよりスムーズになります。
たとえば感情的な場面の描写に関するプロンプトを参考にすることで、シーン設定やキャラクター表現に新しい視点を取り入れることができます。
注意点としてX上には事実と異なる情報もあるため、そのまま信じるのではなく実際にプロンプトとして取り入れて確かめるようにしましょう。
画像生成AIを最大限に活用するプロンプトの書き方
画像生成AIを最大限に活用するプロンプトのコツは下記の通りです。
- 視点とフレーミングの指定
- アクションの明確な指示
- スタイルや雰囲気を伝える
- 詳細なキャラクター設定
- 場面や背景の詳細な設定
- 感情は目や口の形などを具体的に指定する
各内容について詳しく解説します。
視点とフレーミングの指定
AIが生成する画像ではカメラアングルや視点の指示が、シーンの印象に大きな影響を与えます。どの視点から漫画を作るのか明確に指示することで、場面に動きや深みを加えられるのです。
英語でのプロンプト:
"A top-down view with the protagonist standing in the center of the scene."
日本語訳:
「カメラは斜め上から見下ろす視点で、主人公が中央に大きく映っている。」
視点やフレーミングを指定することでシーンの印象を強調し、重要なキャラクターやアクションに視線を集中させる効果が得られます。
アクションの明確な指示
動きのあるシーンでは、キャラクターの動作をプロンプトで具体的に指定することが重要です。動く方向やどのようなスピード感で動いているのかを詳しく指示することで、AIが動きをリアルに再現しやすくなります。
英語でのプロンプト:
"The protagonist leaps high in the air, swinging a sword down towards the enemy."
日本語訳:
「主人公が大きくジャンプしながら、敵に向かって剣を振り下ろす動作をしている。」
キャラクターの動きを具体的に指示することで、ダイナミックかつ迫力のあるシーンの漫画を生成できます。
スタイルや雰囲気を伝える
漫画やイラスト全体のスタイルや雰囲気を統一することも重要です。シリアスなシーンやコメディ、ファンタジーなどのスタイルを明確に伝えることでトーンが一致し、一貫性のある漫画に仕上がります。
英語でのプロンプト:
"A dark fantasy style, with a predominantly dark color palette."
日本語訳:
「シーンはダークファンタジースタイルで、全体的に暗い色調を使っている。」
スタイルや雰囲気を統一することでシーン全体を一貫したトーンで描写し、作品にまとまりが出ます。
詳細なキャラクター設定
キャラクターの外見や服装、表情、動作を具体的に記述することで意図したキャラクターを再現しやすくなります。漠然とした指示ではなく、具体的な特徴をしっかり伝えることが大切です。
英語でのプロンプト:
"A female protagonist with long black hair, wearing a black leather jacket, looking confident with her arms crossed."
日本語訳:
「長い黒髪でクールな性格の女性主人公が、黒いレザージャケットを着ている。表情は自信に満ちており、ポーズは腕を組んでいる。」
このようにキャラクターの具体的な特徴を詳しく伝えることで、AIがキャラクターのイメージを正確に再現しやすくなります。
場面や背景の詳細な設定
AI漫画は背景を切り抜いて使うことが多いですが、背景も作りたい場合はその情報を細かく描写することが重要です。
英語でのプロンプト:
"A neon-lit city at night, with rain falling. The protagonist is standing on a rooftop, looking down over the city."
日本語訳:
「夜の都会の高層ビル街で、ネオンが輝き、雨が降っている。主人公がビルの屋上から街を見下ろしている。」
上記プロンプトのように背景描写を具体的に設定することで、シーンの再現をより正確に行い物語の世界観が強化されます。
感情は目や口の形などを具体的に指定する
キャラクターの表情を指定する場合、どのような感情なのか指定するだけでなく、具体的な表情の形をプロンプトで指定することで精度が上がります。
英語でのプロンプト:
"sad eyes, half-closed, tears, swollen eyelids, trembling lips, downcast gaze, sorrowful expression, suppressed sobs, watery eyes, lower eyelid puffiness, quivering mouth, emotional struggle, melancholic look, gentle sobbing, tear-filled eyes"
日本語訳:
「目を半分閉じて目の端に涙がたまり、下まぶたが少し腫れ、視線を下に向けながら唇を震わせて涙をこらえようとしている。」
感情表現を具体的に伝えることでシーン全体に緊張感が与えられ、物語がよりリアルに感じられます。