画像生成AI「FLUX.1」とは
FLUX.1はBlack Forest Labs (BFL)が開発した最新の画像生成AIモデルです。このモデルはStable Diffusionの開発者たちが新たに設立したBFLにて生まれたもので、テキストをもとに画像を生成する機能を持っています。
FLUX.1の魅力は視覚的な品質やプロンプトの忠実性であり、MidjourneyやStable Diffusionなどの高性能な画像生成AIと比べても見劣りしません。そのため今後の画像生成AIにおいて、新たな基準となることが期待されています。
FLUX.1で利用できるモデルの特徴
FLUX.1にはDev、Schnell、Proという3つのバリエーションがあります。
FLUX.1 Dev
テキストの説明から画像を生成できる120億のパラメータが組み込まれており、複雑なパターンを認識して高度な画像を生成できます。
FLUX.1 Schnell
スピードに最適化されており、ローカル開発や個人プロジェクトに最適なプランです。このバージョンはApache 2.0ライセンスのオープンソースで提供され、迅速かつ効率的な画像生成を可能にします。
FLUX.1 Pro
プロフェッショナルや企業向けに設計されており、非常に高い性能を提供します。特に、プロンプトに対する高い追従性と優れた画像品質が特徴です。
上記のようにそれぞれ異なる用途やニーズに応じて最適化されているのが特徴。Proは高品質な画像生成、Devはオープンソース開発向け、Schnellは高速処理を重視しています。
FLUX.1の料金プラン
FLUX.1の利用料金は、FLUX.1を提供しているプラットフォームによって異なります。たとえば今回利用する「fal.ai」の料金プランは下記の通りです。
Dev | 1メガピクセルあたり0.025ドル。 |
---|---|
Schnell | 1メガピクセルあたり0.003ドル。 |
Pro | 1メガピクセルあたり0.05ドル。 |
「fal.ai」はGitHubを使ってアカウント登録すると、1ドル分のクレジットが無料でもらえます。
ほかにも「https://flux1ai.com/」というプラットフォームでは、下記のように月額料金プランを採用しています。[1]
プラン | クレジット数 | 月額料金 | 特徴 | 生成速度 |
---|---|---|---|---|
STARTER | 500枚 | 9.9ドル |
|
通常速度 |
PREMIUM | 1,000枚 | 12.9ドル |
|
高速 |
PRO | 5,000枚 | 29.9ドル |
|
高速 |
FLUX.1は商用利用できるのか
FLUX.1は商用利用できるモデルとできないモデルに分かれます。詳細は下記の通りです。
- FLUX.1 Pro:可能
- FLUX.1 Dev:不可能
- FLUX.1 Schnell:可能
FLUX.1 Devについては、FLUXの開発元である「Black Forest Labs」が公開しているHugging Faceにて下記のように明記されています。
Black Forest Labs, Inc. (“we” or “our” or “Company”) is pleased to make available the weights, parameters and inference code for the FLUX.1 [dev] Model (as defined below) freely available for your non-commercial and non-production use as set forth in this FLUX.1 [dev] Non-Commercial License (“License”).
日本語訳
Black Forest Labs, Inc.(以下「当社」または「当社の」または「会社」)は、FLUX.1 [dev] モデル(以下に定義)の重み、パラメータ、推論コードを、本 FLUX.1 [dev] 非商用ライセンス(以下「ライセンス」)に定めるとおり、非商用および非生産目的で自由に利用できるようにいたします。
出典:FLUX.1 [dev] Non-Commercial License
FLUX.1 devにおいては非商用ライセンスにて自由に利用できるということなので、商用利用はできないということがわかります。
FLUX.1の使い方
今回はさまざまな生成AIモデルをまとめている「fal.ai」というプラットフォームで、FLUX.1を使う方法について解説します。
fal.aiではGitHubアカウントの登録が必要なので、持っていない方は事前に下記のURLからアカウント登録しておきましょう。
GitHubアカウント登録URL:https://github.com/signup?source=login
はじめに、fal.aiの公式ページへアクセスします。
fal.aiの公式URL:https://fal.ai/
fal.aiより
トップページ右上にある「Sign up」をクリックします。
fal.aiより
GitHubアカウントによる認証画面が表示されるので、クリックして続けて下さい。
fal.aiより
登録作業を続けると上記の画面が表示されます。「Authorize fal-ai」をクリックして双方の情報を紐づけて下さい。
fal.aiより
上記画面が表示されたら登録完了です。画面の下部に利用できる生成AI一覧があるのでスクロールしてみましょう。
fal.aiより
Flux.1と記載されているモデルがいくつかあるので、その中から使いたいモデルをクリックしてください。今回はテストとして「FLUX.1 dev」を使用してみます。
fal.aiより
表示画面の「Prompt」欄へテキストを入力することで画像を生成できます。テキスト以外に詳細情報を指定したい場合は、「Prompt」の右下にある「More」をクリックして下さい。
fal.aiより
すると上記のように詳細設定画面が表示されます。各機能の内容は下記の通りです。
- Image Size:生成する画像のサイズを指定
- Num Inference Steps:実行する推論ステップの数
- Seed:同じバージョンのモデルに同じシードと同じプロンプトを与えると、毎回同じ画像が出力される
- Guidance scale:モデルがプロンプトにどれだけ忠実に従うかを示す尺度
- Num Images:一度に生成する画像の枚数
テキストを入力するだけでも画像生成できますが、上記の設定を活用することでより理想に近い画像を作成できます。
今回は下記のプロンプトで画像を生成してみます。
A close-up of a sunflower from a front-facing angle, with extreme detail on the petals and center. The texture of the seeds and the vibrant yellow of the petals are sharply focused. The sunlight enhances the natural colors and gives a realistic glow. Overlaid on the image, the word "BLOOM" is written in large, white, hand-painted letters with visible brushstrokes.
日本語訳
正面から見たひまわりの極端なクローズアップ。花びらと中心部のディテールが非常に細かく、種の質感や花びらの鮮やかな黄色がシャープに焦点を合わせて表現されている。自然光が色を引き立て、リアルな輝きを与えている。画像の上には「BLOOM」という文字が大きく白い手描き風の文字で描かれ、筆跡が見える。
上記プロンプトの実行結果は下記の通りです。
fal.aiより
プロンプトの再現率が高く、品質も高いことがわかります。
FLUX.1 Proで人物画を作ってみる
次にFLUX.1 Proを使って人物画を作成してみます。
fal.aiより
fal.aiのトップ画面の中から「FLUX.1 pro」をクリックします。
fal.aiより
上記画面が表示されるので「Prompt」欄へ生成したい画像のプロンプトを入力します。今回は下記のプロンプトを使って人物画を生成してみます。
A full-body portrait of a woman standing in a natural light setting, with detailed focus on her facial expression and posture. The texture of her skin and the sharpness of her eyes are emphasized, while her hair catches the light and shimmers. She is wearing a shirt with the word "FLUX" printed on it, and the entire outfit is captured with precise detail, highlighting the flow and fit of her clothing.
日本語訳
自然光の中に立つ女性の全身ポートレート。顔の表情や姿勢に細かい焦点が当てられ、肌の質感や目の鋭い視線が強調されている。髪の毛は光を捉えてきらめいている。「FLUX」とプリントされたシャツを着ており、服全体のディテールが精密に捉えられており、衣服の流れやフィット感が際立っている。
生成できた画像は下記の通りです。
fal.aiより
プロンプト通り全身のポートレート画像を生成できており、シャツにプリントされた文字まで詳細に再現されています。
References
- ^ FLUX.1. 「Pricing Plans」. https://flux1ai.com/pricing, (参照 2024-08-19).