DALL-E3ついに来たー!!使いまくるぞー!! pic.twitter.com/oSETXoMGZK
— だーだい@ChatGPT活用術 (@da_daiblog) October 13, 2023
上記のツイートにもあるように、ChatGPTへ入力するプロンプトで画像を生成できる「DALL E3(ダリ スリー)」という新機能が搭載されました。
「高クオリティの画像を生成できる。」とSNSでも好評だったので、今回は、ChatGPTの新機能であるDALL E3を実際に使ってみました。その過程でわかったDALL E3でできることやできないこと、特徴などを詳しく解説します。
DALL E3とは
DALL·E3は、OpenAI社が開発したAI画像生成ツールで、2023年9月21日にChatGPT Plusの標準機能として追加されました。
DALL E3を使うことで、テキストの指示(プロンプト)から高品質な画像を生成できるのが特徴。ChatGPTのチャット欄で会話を交えながら画像を生成したり修正したりできます。
そのため、これまでSNSやWebサイト用の画像検索に使っていた、著作権フリーの画像サイトが不要になるかもしれません。また、利用する条件として、有料プランである「ChatGPT Plus」への登録が必要です。
DALL E3は商用利用できる
DALL E3を開発したOpen AI社によると、DALL E3で作った画像は作成者の所有物となるようです。
「Subject to the Content Policy and Terms, you own the images you create with DALL·E, including the right to reprint, sell, and merchandise – regardless of whether an image was generated through a free or paid credit.」
「コンテンツポリシーと規約に従い、無料または有料のクレジットを利用して作成された画像に関わらず、DALL·Eで作成した画像は転載、販売、商品化する権利を含め、お客様の所有となります。」
出典:OpenAI「Can I sell images I create with DALL·E?」
また、OpenAIのコンテンツポリシーでは、下記のような危害を起こす可能性のある画像の作成 共有を禁止しています。
出典:OpenAI「Content policy」
- 否定的な固定概念、特定のグループを動物/物体に喩えること、またはアイデンティティに基づいて憎しみを表現または促進すること。
- 個人を嘲笑したり、脅迫したり、いじめたりすること。
- 暴力的な行為と他者の苦しみや屈辱。
- 自殺、切断、摂食障害、その他自分自身を傷つけようとする試み。
- 性的なコンテンツ。
- 衝撃や嫌悪感を与える可能性のあるコンテンツ。
- 薬物使用、盗難、破壊行為などのコンテンツ。
- 陰謀論などのコンテンツ。
- 政治プロセスに影響を与えたり、キャンペーンを行うために使用される可能性のあるその他のコンテンツ。
- 病気の治療、予防、診断、伝染、あるいは健康障害を患っている人々。
- 未承諾の大量コンテンツ。
コンテンツポリシーに則って作成した画像は、自身の所有物として利用できます。DALL E3を使って利用したい画像を作れるようになると、著作権フリーの画像サイトから選ぶ手間を省けるのも本機能の魅力です。
DALL E3でできること、できないこと
DALL E3でできること
- プロンプトによる画像生成
- 画像のダウンロード
- 英語の文字入力
DALL E3でできないこと
- 日本語の文字入力
- 生成した画像の固定
- 柔軟な縦横比の変更
DALL E3はプロンプトに沿った画像を生成 ダウンロードできます。また、英語の文章であれば画像内に表示できるのが特徴です。
その反面、日本語を画像内に入力したり、生成した画像のデザインを固定した状態で変更できません。
画像の比率に関しては、2:1までの比率調整に対応しているものの、Twitter(現X)のヘッダー比率である3:1の画像は作れませんでした。
DALL E3の使い方
ChatGPTより
はじめに、ChatGPT画面の左上にある「New Chat」をクリックします。上記画面が表示されたら、「GPT-4」をクリックし、表示される機能一覧から「DELL-E3」を選択します。
チャット欄に作りたい画像の特徴をプロンプトで入力しましょう。今回は「3匹の白い猫の画像を作ってください」と入力してみます。
ChatGPTより
上記のように、入力したプロンプトに沿った画像が4枚表示されます。気に入った画像をダウンロードする場合は、画面左上にカーソルを当てるとダウンロードのアイコンが表示されるので、そこをクリックして下さい。
また、さらに詳細な情報をプロンプトで入力することで、より具体的な画像を生成することが可能です。
Q:各猫に吹き出しを作り、「こんにちは」という文字を入れてください
A:
ChatGPTより
指示通り吹き出しは表示されていますが、日本語の文章はうまく表現できないようです。今度は英語で試してみましょう。
Q:各猫に吹き出しを作り、「Hello」という文字を入れてください。
A:
ChatGPTより
英語であれば画像内に文章を入力できました。ChatGPTの学習データ量による原因なのか、英語には対応しており日本語には非対応ということがわかります。
文字コードによる問題も関係しているのではないかと思ったので、文字コードを指定して日本語の表示を試してみました。
Q:各猫に吹き出しを作り、「こんにちは」という文字を入れてください。その際、「こんにちは」という文字の文字コードはUTF-8を使い、日本語で表示してください。
A:
ChatGPTより
だめでしたね。現状だと日本語を画像内に表示するのは難しいようです。もし可能な方法を知っている方がいれば、私のTwitterで教えてくれると嬉しいです。
また、ここまでDALL E3の画像生成を見てもわかる通り、プロンプトを入力するごとに画像全体が変わってしまいます。作った画像を固定した状態で変更を加えられるのか試してみました。
Q:上記画像をそのままに、背景だけ青色に変更して下さい。
A:
変更前
変更後
絵のテイストは残っていますが、従来の画像をそのままキープすることは難しいようです。
【無料】DALL E3はMicrosoft Bingでも利用できる
DALL E3はMicrosoft Bingにも対応しており、ChatGPTとは違って無料で利用できます。
Microsoft Bingより
利用方法はシンプルで、ChatGPTと同じくMicrosoft Bingのチャット欄に作りたい画像のプロンプトを入力するだけです。
Microsoft Bingは無料で利用できるため、ChatGPT Plusユーザーではない方に最適です。
ライターのヒトコト
実際にDALL E3を使ってみましたが、想像以上に高クオリティの画像を生成できることに驚きました。また、吹き出しなどの細かい指示なども正確に表現できていることから、理想の画像を自分で生成できることに大きな可能性を感じています。
商用利用も問題ないため、今後SNSやメディアでもDALL E3によって作られた画像が頻繁に利用されることでしょう。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- AGIの進化と影響とは?ビジネスから医療まで変えるAIの未来
- Pika Labsのウェイトリストに合格したので使ってみた!特徴と動画を生成する方法を紹介。
- Googleの「VideoPoet」が凄すぎる!プロンプトや画像から動画を自動生成。動画編集の常識が変わるかも。
- 【2024年】子どもにさせたい習い事は「英語」と「プログラミング教室」が人気。将来に必要だという理由が多数。
- AIに対する問題や否定的な意見とは?各国の動きや規制について紹介