【時間がない人向け】記事の3行要約
- Stability AIがStable Diffusion 3 Mediumをオープンリリース
- 高品質でフォトリアリスティックな出力とプロンプト理解力が特徴
- 非商用利用は無償、商用利用にはライセンス取得が必要
Stability AIがStable Diffusion 3 Mediumを正式リリース
Stability AIは2023年6月12日、最新の画像生成モデルStable Diffusion 3 Mediumを正式にリリース。SD3 Mediumは20億のパラメータから構成され、高品質でフォトリアリスティックな画像生成が可能だ。[1]
SD3 Mediumの特徴はディテールやカラー、ライティングの表現力に優れていることだ。16チャンネルVAEなどの工夫により、手や顔のリアルさなど他モデルの課題にも対処している。
プロンプトの理解力も大幅に向上しており、空間的推論や構成要素、アクション、スタイルを含む複雑なプロンプトにも対応する。3つのテキストエンコーダーを組み合わせることで、パフォーマンスと効率のバランスを取ることも可能だ。
NVIDIAとAMDとのコラボレーションでパフォーマンスを最適化
Stability AIはNVIDIAおよびAMDとコラボレーションし、それぞれのGPUアーキテクチャ向けにSD3 Mediumのパフォーマンスを最適化している。NVIDIAのGPUとTensorRTを活用したバージョンでは50%のパフォーマンス向上を達成した。
AMDとの取り組みでは、最新のAPUやコンシューマーGPU、エンタープライズ向けMI-300Xなど、幅広いAMDデバイスでの推論パフォーマンスを引き出すことに注力している。ハードウェアとソフトウェアの密接な連携により、ユーザーに最適な体験を提供することが狙いだ。
このようなハードウェアベンダーとのコラボレーションは、AIモデルの性能を引き出す上で非常に重要と言える。ソフトウェアとハードウェアの協調的な進化が、生成AIの実用性を高めていくことになるだろう。
オープンな利用を促進、商用利用にはライセンス取得が必要
Stability AIは一貫して、オープンな生成AIの発展を目指している。SD3 Mediumは非商用目的であれば誰でも無償で利用可能で、HuggingFaceからダウンロードできる。アーティストやデザイナー、開発者、AIホビイストなどは、新設されたクリエイターライセンスの下で利用することが推奨されている。
一方、企業など大規模な商用ユーザーは別途ライセンスの取得が必要だ。ライセンス取得が必要なことにより、利用ガイドラインを遵守しつつ、モデルの可能性を最大限に引き出すことができる。オープン性と一定のルール設定のバランスを取ることで、生成AIの健全な発展を目指す方針と言えるだろう。
Stability AIはSD3 Mediumを手軽に試せるよう、APIでの提供も開始している。専用アプリのStable AssistantやDiscordボットのStable Artisanからも利用可能で、まずは無料トライアルから始められるため、敷居の低さがユーザー層の拡大につながることが期待される。
trends編集部「K」の一言
Stable Diffusion 3 Mediumのリリースは、テキストから画像を生成するAIの発展において重要なマイルストーンとなるだろう。高い表現力とユーザビリティを兼ね備えたモデルが、クリエイターやビジネスユーザーの可能性を大きく広げることは間違いない。
一方で生成AIの民主化は、テクノロジーの倫理的な側面により大きな注目を集めることにもなる。モデルの悪用を防ぐためのセーフガードや知的財産権との関係性など、まだ解決すべき課題は少なくない。継続的なコミュニティとの対話を通じて、持続可能なエコシステムを育てていくことが求められるだろう。
ビジネス的には、生成AIがデジタルコンテンツ制作のバリューチェーンにもたらすインパクトは計り知れない。従来のクリエイティブワークフローが根底から覆される可能性があり、新しいビジネスモデルが続々と登場するかもしれない。個人の創造性と組織としての生産性をどう高めていくのか、今後もこの領域から目が離せない。
NVIDIAやAMDをはじめとする大企業、HuggingFaceのようなベンチャー企業との連携も見逃せない。ソフトウェアとハードウェアの垣根を越えて培われる知見は、生成AIの研究開発を互いに触発し合うことができる。オープンなエコシステムだからこそ実現する、イノベーションの好循環を生み出すことだろう。
References
- ^ stability.ai. 「最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表 — Stability AI Japan」. https://ja.stability.ai/blog/stable-diffusion-3-medium, (参照 24-06-13).
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- 研究・リサーチに役立つGPTsのおすすめ10選|人気のあるGPTをランキング形式で紹介
- 製造業のDX推進に役立つツール一覧|活用する重要性とメリットも解説
- テキストを図式化できるAIツール「Eraser」の使い方を料金プランと併せて解説。
- Gemini搭載のAIノートブック「NotebookLM」の使い方。具体的な特徴とできることを詳しく解説
- 【プログラミング学習】スクールの挫折率は3.5%で独学中心の挫折率は86%|スクールの利用が挫折率を下げる理由とは