AI Picassoが著作権配慮型画像生成AIデータセット約1000万個を無償公開、AI開発の新たな可能性が拡大

AI Picassoが著作権配慮型画像生成AIデータセット約1000万個を無償公開、AI開発の新たな可能性が拡大

公開：2024年8月6日更新：2024年8月6日

CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座

目次

【時間がない人向け】記事の要約
AI Picassoによる著作権配慮型画像生成AIデータセットの公開
AI Picassoが公開した画像生成AI開発用データセットの概要
trends編集部「K」の一言
References

【時間がない人向け】記事の要約

AI Picassoが画像生成AI開発用データを公開
約1000万個のデータを無償で提供
著作権に配慮した2種類のデータセットを公開

Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

AI Picassoによる著作権配慮型画像生成AIデータセットの公開

AI Picasso社は2024年7月31日、著作権に配慮した画像生成AI開発用データ約1000万個を無償公開した。公開されたデータセットは「megalith-10m-florence2」と「soa-full-florence2」の2種類であり、いずれもCreative Commonsライセンスに基づいた画像を利用している。^[1]

これらのデータセットは、画像生成AIの開発に携わる研究者や開発者にとって貴重なリソースとなる。

「megalith-10m-florence2」は、CC-0相当の写真画像約1000万枚に対する説明文データセットだ。一方「soa-full-florence2」は、CC-0だけで構成された約300万枚の絵画などのテキスト画像データセットとなっている。両データセットともFlorence-2というマルチモーダルモデルを使用してキャプションづけがなされており、ライセンス上の制限なく利用可能である。

AI Picasso社はこれらのデータセットを公開することで、クリエイターとの協力のもとでAI技術の発展を目指している。

同社が開発中のCommonArtという日英画像生成モデルは、これらのデータセットを活用して作られたものだ。今回のデータセット公開が、AI技術の発展と著作権問題の解決の一助となることが期待される。

AI Picassoが公開した画像生成AI開発用データセットの概要

	megalith-10m-florence2	soa-full-florence2
データ種類	CC-0相当の写真画像に対する説明文	CC-0で構成された絵画などのテキスト画像
画像数	約1000万枚	約300万枚
キャプションモデル	Florence-2	Florence-2
主な用途	テキストからの画像生成、視覚言語モデルの開発	教育、練習
特徴	入念な下処理済み、著作権侵害の心配なし	著作権が切れた画像のみで構成

おすすめのPython研修一覧

Python研修を提供しているおすすめの企業・法人を一覧で掲載しております。

Python研修の一覧を見る

おすすめのDX研修一覧

DX研修を提供しているおすすめの企業・法人を一覧で掲載しております。

DX研修の一覧を見る

おすすめのJava研修一覧

Java研修を提供しているおすすめの企業・法人を一覧で掲載しております。

Java研修の一覧を見る

おすすめのJavaScript研修一覧

JavaScript研修を提供しているおすすめの企業・法人を一覧で掲載しております。

JavaScript研修の一覧を見る

trends編集部「K」の一言

AI Picassoによる著作権に配慮した大規模データセットの公開は、AI開発における重要な課題の一つに解決策を提示している。

画像生成AIの開発では、大量の画像データが必要となるが、著作権の問題が常に付きまとう。これらのデータセットを利用することで、開発者は法的リスクを最小限に抑えながら、高品質なAIモデルの開発に取り組むことができるようになるだろう。

今後、これらのデータセットを活用した新たな画像生成AIの登場が期待される。特に、芸術作品や歴史的な画像を含む「soa-full-florence2」は、教育や文化財のデジタル保存といった分野での応用が考えられる。

また、「megalith-10m-florence2」を用いた視覚言語モデルの開発は、画像認識技術の更なる進化をもたらす可能性がある。

一方で、これらのデータセットの品質や多様性に関する検証も重要となるだろう。大規模なデータセットであっても、偏りや不適切なコンテンツが含まれている可能性は否定できない。AI Picasso社には、継続的なデータの品質管理と、必要に応じてデータセットの更新を行うことが求められる。

また、このような取り組みが他の企業や研究機関にも広がり、オープンなAI開発エコシステムが形成されることを期待したい。

References

^ Note. 「著作権に配慮した画像生成AI開発用データ約1000万個を無償公開｜AI Picasso」. https://note.com/aipicasso/n/n97ce9a979ef7, (参照 24-08-06).

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム

コラム一覧はこちら

ITやプログラミングに関するニュース

ニュース一覧はこちら

ブログに戻る

企業・法人向けのIT・プログラミング・生成AI研修を探す、比較する - IT・プログラミングを知って学べるコネクトメディア

CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座 - IT・プログラミングを知って学べるコネクトメディア

コードキャンプが提供する無料で学べるプログラミングスクール講座 - IT・プログラミングを知って学べるコネクトメディア

コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア

配属3ヶ月で30%の生産性向上を実現するいよぎんコンピュータサービスの新人研修に迫る - IT・プログラミングを知って学べるコネクトメディア

金融業界の業務効率化を加速するニッセイアセットマネジメントの生成AI×GAS活用研修事例 - IT・プログラミングを知って学べるコネクトメディア

【製造業のDX人材育成事例】デジタル人材の即戦力化を実現する、日本ガイシ株式会社の異動者向オンボーディング研修 - ITやプログラミングを知って学べるコネクトメディア

フューチャーアーキテクト株式会社が実現した新入社員向けIT研修プログラムでタスクフォース制度が主体的な学びと成長を生み出す - IT・プログラミングを知って学べるコネクトメディア

コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア

コードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア

コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果｜サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア

コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修｜株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア

コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩｜株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア

企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

ALL

IT NEWS

ITコラム

IT用語集

2026年 6月 20日

DFSK、香港で右ハンドル車仕様の「E5 PLUS」を初披露し、グローバル展開を加速

2026年 6月 20日

Trupeer AI、日本における企業向け事業拡大を率いるため、UiPathの元APAC社長兼CEOであるRaghu Subramanian氏を任命

2026年 6月 20日

Doritos Loaded、Gordon RamsayシェフとMercedes-AMG PETRONAS F1 TeamドライバーGeorge Russellを起用した迫力満点のCMを公開

2026年 6月 19日

GAC、「香港アクション2.0」を発表し、E9 Premiumを初公開、2026年香港国際自動車博覧会で高品質なグローバル展開を加速

2026年 6月 19日

FlashRevが新エージェント「Hermes Agent」を追加、用途で選べる2エージェント体制を実現

2026年6月19日

FlashRevが新エージェント「Hermes Agent」を追加、用途で選べる2エージェント体制を実現

2026年6月19日

SHA株式会社がAIガバナンス関連3パッケージを提供開始、軽量プランなら約4〜6週間から導入可能

2026年6月19日

Frontier TPRM AgentsがMicrosoft「Copilot Cowork」に対応、委託先デューデリジェンス機能を提供開始

2026年6月19日

FlashAIが4段階AI推論深度と再利用可能アシスタントアーキテクチャを導入、音声AIキャンペーンOSへ進化

2026年6月19日

Ahrefsがブランドレーダーを大型アップデート、AIボット訪問数とAI流入数の一画面表示とプロンプトベース新インデックスを追加

対象者別で探す

法人研修小中高生向け個人向け

全ての研修を確認する

CodeCampKIDSフランチャイズ募集

全てのコースを確認する

子供（小学生・中学生・高校生）向け
プログラミング教室検索する

子供（小学生・中学生・高校生）がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供（小学生・中学生・高校生）
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する