AI Picassoが著作権配慮型画像生成AIデータセット約1000万個を無償公開、AI開発の新たな可能性が拡大

AI Picassoが著作権配慮型画像生成AIデータセット約1000万個を無償公開、AI開発の新たな可能性が拡大

公開: 更新:


【時間がない人向け】記事の要約

  • AI Picassoが画像生成AI開発用データを公開
  • 約1000万個のデータを無償で提供
  • 著作権に配慮した2種類のデータセットを公開

Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

AI Picassoによる著作権配慮型画像生成AIデータセットの公開

AI Picasso社は2024年7月31日、著作権に配慮した画像生成AI開発用データ約1000万個を無償公開した。公開されたデータセットは「megalith-10m-florence2」と「soa-full-florence2」の2種類であり、いずれもCreative Commonsライセンスに基づいた画像を利用している。[1]

これらのデータセットは、画像生成AIの開発に携わる研究者や開発者にとって貴重なリソースとなる。

「megalith-10m-florence2」は、CC-0相当の写真画像約1000万枚に対する説明文データセットだ。一方「soa-full-florence2」は、CC-0だけで構成された約300万枚の絵画などのテキスト画像データセットとなっている。両データセットともFlorence-2というマルチモーダルモデルを使用してキャプションづけがなされており、ライセンス上の制限なく利用可能である。

AI Picasso社はこれらのデータセットを公開することで、クリエイターとの協力のもとでAI技術の発展を目指している。

同社が開発中のCommonArtという日英画像生成モデルは、これらのデータセットを活用して作られたものだ。今回のデータセット公開が、AI技術の発展と著作権問題の解決の一助となることが期待される。

AI Picassoが公開した画像生成AI開発用データセットの概要

megalith-10m-florence2 soa-full-florence2
データ種類 CC-0相当の写真画像に対する説明文 CC-0で構成された絵画などのテキスト画像
画像数 約1000万枚 約300万枚
キャプションモデル Florence-2 Florence-2
主な用途 テキストからの画像生成、視覚言語モデルの開発 教育、練習
特徴 入念な下処理済み、著作権侵害の心配なし 著作権が切れた画像のみで構成
おすすめのPython研修一覧

Python研修を提供しているおすすめの企業・法人を一覧で掲載しております。

Python研修の一覧を見る

おすすめのDX研修一覧

DX研修を提供しているおすすめの企業・法人を一覧で掲載しております。

DX研修の一覧を見る

おすすめのJava研修一覧

Java研修を提供しているおすすめの企業・法人を一覧で掲載しております。

Java研修の一覧を見る

おすすめのJavaScript研修一覧

JavaScript研修を提供しているおすすめの企業・法人を一覧で掲載しております。

JavaScript研修の一覧を見る

trends編集部「K」の一言

AI Picassoによる著作権に配慮した大規模データセットの公開は、AI開発における重要な課題の一つに解決策を提示している。

画像生成AIの開発では、大量の画像データが必要となるが、著作権の問題が常に付きまとう。これらのデータセットを利用することで、開発者は法的リスクを最小限に抑えながら、高品質なAIモデルの開発に取り組むことができるようになるだろう。

今後、これらのデータセットを活用した新たな画像生成AIの登場が期待される。特に、芸術作品や歴史的な画像を含む「soa-full-florence2」は、教育や文化財のデジタル保存といった分野での応用が考えられる。

また、「megalith-10m-florence2」を用いた視覚言語モデルの開発は、画像認識技術の更なる進化をもたらす可能性がある。

一方で、これらのデータセットの品質や多様性に関する検証も重要となるだろう。大規模なデータセットであっても、偏りや不適切なコンテンツが含まれている可能性は否定できない。AI Picasso社には、継続的なデータの品質管理と、必要に応じてデータセットの更新を行うことが求められる。

また、このような取り組みが他の企業や研究機関にも広がり、オープンなAI開発エコシステムが形成されることを期待したい。

References

  1. ^ Note. 「著作権に配慮した画像生成AI開発用データ約1000万個を無償公開|AI Picasso」. https://note.com/aipicasso/n/n97ce9a979ef7, (参照 24-08-06).

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム


ITやプログラミングに関するニュース

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。

コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア xコードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果|サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修|株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩|株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア 企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

対象者別で探す

子供(小学生・中学生・高校生)向け
プログラミング教室検索する

子供(小学生・中学生・高校生)がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供(小学生・中学生・高校生)
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する