Advanced data analysisでKaggleのデータセットをグラフ化・分析してみた

Advanced data analysisでKaggleのデータセットをグラフ化・分析してみた

公開: 更新:
だーだい
フリーランスWebライター兼Web製作者。Webライターとしてガジェットメディアやプログラミングに関する記事を執筆する傍ら、LP制作とWordPressの改修案件もこなしつつ、活動しています。 profile

ChatGPTユーザーから高い評価を得ている「Advanced data analysis」。ChatGPTでPythonを実行できる利便性の高さと、外部ファイルを読み込める機能を活かしてデータ分析を実施することも可能です。

ChatGPTの便利機能「Advanced data analysis」とは?実際の使い方と仕事に活かす方法を紹介
ChatGPTの便利機能「Advanced data analysis」とは?実際の使い方と仕事に活かす方法を紹介

そこで今回は、Advanced data analysisを使って、データセットや課題を提供しているKaggle(カグル)から取得したデータを分析してみました。

Kaggleとは?メリット デメリット、Kaggleを活用したデータサイエンスや機械学習方法についてもご紹介。
Kaggleとは?メリット デメリット、Kaggleを活用したデータサイエンスや機械学習方法についてもご紹介。


Kaggleのアカウントを作成する

はじめに、データセットを取得するためにKaggleのアカウントを作成します。

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた1

Kaggleより

Kaggleの公式サイトにアクセスし、画面右上にある「Sign in」というリンクをクリックします。

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた2

Kaggleより

SNSアカウントやメールアドレスで認証できるので、任意の方法をクリックしましょう。今回はGoogleアカウントでの認証を例に作業を進めます。

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた3

Kaggleより

「Full name」というに入力欄に、任意のアカウント名を入力し、右下にある「Next」ボタンをクリックしてください。

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた4

Kaggleより

利用規約画面を読み進め、「I Agree」ボタンを押すとアカウント作成完了です。

データセットを取得する

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた6

ChatGPTより

データセットは詳細ページの右上にある「Download」というボタンをクリックすると取得できます。ダウンロードしたデータはCSVファイルなので、ExcelやGoogleスプレッドシートなどを使って内容を表示することが可能です。


Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

Advanced data analysisでデータ分析してみた

Kaggleで取得したデータを使ってどんな分析ができるのか、ChatGPTのAdvanced data analysisを使って聞いてみることから始めましょう。

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた7

ChatGPTより

データセットの名前とラベル名、その役割をChatGPTに入力して実行します。そのあと、下記のプロンプトを実行して分析できることを聞いてみましょう。

Q:このデータセットのラベルの名称とその役割から分析できることを教えてください。

A:

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた8

ChatGPTより

すると、ラベルとその役割から分析できる内容を出力してくれます。今回はその中から、リリースタイミングの影響に関する分析が面白そうだったので、こちらについて分析してもらいます。

データセットを指定して分析を始める

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた9

ChatGPTより

Advanced data analysisの左側にある「+」をクリックし、先ほどダウンロードしたデータセットのファイルを読み込みます。そして、下記のプロンプトを入力して実行しましょう。

Q:リリースタイミングの影響:
曲のリリース年、月、日とその人気度(再生数やチャート順位)の関係を分析して、特定の時期にリリースされた曲が人気になる傾向があるかどうかを調査できます。
調査するデータのファイルを指定したので、上記の分析や洞察をお願いします

A:

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた10

ChatGPTより

グラフから以下の洞察を得ることができます: 月別平均再生数: 1月、2月、3月にリリースされた曲は、他の月に比べて平均再生数が高い傾向にあります。これは、新しい年の初めにリリースされる曲が特に注目される、またはプロモーション活動が活発に行われる可能性が考えられます。 逆に、年の後半(特に11月と12月)にリリースされる曲の平均再生数は低いです。これは、年末に向けての新曲リリースが少なくなる、またはリスナーの注目が散漫になるためかもしれません。 日別平均再生数: 月の初めや中旬にリリースされる曲の平均再生数が高い傾向にあります。特に1日、15日、16日にリリースされた曲は注目されているようです。これは、リリーススケジュールやプロモーション戦略の影響を受けている可能性があります。 これらの洞察は、アーティストやレコード会社が新曲のリリースタイミングを考慮する際の参考になるかもしれません。ただし、これらの傾向は2023年のデータに基づいているため、年によっては異なる結果となる可能性も考慮する必要があります。

すると、分析した結果を出力するだけでなく、その内容をグラフで表示してくれました。こちらから指示せずとも、主体的に視覚的な情報も提供してくれるようです。

とはいえ、グラフだと詳細がわかりづらいので、分析結果を数字として表示してもらいましょう。

Q:月別平均再生数をグラフではなく詳細な数字として表示できますか?

A:

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた11

ChatGPTより

月ごとの詳細な平均再生数を表示してくれました。同じようなプロンプトで、日別の平均再生数も表示してもらいましょう。

Q:日別平均再生数も詳細な数字として表示してください

A:

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみたre3

ChatGPTより

月別と日別の平均再生数を調べた結果、最も再生数が高いのは1月31日だということがわかりました。

ほかにも、月のはじめと月の終わりの平均再生数が高いという傾向がわかったので、なぜこのような結果になったのかChatGPTに聞いてみましょう。

Q:なぜ月のはじめと終わりに再生数が高い傾向にあるのでしょうか?

A:

Advanced data analysisでKaggleのデータセットをグラフ化 分析してみた14

ChatGPTより

新曲のリリース プロモーション活動に適していることや、多くの国が月終わりに給与がもらえることなど興味深い分析結果を表示してくれました。

自分が想定できる内容から予想外の結果まで、自分以外の視点で分析するのに役立ちそうですね。

ライターのヒトコト

データ分析とは、手元にあるデータから特定の傾向やパターンを理解し、それに基づいて洞察や予測を行うことです。その過程で分析しやすいようにデータをクリーニングしたり、各データからどのようなことが予測できるのか考える必要があります。

今回利用した「Advanced data analysis」を使うことで、手元にあるデータからどのようなことを分析できるのかがわかります。また、分析する過程で生じるデータに関する問題も自動でクリーニングしてくれるのが魅力です。

データ分析初心者の方でも簡単な分析が可能なので、気になる方はぜひ利用してみてくださいね!

ChatGPTはAI技術を基にしたモデルであり、回答は状況や入力内容によって変動することが特徴です。上記は記事執筆時にChatGPTが回答した内容であり、同じ質問をしても別の答えを返すことがあります。

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム


ITやプログラミングに関するニュース

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。

コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア フューチャーアーキテクト株式会社が実現した新入社員向けIT研修プログラムでタスクフォース制度が主体的な学びと成長を生み出す - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果|サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修|株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩|株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア 企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

対象者別で探す

子供(小学生・中学生・高校生)向け
プログラミング教室検索する

子供(小学生・中学生・高校生)がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供(小学生・中学生・高校生)
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する