【初心者向け】Python in Excelで機械学習モデルを作ってみた!実装方法を詳しく解説

【初心者向け】Python in Excelで機械学習モデルを作ってみた!実装方法を詳しく解説

公開: 更新:
だーだい
フリーランスWebライター兼Web製作者。Webライターとしてガジェットメディアやプログラミングに関する記事を執筆する傍ら、LP制作とWordPressの改修案件もこなしつつ、活動しています。 profile

Excel内でPythonを実行できる「Python in Excel」を使うことで、機械学習モデルを作ることも可能です。Excel内で機械学習モデルを使えるので、Pythonを使える外部システムを使うことなくExcel内でデータ管理と機械学習を一括で実行できます。

そこで今回は、Python in Excelを使って機械学習モデルを作る方法について解説します。



学習データと予測データを作成する

Pythonで機械学習モデルを作るには、モデルが学習するための基盤となるデータである学習データと、モデルの制度をテストするための予測データが必要です。

今回は、ChatGPT Plusユーザーの方が利用できる「advanced data analysis」という機能を使って、学習データと予測データを作成します。詳しい使い方は下記の記事で解説しています。

「Python」を学べるコードキャンプのサービス

学習データをChatGPTで作成する

はじめに、ChatGPTの「advanced data analysis」機能を設定し、下記のプロンプトを入力します。

「身長と体重とBMIから、どのような体系なのか学習する機械学習モデルを作ろうと思っています。これに適した学習データをExcelファイルで作成してください。」

出力結果:

python in excelで機械学習モデルを作ってみた1

ChatGPTより

advanced data analysisを使うことで、意図したサンプルデータをExcelファイルとして出力できるので便利です。

予測データをChatGPTで作成する

予測データも学習データと同じ流れで作成できます。予測データを作るプロンプトは下記の通りです。

「上記のデータセットの予測用のデータも作ってほしいです。」

これで、先ほど作った学習データに適した予測データを数秒で作ってくれます。

出力結果:

python in excelで機械学習モデルを作ってみた2

ChatGPTより

最後に、学習データと予測データをExcelのシート別に読み込みます。

python in excelで機械学習モデルを作ってみた3

Excelより

これで学習データと予測データの準備は完了です。

おすすめのPython研修一覧

Python研修を提供しているおすすめの企業・法人を一覧で掲載しております。

Python研修の一覧を見る

おすすめのDX研修一覧

DX研修を提供しているおすすめの企業・法人を一覧で掲載しております。

DX研修の一覧を見る

おすすめのJava研修一覧

Java研修を提供しているおすすめの企業・法人を一覧で掲載しております。

Java研修の一覧を見る

おすすめのJavaScript研修一覧

JavaScript研修を提供しているおすすめの企業・法人を一覧で掲載しております。

JavaScript研修の一覧を見る

機械学習モデルを作成する

機械学習モデルを作るには、「Scikit-learn(サイキットラーン)」という、Pythonの機械学習ライブラリを利用します。

Scikit-learnには「RandomForestClassifier(ランダムフォレストクラス)」という、OKかNGかを判断する機械学習を作成できるクラスがあります。今回はこのクラスを活用しましょう。

はじめに、予測データのシートを開き、D列2行目のセルに下記のPythonコードを入力します。

from sklearn.ensemble import RandomForestClassifier
stu = xl("学習用データ!A1:D41", headers=True)
info = stu[["身長","体重","BMI"]]
cat = stu["カテゴリ"]
clf = RandomForestClassifier()
clf.fit(info, cat)
test = xl("予測データ!A1:C21", headers=True)
clf.predict(test)

上記コードは完成された機械学習モデルです。各コードの役割を詳しく解説します。

from sklearn.ensemble import RandomForestClassifier

この行では「sklearn(Scikit-learn)」ライブラリの中から、「RandomForestClassifier」というアルゴリズムを使用するためのクラスをインポートしています。

stu = xl("学習用データ!A1:D41", headers=True)

セルを指定するxl関数を使用して、Excelシート「学習用データ」のA1からD41までのデータを取得し、それを「stu」という変数に格納しています。「headers=True」は、最初の行がヘッダー(列名)であることを示しています。

info = stu[["身長","体重","BMI"]]

stu変数内のデータから、「身長」「体重」「BMI」の3つの列を取得し、それを「info」という変数に格納しています。これは、機械学習モデルの入力として使用する特徴量です。

cat = stu["カテゴリ"]

stu変数のデータから「カテゴリ」という列を取得し、それを「cat」という変数に格納しています。これは、機械学習モデルが予測する目的変数(ラベル)です。

clf = RandomForestClassifier()

ランダムフォレストのインスタンスを作成し、それを「clf」という変数に代入しています。

clf.fit(info, cat)

RandomForestClassifierクラスのfitメソッドを使い、引数に学習データを格納している「info」と目的変数を格納している「cat」を指定して学習(訓練)させています。

test = xl("予測データ!A1:C21", headers=True)

xl関数を用いて、Excelシート「予測データ」のA1からC21までのデータを取得し、それをtest変数に格納しています。

clf.predict(test)

先ほど訓練した機械学習モデル「clf」を使用して、test データセットに対する予測を行う命令です。これにより、予測されたカテゴリのリストが返されます。

上記コードの実行結果は下記のとおりです。

python in excelで機械学習モデルを作ってみた4

Excelより

空欄だったD列に、同じ行の身長・体重・BMIを参考に、学習したデータを用いて該当する体系が出力されています。

このように、Excel内のデータを用いて機械学習モデルを作り、その場で実行できるのもPython in Excelの強みです。

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム


ITやプログラミングに関するニュース

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。

コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア 金融業界の業務効率化を加速するニッセイアセットマネジメントの生成AI×GAS活用研修事例 - IT・プログラミングを知って学べるコネクトメディア 【製造業のDX人材育成事例】デジタル人材の即戦力化を実現する、日本ガイシ株式会社の異動者向オンボーディング研修 - ITやプログラミングを知って学べるコネクトメディア フューチャーアーキテクト株式会社が実現した新入社員向けIT研修プログラムでタスクフォース制度が主体的な学びと成長を生み出す - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果|サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修|株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩|株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア 企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

対象者別で探す

子供(小学生・中学生・高校生)向け
プログラミング教室検索する

子供(小学生・中学生・高校生)がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供(小学生・中学生・高校生)
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する