スプレッドシートのCHITEST関数とは
CHITEST関数はカテゴリデータが予想される分布から引き出される確率を判定する統計関数であり、2つのデータ範囲を比較してピアソンのカイ二乗検定を実行します。この関数は観測されたデータと期待されるデータの差が統計的に有意かどうかを数値で判断することができるため、品質管理や市場調査における仮説検証に広く活用されています。
基本構文はCHITEST(実測値範囲, 期待値範囲)
で表現され、2つのパラメータがそれぞれ観測されたデータと理論的に期待されるデータを指定します。関数の戻り値は0から1の確率値となっており、この数値が小さいほど観測データと期待データの間に統計的に有意な差があることを示すものです。
【PR】プログラミングや生成AIを無料で学べる「コードキャンプフリー」
CHITEST関数の基本的な引数設定
第1引数の実測値範囲には実際に観測されたカテゴリ別のデータ数を指定し、第2引数の期待値範囲には帰無仮説のもとで期待されるデータ数を配置します。両方の範囲は同じ行数と列数を持つ必要があり、数値以外のセルは計算から除外されるため、事前にデータの整合性を確認することが重要となります。
=CHITEST(A1:A6, B1:B6)
実測値範囲と期待値範囲の対応関係を正確に設定することで、カテゴリごとの観測頻度と理論頻度を比較できます。データ範囲の指定において行と列の配置が一致していない場合、関数は正しい結果を返さないため、範囲選択時には視覚的な確認を徹底する必要があります。
6面サイコロの公平性検証における実装例
60回の試行で各面の出現回数を観測し、公平なサイコロであれば各面が10回出現することが期待される状況での検証を実装します。観測データとして1面が11回、2面が15回、3面が8回、4面が10回、5面が2回、6面が14回出現したケースを想定し、期待値はすべて10回に設定することで仮説検証を行うものです。
=CHITEST(A2:A7, B2:B7)
計算結果として0.05137998348という値が返され、これはサイコロが実際に公平である確率が約5.1%であることを示します。一般的に有意水準5%を基準とする場合、この結果はサイコロの公平性に疑問を呈する統計的根拠となり、品質管理や不正検出の判断材料として活用できるものです。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- Canvaとは?使い方やアカウント登録などを初心者向けに解説
- git configで設定情報を確認・表示する方法
- 「Pythonはやめとけ」と言われる理由と学習するメリット
- Ubuntuのversionを確認する方法
- Geminiで画像を生成する方法|ChatGPTとの比較結果も紹介