スプレッドシートのVAR.P関数とは
VAR.P関数は母集団全体のデータに基づいて分散を計算するGoogleスプレッドシートの統計関数です。英名では「population variance」と言われており、母集団分散の算出に特化した関数として位置づけられています。
この関数は各値の平均からの偏差の二乗の合計を求め、その値を母集団のデータ数で割ることで分散値を導出します。データの散らばり具合を定量的に測定する際の重要な指標として、統計分析やデータ解析において頻繁に活用されています。
【PR】プログラミングや生成AIを無料で学べる「コードキャンプフリー」
VAR.P関数の基本的な構文と引数指定
VAR.P関数の基本構文は「VAR.P(値1, [値2, ...])」の形式で記述し、最低2つ以上の数値データが必要です。第1引数の値1は母集団の最初の値または範囲を指定し、第2引数以降は母集団に含める追加の値や範囲を任意で指定できます。
VAR.P(1,2,3,4,5,6,7,8,9,10)
VAR.P(A2:A100)
関数は最大30個の引数を受け付ける仕様となっていますが、実際にはGoogleスプレッドシートでは任意の数の引数を処理できます。テキストデータが含まれている場合は自動的に無視され、純粋な数値のみを対象として分散計算が実行されます。
VAR.P関数とVAR関数の計算方法の相違点
VAR.P関数は母集団全体を対象とした分散計算を行うため、偏差の二乗和をデータ総数で除算する方式を採用しています。一方でVAR関数は標本分散を計算するため、偏差の二乗和をデータ数から1を引いた値で除算する点が根本的に異なります。
=VAR.P(A1:A5) // 母集団分散
=VAR(A1:A5) // 標本分散
母集団分散では全てのデータが既知であることを前提とするため、より正確な分散値が算出されます。標本分散は母集団の一部から推定を行う際に使用され、不偏推定量としての補正が施されているため異なる結果が得られるのです。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- Canvaとは?使い方やアカウント登録などを初心者向けに解説
- git configで設定情報を確認・表示する方法
- 「Pythonはやめとけ」と言われる理由と学習するメリット
- Ubuntuのversionを確認する方法
- Geminiで画像を生成する方法|ChatGPTとの比較結果も紹介