スプレッドシートのCOVARIANCE.S関数とは
COVARIANCE.S関数は、Googleスプレッドシートにおいてデータセットの共分散を計算する統計関数の一つです。この関数は、母集団全体から抜き取った標本データセットの共分散を求める際に使用され、2つの変数間の線形関係の強さと方向性を数値化できます。
共分散は2つのデータ系列が同じ方向に変化するか、または逆方向に変化するかを表す統計指標となっています。正の共分散は独立データと従属データが同じ方向に変化する傾向を示し、負の共分散は一方が増加すると他方が減少する逆方向の関係を意味します。
【PR】プログラミングや生成AIを無料で学べる「コードキャンプフリー」
COVARIANCE.S関数の基本的な構文
COVARIANCE.S関数の基本構文はCOVARIANCE.S(data_y, data_x)
の形式で記述し、第1引数に従属データ、第2引数に独立データを指定します。data_yパラメータには従属データを表す配列または行列の範囲を入力し、data_xパラメータには独立データを表す配列または行列の範囲を設定できます。
=COVARIANCE.S(A1:A10, B1:B10)
引数として指定できるのは数値データのみで、テキストデータが含まれている場合は自動的に無視されて計算が実行されます。引数には単一の数値、セル範囲、配列形式のデータなど複数の形式を使用でき、柔軟なデータ入力に対応しています。
範囲指定時は両方の引数で同じ数のデータ要素を含む必要があり、データの対応関係を正確に保つことが重要になります。サンプル数式として、COVARIANCE.S(B1:B5, 10)のように一方を固定値にしたり、COVARIANCE.S(1, 2, 3, 4)のように直接数値を列挙したりすることも可能です。
実際の計算例とデータ分析への応用
具体的な計算例として、2つのデータ系列A2:A6に{2,5,7,1,8}、B2:B6に{4,3,6,1,5}が入力されているケースを考えます。この場合COVARIANCE.S(A2:A6, B2:B6)の計算結果は4.65となり、正の共分散を示すため2つのデータ系列は同じ方向に変化する傾向があることが分かります。
=COVARIANCE.S({2,5,7,1,8}, {4,3,6,1,5})
配列を直接指定した計算方法では、中括弧{}を使用してデータを列挙し、カンマで各要素を区切って入力する形式を採用できます。例えば COVARIANCE.S({1,3}, {-1,6})の計算では結果が7となり、この正の値は2つのデータセット間に正の共分散関係があることを示しています。
共分散の結果値は相関の強さと方向を判断する指標として活用でき、マーケティング分析や財務分析において変数間の関係性を評価する際に重要な役割を果たします。ただし共分散の絶対値の大きさ自体は解釈が難しいため、相関係数と併用することでより詳細な統計分析を実施できます。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- Canvaとは?使い方やアカウント登録などを初心者向けに解説
- git configで設定情報を確認・表示する方法
- 「Pythonはやめとけ」と言われる理由と学習するメリット
- Ubuntuのversionを確認する方法
- Geminiで画像を生成する方法|ChatGPTとの比較結果も紹介