スプレッドシートのHYPGEOM.DIST関数とは
HYPGEOM.DIST関数は、超幾何分布に基づいた確率計算を行うGoogleスプレッドシートの統計関数です。母集団から非復元抽出を行う際に、特定の成功数を得る確率を計算するために使用されます。
この関数は4つのパラメータを必要とし、num_successes(成功数)、num_draws(試行回数)、successes_in_pop(母集団の成功数)、pop_size(母集団サイズ)を指定します。復元抽出を行うBINOMDIST関数とは異なり、一度抽出したアイテムは母集団に戻さない非復元抽出の場面で威力を発揮する関数です。
【PR】プログラミングや生成AIを無料で学べる「コードキャンプフリー」
HYPGEOM.DIST関数の基本構文と引数
HYPGEOM.DIST関数の構文は「HYPGEOMDIST(num_successes, num_draws, successes_in_pop, pop_size)」の形式で記述します。第1引数のnum_successesは求めたい成功数を整数で指定し、第2引数のnum_drawsは許可される抽出回数を設定します。
=HYPGEOM.DIST(4,12,20,40)
第3引数のsuccesses_in_popは母集団に含まれる成功数の総数を表し、第4引数のpop_sizeは母集団全体のサイズを指定します。各引数は正の整数値で入力する必要があり、論理的には成功数が試行回数以下、母集団の成功数が母集団サイズ以下である条件を満たす必要があります。
セル参照を使用した実践的な利用方法
HYPGEOM.DIST関数はセル参照を使用した動的な計算も可能で、「HYPGEOMDIST(A2,A3,A4,A5)」のように各セルに値を入力して計算できます。この方法により、パラメータを変更しながら異なる条件下での確率を効率的に比較分析できます。
=HYPGEOM.DIST(A2,A3,A4,A5)
セル参照を活用することで、品質管理における不良品の抽出確率や、アンケート調査における特定回答者の選出確率など、実業務における様々な統計分析シナリオに対応できます。パラメータをセルで管理することにより、条件変更時の再計算作業を大幅に効率化し、データ分析の精度向上に貢献します。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- Canvaとは?使い方やアカウント登録などを初心者向けに解説
- git configで設定情報を確認・表示する方法
- 「Pythonはやめとけ」と言われる理由と学習するメリット
- Ubuntuのversionを確認する方法
- Geminiで画像を生成する方法|ChatGPTとの比較結果も紹介