最頻値を求める関数:MODE、MODE.SNGL、MODE.MULTの違いと使い分け方
はじめに
Excelを使用する際、データの中で最も頻繁に出現する値=最頻値を求めることはよくあります。
Excel関数には、
「MODE関数」「MODE.SNGL関数」「MODE.MULT関数」の3つが最頻値を求める関数
があります。
先日の記事『【MOD関数】使い方と解説 – 最頻値 –』ではMODE関数を紹介しました。
本記事では、
「MODE.SNGL関数」「MODE.MULT関数」について紹介し、
「MODE関数」「MODE.SNGL関数」「MODE.MULT関数」の3つの関数の特徴や使い方、注意点について解説します。
先に結論を述べますと、
実務現場においては、「MODE.MULT関数」がおすすめです。
即利用できるダウンロードファイル
以下のリンクから、「MODE関数」「MODE.SNGL関数」「MODE.MULT関数を使った具体的な例を示したExcelファイルをダウンロードすることができます。
MODE関数、MODE.SNGL関数、MODE.MULT関数に関して
3つの関数は型が同じで、違いは、戻り値にあります。
型は同じであるため、関数の使いはMODE関数の記事『【MODE関数】使い方と解説 – 最頻値 –』を参照ください。
- MODE関数:最頻値が複数ある場合はデータの最初に見つけた値のみを表示。
- MODE.SNGL関数:MODE関数と同じ。
- MODE.MULT関数:最頻値が複数ある場合にすべて抽出する
投稿を編集 “【MODE関数】使い方と解説 – 最頻値 -” ‹ データ分析ドットコム — WordPress
投稿を編集 “【MODE関数】使い方と解説 – 最頻値 -” ‹ データ分析ドットコム — WordPress
MODEに、.SNGLが付けば、「最頻値(MODE)のシングル(.SNGL)」ですので、1つの値のみ、
MODEに、.MULTが付けば、「最頻値(MODE)のマルチ(.MULT)」ですので、複数の値が可能
ということが、関数名からも推察できます。
ちなみに、.(ドッド)は、オブジェクト指向言語では、オブジェクトとそのメソッドやプロパティをつなぐために使われます。
ゆえに、「MODE.SNGL関数」「MODE.MULT関数」という命名になっていると思われます。
具体例
例えば、以下のようなデータの場合、次の結果を返します。
2と3ともに、3回出現しているデータです。
このとき、MODE関数やMODE.SNGL関数を使うと、最頻値は2と表示されます。
しかし、実際には3も同じくらい頻繁に出現しています。
ゆえに、MODE関数やMODE.SNGL関数は上手く機能しているとは言えません。
複数の値があるケースは、最初の値を返すからです。
(これは、Excel関数のクセなのか、VLOOKUP関数やMATCH関数などでも散見されるケースで、複数の値があるケースは、最初の値を返すようです)
そこで、MODE.MULT関数を使うと、最頻値は2と3の両方が表示されます。
このように、MODE関数やMODE.SNGL関数は最頻値が1つしかないときに使うのが適切ですが、
最頻値が複数ある可能性があるときは、MODE.MULT関数を使うのがおすすめです。
結論、MODE.MULT関数を使っておけば、あらゆるケースに対応できるというわけです。
もちろん、最頻値を最初の値の1つに確定したい場合は除きます。
最後に
本記事では、Excelの「MODE関数」「MODE.SNGL関数」「MODE.MULT関数」について解説しました。
3つの関数は、データの中で最も頻繁に出現する値を求めるために使用されますが、戻り値に違いがあります。
「MODE関数」「MODE.SNGL関数」は最頻値が複数ある場合には、最初に見つけた値のみを表示します。
一方、MODE.MULT関数は最頻値が複数ある場合にすべて抽出します。
実務現場においては、
最頻値が複数ある可能性がある場合に備えて、MODE.MULT関数を使用することが良いでしょう。
Excelの関数を使いこなすことで、データ解析作業がよりスムーズに進められるようになります。今回の記事が、Excelユーザーの方々にとって有用な情報となることを願っています。
参考記事
関連記事
Excel関数の原理原則
本記事の読みやすさをさらに向上させるために、Excel関数に関する原理原則についてまとめた記事を紹介します。