最終更新日:2023年8月15日
どうも、おばんです。QCたかです。
病院にインフルエンザで駆け込むヒトたち。
老いも若きも、女も男も。
学生でしょうか?幼児も社会人もいそうです。
地域で流行しているのでしょうか。
その地域は限定されるのでしょうか。
ひとつのインフルエンザに、こうも色々な条件が重なると、真実が見えなくなります。
今回は、こんな話です。
最後まで見て行ってくださいね。
層別とは
QCたかは、男で身長は175cmです。地元の小、中、高校を卒業し、石川県の大学を卒業しました。
今は、地元の企業に勤めています。
このように、個人は、色々な要素が複雑に絡み合って存在しています。
レイヤー(層)と考えた方が分かりやすいでしょうか。
小学校というレイヤーにおいては、同じ小学校を卒業したヒトは大勢いるでしょうし、身長というレイヤーでは、ボクと同じ身長のヒトもかなりの人数がいるはずです。
男というレイヤーでいえば、人類の半数はボクと同じレイヤーです。
これら複数のレイヤーを重ね合わせたときに、生まれてくるのは、QCたかという個人です。
世の中の事象も、このように色々なレイヤーを重ね合わせて発生しています。
交通事故や、食料品に混入した異物。カラダの中に置き忘れた医療器具。
上げればキリがありませんが、例えば1件の交通事故から、各レイヤーをひとつづつ外していけば、真の原因が見えるかもしれません。
信号の色はどうだったのか、天気はどうだったのか。
何時だったのか、同乗者はいたのか。
運転者の年齢は?
どうやら、交通事故は、昼間と夜間を比べると昼間の方が多いようです。
車、ヒトの活動量が多いため、相対的に多いのでしょう。
交通事故の事故データから、昼間の事故が多いことがわかったので、その対策として、警察は昼間のパトロールに多くの時間を割くことになります。
層別というものは、このような考え方になります。
混沌と複雑に絡み合ったままでは、よく見えないことを、バラバラにしてあげて、真実を見えるようにする、ということです。
層別 stratification
母集団を幾つかの層に分割すること。
層は部分母集団の一種で、相互に共通部分をもたず、それぞれの層を合わせたものが母集団に一致する。
目的とする特性に関して、層内がより均一になるように層を設定する。
備考:層別を層化ともいう。
(Z8101-2)
ークォリティマネジメント用語辞典(2004年 吉澤正 日本規格協会)より引用
層別は、QC7つ道具のひとつと言われていますが、その扱いは少し雑です。
雑というのは、含むヒトと含まないヒトがいるからです。
QCたか的には、含めていません。
層別というものに「ツール(道具)」がありません。
あくまでも考え方です。
層別の表現は、他の7つ道具である「チェックシート」や「グラフ」などに依存します。
関連記事をご参照ください。
層別を見てみよう
グラフで見ると、より理解が深まると思います。
あるデータから身長の分布を書いてみました。
このグラフは層別前になります。
分布の中心は160cmぐらいです。
つまり平均身長は160cmです。
分布の裾野は広がっていて、上は、280cm!?下は40cm!??
このグラフに何か意味はあるでしょうか?
一般的な赤ちゃんより小さい身長、世界びっくり人間で出演するような巨人。
実は、このグラフには、3つのレイヤーを一緒にまとめています。
それでは、レイヤーを分割してみましょう。
いかがでしょうか。
先ほど示したグラフは「園児の身長(水色の線)」「高校生の身長(オレンジ色の線)」「NBA選手の身長(灰色の線)」のデータをひとつにして表現したものでした。
それぞれで層別をすると、先ほどのような意味不明な分布を示していません。
それぞれは、それぞれの範囲で分布をしています。
例えば「園児」であれば、平均身長は110cm、分布の上側は130cm、下側は90cmと、現実の印象と一致します。
先ほどの一般的な赤ちゃんより小さい40cmなんて数字になりませんね。
「園児」と「NBA選手」の身長差は100cmもあります。
このような大きい差を、ひとつにまとめて分析をしてしまうと、下側(園児)も上側(NBA選手)も含めたばらつきを考慮して計算をしてしまうので、このような意味不明な結果になってしまいます。
層別はチェックシート作りから始まる
「園児」「高校生」「NBA選手」のデータであると、把握できているからこそ、分布を分けて表現することができています。
単純に身長のデータを集めてきて、識別もしないでチェックシートを作っていたらどうでしょう。
上司「この分布おかしいから、層別してみて」
部下「はぁ。実は、どのデータがどこから取って、何のデータなのかもう判別できないのです」
上司「はぁ?このデータ取るのに予算いくら使ったと思ってんの!?」
部下「ひぇぇ~・・・」
このような事態は避けなければいけません。
「データを取り直す」という行為は、口言うほど簡単ではありません。
再測定で、まったく同じデータは取れませんし、時間、時期、測定器が過去とまったく同じ状態になることはありません。
そのことで、まったく別のデータになる可能性だってあります。
ですから、その一瞬一瞬が勝負であるわけです。
参考に今回使用したチェックシートをお見せします。
グラフ化するために「散布図」を使用することを最初から想定しています。
よって、タテに身長データが並ぶように配置しています。
ヨコには各要素(園児、高校生、NBA選手)を並べ、そのデータをそのまま参照するように「全体」という要素を入れておきました。
各要素は、階段状にしてデータを配置しています。
このようにすることで系統をしっかり分けることができます。
自分がどのようにグラフを作りたいのか、そのグラフはExcelでどのように作ればムダなく作れるのか、自身イメージにピッタリあうように、想像しながらチェックシートを作っていきましょう。
そのイメージにアジャストしたとき、最高に心地よい時間があなたを歓迎してくれますよ。
オススメ書籍
リンク
有名なシリーズ本のうちの1冊です。
品質管理従事者は必ず見る書籍ですね。
今回の層別とはつながらない、と思う方もいるかと思いますが、最適な層別には、適切なサンプリングが必要です。
サンプリングを制するものが層別を制するのですね。
避けられない1冊だからこそ、この手の教科書を一度見ておくことをオススメします。