最終更新日:2023年8月15日
どうも、おばんです。QCたかです。
品質管理では「ヒストグラム」をよく使用します。
「ヒストグラフ」ではありませんよ。
QCたかオススメの作り方を紹介しますね。
最後まで、見て行ってください。
目次:
ヒストグラムとは
ヒストグラムは、「棒グラフ」です。
ですから、単純に「棒」を何本も横並びにしたグラフです。
単純な「棒グラフ」との違いは、
- 棒の幅に数値データを設定している
ことです。
明確にこの1点のみです。
「棒グラフ」の場合、例えば、トマトが30個あった場面を考えましょう。
「棒ブラフ」はトマトというカテゴリについて、縦方向に30個のデータを積むのですね。
ですから、棒の横幅には、何もパラメータがありません。
つまりデータが何も入っていないのですね。
「ヒストグラム」の場合、例えば、身長165cm~170cmのヒトが25名いた場面を考えましょう。
身長160~170cmのカテゴリについて、縦方向に25名のデータを積みますね。
「データを積む」ことは棒グラフと同じですね。
しかし、横軸には、身長160cm~170cmというパラメータが設定されています。
つまり、棒の横幅には明確な数値データが入っています。
棒の幅に数値データがあるわけですから、
棒の幅×データの積み上げ=面積
で表現できますね。
単純に「ヨコ×タテ」で面積です。
つまり「面積」が集まったグラフが「ヒストグラム」となります。
「グラフなんだから『ヒストグラフ』じゃん!?」
と言わないでください。
「ヒストグラム(histogram)」でひとつの言葉ですから。
ヒストグラム histogram
計量特性の度数分布のグラフ表示の一つ。
測定値の存在する範囲を幾つかの区間に分けた場合、各区間を底辺とし、その区間に属する測定値の度数に比例する面積をもつ長方形を並べた図。(Z8101-1)
ークォリティマネジメント用語辞典(2004年 吉澤正 日本規格協会)より抜粋
ヒストグラムから何がわかる?
ヒストグラムは、QC7つ道具にラインナップされています。
メジャー級に重要なツールになりますので、ぜひ、理解し使いこなせるようにしましょう。
ヒストグラムを使用する目的は、
- 分布の形を見たい!
これにつきます。
「分布」というのは、「データが散らばっている様」と考えればよいでしょう。
まったく同じデータが続くことはありません。
必ずランダムに発生します。
ランダムに発生したデータは、あるばらつきをもって散らばるわけです。
この散らばりを分布と呼び、分布を一目で理解できるようにするツールが「ヒストグラム」です。
ヒストグラムを見ることで、
「あれ?昨日のデータとなんか違うな」とか
「想像していたより、大きい方にデータがシフトしているんですけど」など
に気付けます。
数字の羅列だけ見ても、ヒトは理解できませんから、ヒストグラムで見える化してあげることが大切なのですね。
ヒストグラムは、その分布の形で、問題点を把握することができます。
- 一山分布(正常な状態)
- 二山分布(層別が必要)
- 離れ小島分布(別のデータが混入9
- 絶壁分布(意図的に操作されている)
一山分布とは
ヒストグラムが、この分布になっていることを基本としています。
世の中のデータは、おおむね、平均値を中心かつ頂点にして、左右対称になだらかに減っていく釣鐘型の分布をします。
釣鐘というのは、教会にあるカラーンコローンと鳴る鐘のことですよ。
この釣鐘型の分布を「正規分布」と呼ぶのですが、品質管理手法は、この「正規分布」を前提にした議論が多くされます。
ヒストグラムが一山分布だった場合、「データが正規分布している安定状態だ」と考えてよいです。
そのうえで、データが全体的に大きくなっている、とか、バラツキが大きいとかを議論していくことになります。
関連記事:
ヒトは「正規分布」する |
二山分布とは
二山分布は、そのまま、山の頂点が2か所に現れることです。
それは、正規分布した2つの要素が混ざったデータになっている、と考えてよいです。
このような場合、データの取り方に問題はなかったか、振り返る必要があります。
例えば、機械Aで作ったハンバーグと、機械Bで作ったハンバーグのデータ(例えば、重さ)を一緒にしてヒストグラムを作った場合を想像してください。
機械Aは、重量センサーが狂っていて、正確な重さで作れていません。
そのような場合、機械A側のハンバーグは全体的に重くなっています。
その差に気付かず、データを機械A、B一緒にヒストグラムを作ると、二山分布の出来上がりです。
逆に言えば、この異常に気付かせてくれるのが「ヒストグラム」の良いところですね。
この考え方は、「層別」になります。
データの発生場所を把握し、データを分ける。
このひと手間が「問題解決のための現状把握」に必要な姿勢です。
離れ小島分布とは
チョコン、とデータが外れているところがあります。
これは、まったく異なるデータが混入しているケースです。
例えば、ハンバークの重さデータに、鉄板まで含めちゃったデータが数個紛れている、とか、小数点の位置を入力間違いした、とかが考えられます。
データのミスというよりは、人為的ミスの要素が大きそうです。
データを振り返って、間違いがないか確認しましょう。
絶壁分布とは
分布が途中ですっぱり切れちゃっている分布です。自然に正規分布していれば、分布がすっぱり切れることは、確率的に発生しません。
つまり、何らかの意思が働いている、ということですね。
例えば、身長170cm以上のヒトしか乗れないジェットコースターがあります。
そうすると、分布は10cm以下は「ゼロ」、つまり、すっぱり切れています。
このような、意図がある分布を絶壁分布と呼んでいます。
QC7つ道具については、関連記事も合わせて読んでみてくださいね。
ヒストグラムをかいてみよう!
ヒストグラムは「棒グラフ」ですから、かくこと自体は簡単です。
その準備に、若干手続きとテクニックが必要なのですが、頭を抱えるような内容でもありません。
やってみましょう。
まずはExcelのアドイン実行!
QCたかはExcelの「データ分析」ツールを使っています。
このツール、初期状態では隠れていて使えません。
よって、アドインで「データ分析」ツールを追加しましょう。
追加の方法は、
- Excelのファイルタブから「オプション」を選択
- 「アドイン」→「分析ツール」→「設定」と順番にクリック
- 「分析ツール」にチェックして「OK」をクリック
Excelのファイルタブから「オプション」を選択します。
「オプション」は下の方にありますので、見落とさないでください。
Excelの「オプション」メニューが表示されます。
「左側の一覧」に「アドイン」がありますのでクリックしましょう。
「右側の一覧」に「分析ツール」が表示されていますので、クリック。
下側に「設定」がありますので、こちらもクリック。
「アドイン」というウィンドウが表示されます。
「分析ツール」をクリック、左端のチェックボックスをチェック。
最後に「OK」をクリックしましょう。
これで設定は完了です。
「データ」メニューをクリックし、右端に「データ分析」が表示されていることを確認しましょう。
チェックシートを準備しよう!
ヒストグラムに必要なパラメータは1つだけです。
今回は身長のデータを100個準備しています。
そして、これらのデータをチェックシートにします。
チェックシートは簡単ですね。
「棒の横幅(区間)」を決めよう!
棒の横幅(区間)は、明確に決まりはありません。
とは言っても、見やすくて、判断を誤らない横幅(区間)を設定しなければいけません。
基本の考え方をベースに、何回かヒストグラムを作り、一番説得力のあるものにしましょう。
基本の考え方は、
- データの最大値を求める
- データの最小値を求める
- 最大値ー最小値で範囲を求める
- 範囲の平方根を求める
になります。
【データの最大値を求める】
Excelの関数を使用し、データの最大値を求めましょう。
まずは、チェックシートを新たに作ります。
計算式を表の計算結果に入力します。
Excel関数:
=MAX(データの最初:データの最後)
手順を説明しますね。
- 「F4」セルをクリック
- 「=max(」まで入力します
- 「C3」セルをクリック
- 「Shiftキー」+「Ctrlキー」(同時押し)→「↓(下)キー」を押す。
- 一気に選択されたので、最後に「)」を入力し「Enterキー」
これで、OKです。
結果が出力されます。
4項のテクニックは、とても使えます。
「Shiftキー」を押しっぱなしで「方向キー」を押すと、押した方向のセルが選択されます。
「Ctrlキー」を押しっぱなしで「方向キー」を押すと、その方向に入力されている最後のセルまで一気に飛びます。
つまり、「Shiftキー」と「Ctrlキー」を同時押しで、押しっぱなしにしたまま、方向キーを押すと、その方向に入力されている最後のセルまで一気に選択されます。
ヒストグラムは、データ数が多いので、マウスでドラッグしていくのは、しんどいです。
1000、10000もあるデータであればなおさら。
このような時短テクニックはぜひ覚えておきましょう。
【同様にデータの最小値を求める】
最小値を求めていきます。
Excel関数:
=MIN(データの最初:データの最後)
【範囲を求める】
次に、最大値と最小値の幅、つまり「範囲」を求めます。
次に、最大値と最小値の幅、つまり「範囲」を求めます。
計算式:
=最大値(F3)-最小値(F4)
【範囲の平方根を求める】
平方根は、いわゆるルートですね。
これも関数で求めていきましょう。
Excel関数:
=SQRT(範囲)
「6~7」にしなければダメ!
ということはありません。
迷うときは実際にかいてみることが一番ですね。
「区間」を設定しよう!
「区間の幅」は決まったので、実際に区間を決めましょう。
今回は「幅を『5』」に設定しました。
データはの最小値は「145」、最大値は「190」でした。
少なくても、「145」と「190」が含まれていなければなりません。
それでは、Excelにデータを入れますね。
最小値は「145」でした。
そして幅は「5」に設定しました。
今回のヒストグラムは、「最小値-1区間」から作ります。
つまり「140から」です。
いよいよ、完成!
お待たせいたしました。
準備が全部終わりました。
ヒストグラムを作りましょう。
メニューの「データ」→「データ分析」を選択しましょう。
「データ分析」のウィンドゥが出たら、「ヒストグラム」を選択し、OKをクリックしましょう。
「ヒストグラム」のウィンドゥが出てきます。
「入力範囲」にはデータを、「データ区間」には区間をそれぞれ指定しましょう。
あとは、データの出力する場所をお好みで決めて、「グラフ作成」のチェックボックスにチェックを入れて、OKです。
はい、完成です。
「頻度」は、区間に含まれるデータが何個あるかを示しています。
このデータさえあれば、ヒストグラムはかけるわけですね。
「グラフ」を作成すると、勝手にグラフを作ってくれます。
「次の級」が含まれていますが、お好みで消したりしましょう。
参考にしてください
区間を、「5」「6」「7」「8」に設定してヒストグラムをかいてみました。
大きな違いはないですね。
見た目と、説明のしやすさ、説得力など。
これらを考慮して、選択すれば大丈夫です。
もちろん、データによって性格はバラバラですから、彼らのキャラクターが活かせるようにプロデュースしてあげてくださいね。
参考記事として、秒でかけるヒストグラムを紹介しています。
そちらも、使い方を理解していれば、十分使えるツールですので、参考にしてみてくださいね。
オススメ書籍
リンク
Excelを操作して、グラフ化や統計分析は、簡単にできるものです。
専門的な統計ソフトも種々ありますが、専門化でなければ、Excelで十分です。
このような書籍を手元において「迷ったら見る」を習慣付けましょう。
QCたかの本記事も「お気に入り」にしてもらえれば、すぐ見れますね!