技術者に必要な統計知識

         
統計に関するミニ知識初級編
   
“全体を代表する相加平均”

 
    
“倍率の平均(相乗平均)”

   
“速さの平均(調和平均)”

 
    
“目標値や平均値からの差”

   
“全体のばらつきを表す変動と自由度”

 
    
“変動を分解する”

   
“変動の平均を表す分散”

 
    
“標準偏差”

   
“実験の計画に必要な直交表”

 
    
“各種の直交表”



初級編の次は、中級編にチャレンジしてください。


『高品質・低コストの作り込み』を雑誌に執筆しました。


『よくわかる「レイアウト改善」の本』を出版しました。


『絵でみる原価計算のしくみ』を出版しました。


あるクライアントのホームページに私の紹介記事が載りました。


“統計に関するe-ラーニング(動画+音声)のサイトです。”


経営革新・原価革新に関するコンサルティング、社内研修会、講演会などのお問い合わせはメールでお願いします。



全体を代表する相加平均
相加平均(算術平均ともいう)には、単純相加平均と加重相加平均があります。

■単純相加平均

単純相加平均は、すべての数値を足して、その合計を個数で割って求めます。1個400gのりんごと1個380gのりんごがあります。このとき平均の重さは何グラムでしょうか?

これは単純に以下の式で計算します。



■加重相加平均

Aの容器には20%の食塩水200g、Bの容器には5%の食塩水100gが入っています。まぜると平均何%の食塩水になるでしょう。



食塩の量に着目するとAの容器には200g×0.2=40g、Bの容器には100g×0.05=5gの食塩が入っていますので、平均は以下の式になります。



このような平均を加重相加平均といいます。


倍率の平均(相乗平均)
ある店の3ヶ月の売上高は、10万、20万、200万でした。売上高は2倍、10倍となったわけですが、このとき平均の売上高倍率は何倍でしょうか。

平均=(2+10)÷2=6(倍)とすると、平均売上高は、2ヶ月目は、10万×6=60万円、3ヶ月目は、60万円×6=360万円となり、適した平均とはいえません。

この平均倍率は、相乗平均と呼ばれ、次の式で計算します。





この平均を用いると、2ヶ月目は、10万×4.5=45万円、3ヶ月目は、45万円×4.5=202.5万円となります。

■練習問題
5、10、20、40、700の相乗平均を計算してください。 
解答はこちら


速さの平均(調和平均)
片道36Kmの道路を、行きは平均時速18Km、帰りは平均時速12Kmで往復しました。このときの平均時速は何Kmでしょう。



このとき、単純に(18+12)÷2=15(Km/h)とするのではなく、行き36÷18=2(時間)、帰りは36÷12=3(時間)なので5時間かかったことになり、往復72km ÷5=14.4(km/h)となります。

これを一つの式で書くと次のようになります。



データの数をデータの逆数の和で割った平均を調和平均といいます。


目標値や平均値からの差
あるテストの平均点がA組では70点でした。最高点100点の人もいれば、最低点20点の人もいました。


B組も平均点は70点ですが、最高点90点、最低点40でした。


データ(点数)のばらつきを統計学では「偏差」といいます。偏差には「平均値からの偏差」と「目標値からの偏差」の2つがあれます。

■平均値からの偏差

次のデータは、5人の人間の身長です。


1番目の人は、172.60cmなので平均値との差は次のようになります。

172.60-174.96=-2.36

これを「平均値からの偏差」といい、5人の偏差を以下に示します。


平均値からの偏差の和はゼロになります。


■目標値からの偏差

長さ10.0cmの部品作る目的で、



5個の試作品を作りました。



1番目の部品は、長さが9.7cmなので目標値との差は 9.7-10.0=-0.3 です。このような目標値からの差も偏差といいます。



全体のばらつきを表す変動と自由度
偏差は、平均値からの偏差であろうと、目標値や理論値からの偏差であろうと、その値は、正になったり、負になったり、ゼロになったりします。一般に、いろいろな値をとる偏差があるとき、偏差の大きさの全体を一つの数値で表すには、どのようにしたらよいでしょうか。



偏差を合計しても全体を表すことにはなりません。平均からの偏差は、合計するとゼロになってしまいます。そこで、偏差を2乗する方法が考えられました。これを変動といい、2乗した変動の和を全変動といいます。



一般式で表すと、以下のようになります。
n個の観測値をy1、y2、…、yn:yの目標値をy0としたとき、偏差(y1−y0),(y2−y0),…の2乗和を全変動といい、(1)式のようにSTで表します。



(1)式の全変動は、n個の変動を2乗したものの合計なので、全変動の大きさは、データの数に影響されます。全変動STの中の2乗の個数をその自由度といい、記号fで表わします。(1)式の自由度fはnになります。

■練習問題
プラスチックの射出成形の工程で、成形品の目標重量からの差が以下の表です。10個のデータはいずれも過剰重量でした。



全変動と自由度を求めてください。 
解答はこちら


変動を分解する
統計学では、全体のばらつきを表すのにデータを2乗して変動を求めますが、この意味を考えてみましょう。

ある部品の特性として、Y1、Y2、…、Ynというn個のデータと、これらの値に対する目標値(設計値)をmとしたときの
全変動は( 3)式で表せます。


(3)式の3行目から4行目の展開は、各自で証明してください。

(3)式の全変動は、目標値からの差の2乗の合計なので、理想的な状態は(3)式が最小になるときです。(3)式ではy1、y2、…、ynは求められた値であり、nは選んだものですから、両方とも既に与えられたものになります。つまり、第1項と第3項は既に与えられた値をとります。

(3)式の第2項は、mの値により求められ、第2項の括弧の中が0になれば右辺の値は最小になります。その時のmの値は、(4)式で求められます。


(4)式は、m(目標値)がyの平均と一致したときに、個々のデータのmからの差の2乗和が最小になることを示しています。mがyの平均と一致すれば、(3)式の第2項はゼロとなるので、(3)式のmにyの平均を代入すると(5)式に変形できます。


この(5)式を更に変形すれば、(6)式になります。


(6)式では、目標値(設計値)mとyの平均が一致しているので、y1、y2、…、ynは偏差であり、左辺は全変動STを表します。右辺の第1項は一般平均の変動(修正項)と呼ばれ、平均値が目標値からずれている程度そのものであり、記号Smで表します。

また、第2項はyの平均値からの偏差の2乗和で、誤差変動と呼ばれ記号Seで表します。具体的な計算は、Se=ST-Smで算定します。


このように全変動STを一般平均の変動Smと誤差変動Seに分けること(これを2乗和の分解と呼ぶ)により、次のことが考察できます。

全変動STの中で一般平均の変動Smが大きいときは、対象製品の平均値が目標値から大きくずれていることを表しています。また、誤差変動Seが大きいときは、製品個々の値の差が大きいことを意味します。

このように、SmとSeの間には技術的な意味やそれに対する対応策が全く異なることが多いので、SmとSeの違いを区別することはコストダウンを展開する際のキーになります。

■練習問題
プラスチックの射出成形の工程で、成形品の目標重量からの差が以下の表です。10個のデータはいずれも過剰重量でした。



全変動、一般平均の変動、誤差変動を計算してください。
解答はこちら


変動の平均を表す分散
全変動をその自由度で割ったものを分散と呼びます。自由度は全変動を求めるときの2乗した個数なので、全変動の平均を表します。


上図の長さ10.0cmの部品の例では、分散は以下のようになります。



誤差変動Seをその自由度で割ったものが誤差分散であり、記号Veで表します。



誤差分散Veは(13)式で計算しますが、分母の(n-1)が誤差変動Seの自由度です。なぜ(n-1)になるか簡単に説明します。

誤差変動は以下の式で求めます。


(14)式では、n個の2乗から1個だけ2乗の数が引かれています。このために、Seの自由度はn-1となります。


標準偏差
分散は2乗の合計の平均です。2乗をもとに戻すためにルートをとったものを標準偏差(σ)といいます。

長さ10.0cmの部品の例では、標準偏差は以下のようになります。



もとのデータがばらついているほど、標準偏差の値は大きくなります。平均値は同じでも、標準偏差が違うとデータの持つ特性は異なります。





実験の計画に必要な直交表
設計上の要因としてA、B、Cの3種を2通りずつ取り上げることを考えてみてください。これをAが2水準、Bが2水準、Cが2水準であるといいます。

A、B、Cのあらゆる組合せは、以下の8通りです。

1.A1B1C1、2.A1B1C2、3.A1B2C1、4.A1B2C2
5.A2B1C1、6.A2B1C2、7.A2B2C1、8.A2B2C2

このように、いくつかの要因(因子)の水準があるとき、そのすべての組合せを多元配置といいます。

これに対して、予め決められた特定の組合せで多元配置と同じ効果をだすために考えられたのが直交表です。直交表には数多くのものがありますが、最も規模の小さいものが、以下の直交表L4と呼ばれているものです。


図表のNoは、実験番号又は割付番号と呼ばれ、1から4まであります。一方、縦の列は直交表の列と呼ばれ、どの列も1と2という数字4個ずつから構成されています。

二つの列がいずれも1と2という数字を含んでいて、4通りの組合せ(11)、(12)、(21)、(22)が同じ回数で現れる場合、その2列は直交しているとか、バランスしているなどといわれます。

直交表L4の3列の中から、任意の2列をとって(11)、(12)、(21)、(22)の組合せの数を数えれば、いずれも直交していることがわかります。

直交表L4は、4行3列から構成されており、各行各列の数字は1と2で水準を表しています。三つ列に2水準の因子を対応させると、各行は因子の水準組合せを示すことになります。

先に述べたように、2水準の因子が三つあるとき、多元配置では8通りの組合せでしたが、直交表L4に従った組合せでは4通りだけが実験対象になります。どういう4通りになるかは、どの列にどの因子を対応させるかによりますが、A、B、Cを1、2、3列に対応させれば、次の4通りになります。



各種の直交表
直交表には2水準系、3水準系、混合系などがありますが、その一例が以下です。

■直交表L8 2水準の因子を最大7



■直交表L9 3水準の因子を最大4



■直交表L12 2水準の因子を最大11



■直交表L16 2水準の因子を最大15



■直交表L18 2水準の因子を最大1、3水準の因子を最大7



■直交表L27 3水準の因子を最大13



■直交表L36 2水準の因子を最大11、3水準の因子を最大12



5、10、20、40、700の相乗平均の解答



5乗根の計算は、Logの性質を利用します。








全変動と自由度
全変動



自由度 f=10


全変動、一般平均の変動、誤差変動



ここで大切なことは、Smを計算するときの桁数です。有効桁を2乗したときには、2乗したときの桁には四捨五入の誤差が入らないように、さらに2桁余計の計算をして、そこで丸めます。


小川正樹のホームページへ戻る
このホームページの作成は小川正樹個人です。


経営革新・原価革新に関するコンサルティング、社内研修会、講演会などのお問い合わせはメールでお願いします。

このサイトに含まれる、一部あるいは全ての内容や画像のデータを許可なく無断で転載/複製/配布する事を禁止します。
All graphics and page design, Copyright (c)2002 Masaki Ogawa All Rights Reserved.
For any comments and questions,please E-mail to:masa21ogawa@kjps.net .