وزارت علوم،تحقیقات و فناوری
دانشگاه علوم و فنون مازندران
پایان نامه
کارشناسی ارشد
رشته: مهندسی صنایع صنایع
عنوان/موضوع:
طراحی و بکارگیری کنترل کیفیت چند متغیره در یک سیستم تولیدی
استاد راهنما:
جناب آقای دکتر ایرج مهدوی
استاد مشاور:
جناب آقای دکتر علی تاجدین
دانشجو:
مزدک دال کوهی
زمستان 92
تقدیم به
مادرم
و روح پدرم

و تمام کسانی که مادی و معنوی پشتیبان من در پیشرفتم بوده اند
تشکر و قدردانی
پروردگارا برای پیشرفتم تو را سپاس گذارم،از اینکه همواره برایم بهترین را خواستی تو را شکر گویم.
در اینجا لازم می دانم از تمام عزیزان،اعم از اساتید وکارشناسان و نیز دوستان خوبم که من را در تهیه این پروژه راهنمایی و ارشاد کرده وبه هر نحوی پشتیبان من بودند تشکر کنم و توفیق روزافزونشان را از خدا خواستارم.
تشکر ویژه من از جناب دکتر مهدوی و دکتر تاجدین است که جز با راهنمایی ایشان این پروژه به سرانجام نمی رسید. همچنین دکتر حمید اسماعیلی دوست و مشاورم که من را به حوزه کیفیت آشنا و علاقه مند کرد. قدردانی من را پذیرا باشید.
بدون حمایت همه جانبه خانواده این امکان برایم محیا نبود که تحصیلاتم را تا اینجا ادامه داده و پله های ترقی را طی کنم.امیدوارم همواره سایه ایشان بالای سرم باشد.خدایا توانایی شاد کردنشان را برایم فراهم کن.
چکیده
امروزه تولید صنعتی نیازمند نمودارهای کنترل کیفیت چند متغیره برای پایش توام چند مولفه کیفی است ؛ علاقه به چنین نمودارهایی حتی در زمینه های غیر تولیدی نیز افزایش یافته است. در این پایان نامه سعی شده است رویه های کلی نمودارهای چند متغیره بررسی شود ، سپس با آنالیز مولفه های اصلی بهترین ترکیب خطی از مولفه های کیفی بدست آید که تغییرات را پوشش بیشتری می دهند ؛ همچنین متغیر یا متغیرهای کیفی که باعث حالت خارج از کنترل می شوند را مشخص می کند.
برای مقایسه روش چند متغیره با روش تک متغیره ابتدا با مثالی شبیه سازی شده روش چند متغیره برای تولید نمودار T^2 را برای تغییر پذیری درونی و کلی نمونه ها شرح می دهیم ، سپس با یک مثال تولیدی از شرکت شیر پگاه فارس روش های فوق را برای شش متغیر در عمل مشاهده می کنیم. در نهایت با آنالیز مولفه های اصلی (PCA) بهترین ترکیب خطی را که می تواند با تعداد متغیر کمتر ، بیشتر تغییرات این متغیر هارا نمایش دهند را به دست می آوریم.
واژگان کلیدی : کنترل کیفیت چد متغیره ،نمودار T^2 ، تغییر پذیری درونی ، آنالیز مولفه های اصلی
فهرست رئوس مطالب
صفحه عنوان…………………………………………………………………………………………….. ب
صفحه تقدیم………………………………………………….………………………………………… ج
صفحه تشکر…………………………………………………………………………………………….. د
چکیده ……………………………………………………………………………………………………ه
فصل اول : مقدمه و کلیات تحقیق
1-1 مقدمه………………………………………………………………………………………………. 2
1-2 هدف تحقیق ………………………………………………………………………………………..3
1-3 ضرورت و اهمیت تحقیق ……………………………………………………………………………3
1-4 سوال تحقیق………………………………………………………………………………………… 4
1-5 مفروضات………………………………………………………………………………………….. 4
1-6 کلمات کلیدی و تعاریف مربوط…………………………………………………………………… 4
1-7 قلمرو موضوعی،مکانی و زمانی ……………………………………………………………………..5
1-7-1 قلمرو موضوعی ………………………………………………………………………………….5
1-7-2 قلمرو زمانی ……………………………………………………………………………………5
1-7-3 قلمرو مکانی …………………………………………………………………………………..5
1-8 معرفی شرکت پگاه فارس ………………………………………………………………………………………………….6
فصل دوم : ادبیات و پیشینه تحقیق
2-1 تاریخچه کنترل کیفیت آماری………………………………………………………………………………………….. 8
2-1-2 تعریف کنترل کیفیت…………………………………………………………………………. 8
2-3 اصول آماری نمودار کنترل………………………………………………………………….…… 10
2-4 مرور ادبیاتی و کارهای مرتبط…………………………………………………………………… 13
فصل سوم : روش تحقیق
3-1 توزیع نرمال چند متغیره در کیفیت……………………………………………………………… 16
3-2 کنترل کیفیت با اهداف تعیین شده خارجی…………………………………………………….. 30
3-3 کنترل کیفیت با اهداف چند متغیره از درون فرآیند – مطالعات کارایی فرآیند چند متغیر……….. 43
3-4 کنترل کیفیت با اهداف از نمونه مرجع……………………………………………………………. 55
3-5 ارزیابی داده ها با نمودارهای کنترل چند متغیره………………………………………………… 62
3-6 شناسایی مشخصات خارج از کنترل………………………………………………………………. 66
3-7 کاربردهای اجزاء اصلی………………………………………………………………………… 67
فصل چهارم : تجزیه و تحلیل داده ها
4-1 مقدمه…………………………………………………………………………………………….. 73
4-2 اندازه گیری متغیر های کنترل………………………………….…………………………………. 73
4-3 محاسبات نمودار تک متغیره……………………………………………………………………… 84
4-4 تشکیل ماتریس همبستگی ………………………………………………………………………88
4-5 محاسبه و رسم نمودار T^2 ………………………………………………………………………88
4-6 بررسی اینکه آیا با متغیرهای کمتر نیز جوابگو کیفیت مورد نظر می باشد…………………………. 90
فصل پنجم : نتایج و پیشنهادات
5-1 مقدمه و خلاصه تحقیق…………………………………………………………………………. 92
5-2 نتیجه گیری…………………………………………………………………………………….. 92
5-3 محدودیت های تحقیق…………………………………………………………………………. 93
5-4 پیشنهادات برای تحقیقات آتی……………………………………………………………………. 94
منابع و ماخذ
منابع ……………………………………………………………………………………………………95
فهرست جداول
جدول 2-1………………………………………………………………………………………..….25
جدول 2-2 …………………………………………………………………………………………. 26
جدول 2-3………………………………………………………………………………………….. 29
جدول 2-4 …………………………………………………………………………………………….30
جدول 2-5……………………………………………………………………………………………. 31
جدول 2-6……………………………………………………………………………………………. 32
جدول 2-7 …………………………………………………………………………………………….32
جدول 2-8 …………………….………………………………………………………………………34
جدول 2-9……………………………………………………………………………………………. 38
جدول 2- 10 ………………………………………………………..………………………………39
جدول 2-……………………………………………………………………………………………… 40
جدول 2-12………………………………………………………………………………………… 49
جدول 2-13 ………………………………………….……………………………………………..51
جدول 2-14………………………………………………………………………………………… 55
جدول 2-15………………………………………………………………………………………… 56
جدول 2-1…………………………………………………………………………………………… 66
جدول 4-1………………………………………………………….………………………………… 72
جدول 4-2 …………………………………………………………………………………………….83
جدول 4-3 …………………………………………………………………………………………..87
جدول 4-4………………………………………………………………………………………….. 87
جدول 4-5 …………………………………………………………………………………………..88
جدول 4-6………………………………………………………………………………………….. 89
فهرست تصاویر و نمودارها
نمودار 2-1………………………………………………………………………………………….. 15
نمودار 2-2 …………………………………………………………………………………………..16
نمودار 2-3 ……………………………………………………………………….………………….56
نمودار 2-4 …………………………………………………………………………………………….62
نمودار 2-5……………………………………………………………………………………………. 67
نمودار 4-1 …………………………………………………………………………………………….84
نمودار 4-2……………………………………………………………………………………………. 88
فصل اول
مقدمه و کلیات تحقیق
1-1مقدمه
موثر ترین راه برای کنترل کیفی محصولات ، روش های آماری می باشد که تصویری از وضعیت کل تولید را ارایه می دهد. در واقع تغییر پذیری به عنوان یک پدیده دائمی و جزء لاینفک محصولات تولیدی ، دلیل اصلی استفاده از روش های آماری برای بررسی و کنترل این تغییرات است . در واحد های صنعتی ، تا زمانی که از مواد ، ماشین آلات ، افراد و روش ها برای تولید استفاده شود مشکل تغییر کیفیت نیز وجود خواهد داشت و تا زمانی که این مشکل وجود داشته باشد ، روش های آماری کنترل کیفیت نیز لازم خواهند بود .
گرچه روش های چند متغیره برای داده های چند متغیره مناسبتر هستند ولی در عمل در صنایع ما معمول نیستند. از آنجا که کنترل کیفیت چند متغیره1 از محاسبات پیچیده تری برخوردار است اکثر کارشناسان کیفیت از روش های ساده تر و در عین حال با کارایی کمتر استفاده می کنند، این در حالیست که با رشد روزافزون استفاده از کامپیوتر در صنایع بسیاری از این محاسبات به راحتی امکان پذیر است.
از بزرگترین مزایای حالت چند متغیره نسبت به تک متغیره وارد کردن ماتریس همبستگی (واریانس-کوواریانس) در محاسبات است که از این طریق تاثیر متغیرها بر هم بررسی شده و بدین ترتیب دید جامعتر و بهتری به داده ها خواهیم داشت.
مهمترین کار در این زمینه توسط Hotelling در سال 1947 انجام شده است. وی روشT^2 را توسعه داد و ازآن در نمودارهای کنترل استفاده نمود.در سال 1960 با پیشرفت تکنولوژی کامپیوتر ، کنترل آماری فرآیند چند متغیره بسیار مورد توجه قرار گرفت و بحث کنترل همزمان چندین مشخصه کیفی در سطح وسیعی مطرح شد.نمودار T^2 در کشف یک وضعیت خارج از کنترل بسیار خوب عمل می کند.نقطه ضعف عمده این نمودار آن است که علی رغم اینکه می تواند به درستی یک وضعیت خارج از کنترل را نشان دهد،در تعیین مشخصه های کیفی منحرف شده کمبود دارد.
1-2 هدف تحقیق
هدف اصلی از این تحقیق معرفی عملی کنترل کیفیت چند متغیره وکمک به گسترش روش های چندمتغیره در کنار روش های تک متغیره است تا با امید به پروردگار صنایع کشور با سرعت بیش از پیش ترقی کرده و به نقطه ای برسد که لایق جوانان این خاک و بوم باشد.
1-3 ضرورت تحقیق
همانطور که در چند دهه اخیر روش های تولید از کارهای جز که کارگران به سادگی انجام می دادند به سمت کارهای تخصصی رفته است کنترل کیفیت از روشی فقط برای کاهش محصولات معیوب به روشی برای بهبود فرآیند برای افزایش کیفیت در زمینه تولید و حتی خدمات و در نهایت افزایش رضایت مشتریان تغییر موضوع داده است ، این تغییر رویه خصوصا در دو دهه اخیر به وضوح قابل مشاهده است، یکی از بارزترین این تغییرات،تغییر دید نسبت به متغیرهای معرف کیفیت است که سابقا به صورت مجزا پایش می شدند و همبستگی بین آن ها نادیده گرفته می شد ولی اینک مجموع آنها با هم پایش شده و نتایج به دست آمده واقعی تر و مستندتر هستند.
1-4 سوال تحقیق
سوالاتی که پیش می آیند به قرار زیر است:
1- آیا می توان روش های چند متغیره را جایگزین حالت تک متغیره کرد؟
2- آیا این دو روش مستقل از هم کارایی یکسانی دارند؟
3- چگونه می توان با کاهش تعداد متغیرها تقریب خوبی از کیفیت را برآورد کرد؟
1-5 مفروضات مساله
1- داده ها توزیع نرمال دارند.
2- داده ها به ترتیب زمانی جمع آوری و ارزیابی می شوند.
3- هر بار نمونه گیری مستقل از سایر نمونه هاست.
1-6 کلمات کلیدی و تعاریف مربوط
نمودار T^2 هتلینگ2
این نمودار نظیر نمودار شوهارت تک متغیره است و بسیاری از محقان آن را نمودار شوهارت چندمتغیره می نامند (گرچه شوهارت هیچ نقشی در تعریف و گسترش آن نداشته است) و روند داده های چند متغیره را در طول زمان را نشان می دهد
اجزاء اصلی3
در این روش به هریک از متغیرها مقداری تخصیص داده می شود که در نهایت سهم هر متغیر در مقدار T^2 را تعیین می کند و این امکان را فراهم می کند که بتوان با متغیر های کمتر عوامل تغییر پذیر را شرح داد و زمانی کاربرد بیشتری دارد که تعداد متغیر ها زیاد باشد (مثلا بالای 5 متغیر).
تغییر پذیری درونی و کلی نمونه ها و فاصله از هدف
فاصله از مقدار هدف را با T_M^2 و تغییر پذیری درون نمونه را باT_D^2 نشان می دهند که حاصل جمع این دو تغییر پذیری کل یا T_O^2 را نتیجه می دهند. کارکرد آنها متناظر با نمودار(X ̅,R) یا (X ̅,S) است.
1-7 قلمرو زمانی،مکانی و موضوعی
1-7-1 قلمرو موضوعی
این تحقیق بر موضوع آشنایی عملی کارشناسان کیفیت با مباحث پایه کنترل کیفیت چندمتغیره تمرکز دارد، ابتدا به بیان این مباحث می پردازیم،سپس با مثالی عملی مراحل اجرای آن را نشان می دهیم و در آخر به مقایسه این رویه ها با رویه های تک متغیره می پردازیم.
1-7-2 قلمرو زمانی
بازه زمانی این تحقیق تابستان و پاییز 92 است، در این مدت سعی شد همزمان با مطالعات روش شناسی با داده های تولیدی یک کارخانه لبنیات کارایی عملی این روش ها بررسی و با نشان دادن کارایی آن ها زمینه فعالیت در این رشته جدید از کنترل کیفیت فراهم گردد.
1-7-3 قلمرو مکانی
کلیه داده ها از کارخانه پگاه فارس تهیه شده است. لازم به ذکر است به دلیل اینکه پارامتر های مورد مطالعه در مورد فرمول تولیدی یکی از محصولات این شرکت است،با احترام به درخواست مدیر کنترل کیفیت این کارخانه به جای اسم اصلی پارامترها آن ها را با شماره بیان می کنیم تا رسم رازداری شرکت ها در زمینه فرمول های اختصاصی را به جاآورده باشیم.
1-8 معرفی شرکت پگاه فارس
شرکت شیر پاستوریزه پگاه فارس يكي از شركتهاي بزرگ تحت پوشش شركت صنايع شير ايران مي باشد كه با بيش از نیم قرن تجربه در تولید و فرآوری شیر و سایر فرآورده های شيري ، با استفاده از دستگاههای مدرن و پیشرفته دنیا یکی از بزرگترین صنایع لبنی جنوب کشور محسوب می گردد و در حال حاضر با ظرفیتی حدود 450 تن تولیدات خود را با نام تجاری پگاه فارس در بسته بندی های کاملاً بهداشتی به بازار عرضه می نماید.
اين شركت در سال 1342با نام «كارخانه شير پاستوريزه شيراز» با ظرفيت 15 تن تاسيس و به منظور تأمين پروتئين حيواني مورد نياز شهروندان و استفاده كلان از شير خشك وارداتي و توليد شيربازساخته جهت مصرف دانش آموزان در سال 1346 به بهره‌برداري رسيد. كارخانه در سال1359 با كارخانه شير زرقان كه در سال 1353 تاسيس شده بود، ادغام و تحت عنوان«كارخانه شير منطقه اي فارس» شروع به فعاليت كرد. مساحت اين كارخانه 14 هكتار ميباشد و در 32 كيلومتري شمال شيراز واقع شده است و با ظرفيت اوليه 150 تن، يكي ازكارخانه هاي بزرگ تحت پوشش شركت صنايع شير ايران بوده كه به مرور با پيشرفت تكنولوژي و افزايش ماشين آلات، در حال حاضر با ظرفيت اسمي 450 تن توليد محصولات خود را در بسته بندي هاي جديد و بهداشتي با نام تجاري «شركت شير پاستوريزه پگاه فارس» به بازار عرضه مي نمايد.
این شرکت اکنون هشت رده از محصولات لبنی را تولید می کند که عبارتند از : ماست، شیر ، پنیر ، خامه ، کره ، کره ، کشک ، دوغ و فر آورده های پودری ؛ این محصولات در تنوع زیاد با جدیدترین ماشین آلات و پرسنل کارآمد با حفظ ارزش هایی نظیر حفظ سلامت جامعه ، مسئولیت پذیری و مشتری مداری و بهبود مستمر و نوآوری محصولات تولید و به مشتریان ارائه می گردند.
فصل دوم
ادبیات و پیشینه تحقیق
2-1تاریخچه کنترل کیفیت آماری
کنترل کیفیت قدمتی برابر با تولید دارد .هر آنچه انسان حتی قرن ها قبل از میلاد تولید کرده است دارای دقت و ظرافتی است که نشان از توجه سازندگان آن به کیفیت دارد . نگاهی بر دست ساخته های انسان باستان در موزه ها و یا عجایب هفت گانه جهان نظیر اهرام ثلاثه مصر ، مجسمه ابوالهول و دیوار چین تایید خوبی بر این مدعاست .
با شروع انقلاب صنعتی در اروپا در اواسط قرن هیجدهم میلادی و استفاده از ماشین آلات و ابزار دقیق در تولید ، روش های تولید نیز مدرن تر و پیچیده تر شدند . این تغییرات حجم تولید محصولات را بالا برد و روش های کنترل دقیق بودن و ظرافت نیز در آنها تغییر یافت . مقایسه روش های کنترل کیفیت تولیدات در سال های اولیه انقلاب صنعتی با آنچه که امروزه به چشم می خورد ، نشان می دهد که تغییرات در این بخش فوق العاده بوده است . این تغییرات که خواست عمده صاحبان صنایع و مصرف کنندگان بود ، در سال 1920 میلادی به ابداع کنترل کیفیت آماری منجر شد .
پس از اینکه نمودارهای کنترل شوهارت در صنایع مورد استفاده گسترده قرار گرفت،نمودارهای جمع تجمعی (CUSUM) ومیانگین متحرک موزون نمایی گام بعدی در پیشرفت کنترل کیفیت بودند.
در گام بعدی با پایش توام چند متغیر و تصمیم بر رسم توام آن ها نمودارهای چن متغیره مطرح شدند.مهمترین کار در این زمینه توسط Hotelling در سال 1947 انجام شده است. وی روشT^2 را توسعه داد و ازآن در نمودارهای کنترل استفاده نمود.در سال 1960 با پیشرفت تکنولوژی کامپیوتر ، کنترل آماری فرآیند چند متغیره بسیار مورد توجه قرار گرفت و بحث کنترل همزمان چندین مشخصه کیفی در سطح وسیعی مطرح شد.نمودار T^2 در کشف یک وضعیت خارج از کنترل بسیار خوب عمل می کند.نقطه ضعف عمده این نمودار آن است که علی رغم اینکه می تواند به درستی یک وضعیت خارج از کنترل را نشان دهد،در تعیین مشخصه های کیفی منحرف شده کمبود دارد.
2-2 تعریف کنترل کیفیت :
کنترل کیفیت یک کلمه مرکب از کنترل و کیفیت است که هر کدام تعاریف خاص خود را دارند .
کیفیت : وجود آن در یک محصول ، شایسته بودن آن را به مصرف گننده نشان می دهد . به عبارتی وجود کیفیت به معنای آن است که کالا ، انتظارات مصرف کننده را فراهم می آورد .
کنترل : به کار اعمال قوانین در پروسه تولید که تولیدکننده را در جهت دسترسی به نتایج مورد نظر مطمئن می سازد ، کنترل گفته می شود .
کنترل کیفیت در مواقعی فقط به بازرسی نهایی و جدا کردن محصولات فاقد کیفیت محدود می شود اما در مواردی فراتر از آن عمل می کند . به عنوان مثال به برنامه ریزی کیفیت ، کنترل مواد ورودی ، کنترل کیفیت در حین تولید ، کنترل مواد خروجی ، تجزیه و تحلیل و اقدام مقتضی در رابطه با مشکلات کیفی تولید و . . . می پردازد . در این حالت گزارشات مربوط به مسایل کیفی کمک بزرگی به حساب می آیند . در کل می توان گفت کنترل کیفیت سیستمی است که با اتکا به آن می توان کیفیت یک محصول یا یک فرایند تولید را به حد مناسبی رساند و با برنامه ریزی دقیق ، استفاده از ابزراهای کیفی ، بازرسی های مداوم و . . . آن را حفظ کرد و یا نسبت به بهبود مداوم آن گام برداشت .
کنترل کیفیت برای اولین بار در سال 1920 میلادی توسط دانشمندی به نام والتر شوهارت در آزمایشگاه شرکت تلفن بل آمریکا بنیان گذاری شد. وی در 16ام ماه می سال 1920، اولین تصاویر نمودار های کنترلی را رسم کرد و در مطالعات بعدی از آن بهره گرفت . والتر شوهارت بعد از 11 سال کار مداوم در سال 1931 میلادی نتایج تحقیقات خود را در کتابی با نام ” کنترل اقتصادی کیفیت محصول ساخته شده” منتشر کرد]1[.
موثر ترین راه برای کنترل کیفی محصولات ، روش های آماری می باشد که تصویری از وضعیت کل تولید را ارایه می دهد. در واقع تغییر پذیری به عنوان یک پدیده دائمی و جزء لاینفک محصولات تولیدی ، دلیل اصلی استفاده از روش های آماری برای بررسی و کنترل این تغییرات است . در واحد های صنعتی ، تا زمانی که از مواد ، ماشین آلات ، افراد و روش ها برای تولید استفاده شود مشکل تغییر کیفیت نیز وجود خواهد داشت  و تا زمانی که این مشکل وجود  داشته باشد ، روش های آماری کنترل کیفیت نیز لازم خواهند بود .
2-3 اصول آماری نمودار کنترل :
اساسا نمودار کنترل یک آزمون فرضیه است که به منظورارزیابی شرایط تحت کنترل بودن فرآیند از لحاظ آماری استفاده می گردد. خطای نوع اول و دوم در اینجا نیز وجود دارد.احتمال خطای نوعI بیانگر حالت خارج از کنترل است وقتی فرآیند تحت کنترل باشد و احتمال خطای نوع دو بیانگر حالت تحت کنترل است وقتی فرآیند واقعا خارج از کنترل است. مهمترین دلیل استفاده از یک نمودار کنترل،بهبود وضعیت موجود در یک فرایند است.
اگر فرایند تحت کنترل باشد تقریبا کلیه نقاط بین حدود کنترل رسم می گردند و روندشان روی نمودار تصادفی است. به طور کلی تا زمانی که نقاط بین حدود هستند فرایند تحت کنترل محسوب می گردد. فرم کلی حدود به صورت زیر است :
UCL= µ_w+kσ_w
CL= µ_w
LCL= µ_w-kσ_w
با افزایش k یعنی دور کردن حدود کنترل از خط مرکز احتمال خطای نوع اول کاهش و خطای نوع دوم افزایش می یابد،نزدیک کردن حدود کنترل تاثیر عکس دارد.در آمریکا از حدود 3 انحراف معیار و حدود هشدار 2 انحراف معیار استفاده می گردد و در اروپا این مقادیر به ازای α محاسبه می شوند. حدود هشدار برای حساسیت بیشتر نمودار به کار می روند]1[.
عامل مهم دیگر در تهیه نمودارهای کنترل بحث زیرگروه های منطقی است ، به طور کلی زیر گروه ها باید طوری باشند که در صورت وجود خطاهای با دلیل اختلاف بین زیرگروه ها حداکثر و اختلاف درون زیرگروه ها حداقل گردد. علاوه بر این اندازه نمونه و فراوانی نموه گیری نیز اهمیت دارد. به طور کلی تهیه نمونه های بزرگ سرعت پی بردن به تغییرات را افزاش می دهد ولی استفاده از نمونه های کوچک در فواصل زمانی کوتاه کاربرد بیشتری دارد.
در نمودارهای کنترل اگر مشخصه کیفی را اندازه گیری و به صورت عددی در مقیاس پیوسته ارائه کنیم آن را متغیر گوییم و به راحتی می توان آن را بر اساس معیار تمایل مرکزی و تغییرپذیری توصیف کرد. چنین نمودارهایی را کنترل برای متغیرها می نامند و شامل انواع زیر است :
نمودارهای کنترل X ̅ و R :
اگر مقادیر µ و σ معلوم باشند برای محاسبه حدود کنترل داریم:
UCL= µ+Z_(∝⁄2) σ/√n
CL=µ
LCL= µ-Z_(∝⁄2) σ/√n
ولی از آنجا که در عمل مقادیر µ و σ معلوم نیستند m نمونه n تایی میگیریم و پارامترها را تخمین می زنیم (معمولا 20≤m≤25و n=4,5,6)
x ̅=(∑▒x_i )/n →x ̿=(∑▒x ̅_j )/m for i=1,…,n j=1,…,m
R=x_max-x_min
R ̅=(∑▒R_i )/m for i=1,…,m
□(⇒┴ ) σ ̂=R ̅/d_2
و حدود کنترل عبارتند از:
{█(UCL= x ̿+3/(d_2 √n) R ̅@CL= x ̿ @LCL= x ̿-3/(d_2 √n) R ̅ ) □(⇒┴(3/(d_2 √n)=A_2 ) )┤ {█(UCL= x ̿+A_2 R ̅@CL= x ̿ @LCL= x ̿-A_2 R ̅ )┤
و برای حدود نمودار R داریم :
{█(UCL=R ̅+3σ ̂_R=R ̅+3d_3 R ̅/d_2 @CL=R ̅@LCL=R ̅-3σ ̂_R=R ̅-3d_3 R ̅/d_2 ) □(⇒┴█(D_3=1-d_3 R ̅/d_2 @D_4=〖1+d〗_3 R ̅/d_2 ) )┤ {█(UCL=D_4 R ̅@CL=R ̅@LCL=D_3 R ̅ )┤
نمودارهای کنترل x ̅ و S :
اگر واریانس نامعلوم باشد آن را می توان به وسیله برآوردگر نااریب واریانس نمونه تخمین زد :
S^2=(∑▒〖(x_i-x ̅)〗^2 )/(n-1)
اگر مقدار استانداردی برای σ وجود داشته باشد داریم :
{█(UCL=C_4 σ+3σ√(1-C_4 )@CL=C_4 σ@LCL=C_4 σ-3σ√(1-C_4 ))┤ □(⇒┴█(B_6=C_4+3√(1-C_4 )@B_5=C_4-3√(1-C_4 )) ) {█(UCL=B_6 σ@CL=C_4 σ@LCL=B_5 σ)┤
و اگر مقدار استانداردی برای σ نداشته باشیم آن را تخمین می زنیم :
S ̅=(∑▒S_i )/m for i=1,…,m
{█(UCL=S ̅+3 S ̅/C_4 √(1-C_4^2 )@CL=S ̅@LCL=S ̅-3 S ̅/C_4 √(1-C_4^2 ))┤ □(⇒┴█(B_4=1+3/C_4 √(1-C_4^2 )@B_3=1-3/C_4 √(1-C_4^2 )) ) {█(UCL=B_4 S ̅@CL=S ̅@LCL=B_3 S ̅ )┤
و برای حدود x ̅ داریم :
{█(UCL=x ̿+A_3 S ̅@CL=x ̿@LCL=x ̿-A_3 S ̅ )┤
لازم به ذکر است استفاده از نمودار R نسبت به S ̅ به دلیل سادگی بیشتر رایج تر است. اگر اندازه نمونه کوچک باشد نمودار R نسبت به پی بردن به وجود تغییرات کوچک از خود حساسیت چندانی نشان نمی دهد،بنابراین در مواقعی که باید تغییرات فرایند کنترل گردد معمولا از نمونه های بزرگ و نمودار S استفاده می گردد.
2-4 مرور ادبیاتی و کارهای مرتبط
تحقیقات داخلی را برخی افراد نظیر پروفسور نورالسنا و دکتر حسینعلی نیرومند انجام داده اند که به صورت مطالعه موردی در تالیفات یا مقالات خود آورده اند ولی از نظر تعداد در مقایسه با حالت تک متغیره منابع فارسی بسیار اندکی وجود دارد و مطالب و منابع کاربردی خارجی بیشتر در این تحقیق استفاده شده است.
در ذیل به برخی از این منابع مورد استفاده اشاره شده است:
پروفسور نورالسنا در کتاب خود به صورت پایه به معرفی کنترل کیفیت پرداخته اند و تمامی مسایل حالت تک متغیره را تحلیل و بررسی کرده اند. ]1[
دکتر حسینعلی نیرومند در کتاب خود با بیانی کاملا آماری مبحث کنترل کیفیت آماری را توضیح می دهند.]2[
آرتور یه در این مقاله پیرامون استفاده از نمودارهای چند متغیره برای نمایش ماتریس کوواریانس و تئوری های این موضوع بحث می کند. [3]
فریسن در مقاله ای روش های کلی تولید نمودارهای چند متغیره را شرح داده و روشی برای بازبینی آنها ارائه می دهد. [4]
کولو در مقاله خود به چولگی() و تیزی () توزیع چند متغیره می پردازد [5]
در منابع ]6[،]7[،]8[،]9[،]10[،]11[،]12[ در مورد روش جمع تجمعی صحبت شده است.
در منابع ]13[،]14[،]15[،]16[،]17[،]19[ پیرامون نمودارهای کنترل میانگین متحرک موزون نمایی بحث شده است.
هتلینگ روش T^2 را معرفی کرد و گسترش داد.]18[
ویردا در کتاب خود به بیان آماره هایی از جنس T^2 پرداخته است.]20[
سبر جزئیات تئوری تخمین برای نمونه های تصادفی را با قضایای بیان کرده است. ]21[
جکسون به بیان کلیاتی در مورد کنترل کیفیت چند متغیره پرداخت.]22[،]23[
هاکینز کنترل کیفیت چند متغیره را بر مبنای تنظیمات رگرسیونی بررسی کرده است.]24[
میسون در مورد تجزیه آماره T^2 تحقیق کرده است.]25[
مونتگومری در کتابی جنبه های عملی کنترل کیفیت چند متغیره را بیان کرده است.]26[
در منابع ]27[،]28[،]29[،]30[ پیرامون کنترل چند متغیره با مشاهدات منفرد بحث شده است.
فصل سوم
روش تحقیق
3-1 توزیع نرمال چند متغیره در کنترل کیفیت
در بیشتر بخش با فرض نرمال بودن داده‌های چند متغیره روش‌هایی را ارائه می‌د‌هیم که ما را قادر می‌سازد پارامترهای جمعیت را تخمین بزنیم، با استفاده از نمونه تصادفی ساده آزمون‌های فرضیه در مورد پارامترهای جمعیت چند متغیره بسازیم. آنالیز داده‌های چند متغیره در مقابل آنالیز جداگانه‌ی هر متغیر قرار می‌گیرد یک جنبه‌ی این تقابل ناشی از مشاهده‌ی همزمان چند عبارت احتمالی است، نظیر P آزمون فرضیه این موضوع مشکل مقایسات چند گانه را ایجاد می‌کند که نیازمند تعدیلات سطوح معنی4 برای دستیابی یک سطح معنی کل است. جزء دوم این تقابل توضیح ساختار همبستگی درونی این p بعد (p متغیر) است که روی سطح مفهوم کلی تأثیر می‌گذارد.
با توصیف توزیع نرمال چند متغیره شروع کرده سپس توزیع تست های آماری مختلف را پوشش می‌دهیم. بعد مختصراً به رویه‌های نرمال سازی داده‌های غیر نرمال اشاره می‌کنیم این بخش یک خلاصه و یک تئوری پایه‌ای برای بقیه‌ی بخش ها است .
توزیع نرمال چند متغیره:
یک بردار p بعد از متغیرهای تصادفی x=(x^((1) )…,x^((p) ) ) به طوری که L=1,…,p -∞<x^((l))<∞ را یک توزیع نرمال چند متغیره5 گویند اگر تابع چگالی آن به صورت زیر باشد.
f(x)=f(x^((1) ),…,x^((p) ))=〖(2π)〗^(-p/2) |∑|^(-1/2) exp{-1/2 (x-μ)^’ ∑^(-1) (x-μ)}
که در آن μ=(μ^((1) ),…,μ^((p) ) ) بردار ارزش‌های انتظاری6 است و داریم.
μ^((L) )=E(x^((L) ) ) L=1,..,P
و l,u=1,…,p , ∑▒〖=[δ_lu ] 〗 ماتریس کوواریانس 7(x^((1))…,x^((p))) است کهδ_LV=cov(x^((l))…,x^((u))) δ_LL=δ_L^2, می‌توانیم تابع چگالی X را با نماد زیر نشان دهیم:
x∽N_p (μ ,∑)
که N_p (., .) در آن نشاندهنده‌ی توزیع نرمال چند متغیره با پارامترهای مکانی و پراکندگی است.
وقتی p=1 باشد بردار تک بعدی’ x=(x^((1) ) ) توزیع نرمال با میانگین μ^((1) ) و واریانس δ_1^2 دارد یعنی
f(x)=1/(δ_1 √2π) exp^(-(x^((1) )-μ^((1) ) )^2/2δ_1^2 ) -∞<x^((1) )<∞
یا
x∽N_p (µ^((1)) ,δ_1^2 )
وتی p=2 باشد x=(x^((1) ),x^((2) )) یک توزیع نرمال دو متغیره با دو داده میانگین μ=(μ^((1) ),μ^((2) )) دو بعدی و ماتریس کوواریاسن ∑▒〖=[■(δ_1^2&δ_12@δ_21&δ_2^2 )] 〗است که δ_1^2 و δ_2^2 به ترتیب واریانسx^((2) ) , x^((1) ) ، δ_12=δ_21 کوواریاسن بین آنها هستند.
اگر ρ=δ_12/(δ_1 δ_2 ) باشد به ρ همبستگی بین x^((2) ) , x^((1) ) گویند.
اگر x^((2) ) , x^((1) ) مستقل باشند (ρ=0) توزیع دو متغیر‌ه‌‌ی بینشان حاصل ضرب دو توزیع نرمال تک متغیره است یعنی :
f_(ρ=0) (x^((1) ),x^((2) ) )=1/(2πδ_1 δ_2 ) exp(-(x^((1) )-μ^((1) ) )^2/(〖2δ〗_1^2 )-(x^((2) )-μ^((2) ) )^2/(〖2δ〗_2^2 ))
در حالت کلی (-1≤p≤1) توزیع نرمال دو متغیر به صورت زیر است:
f_ρ (x^((1) ),x^((2) ) ) = 1/(2πδ_1 δ_2 √(1-p^2 )) exp{-1/(2(1-ρ)^2 )(((x^((1) )-μ^((1) ))/δ_1 )^2+((x^((2) )-μ^((2) ))/δ_2 )^2-2ρ (x^((1) )-μ^((1) ) )(x^((2) )-μ^((2) ) )/(δ_1 δ_2 ))}
می‌توان مجموعه‌ای از مقادیر که شامل نسبت خاصی از توزیع چند متغیر باشد را تعریف کرد طوری که مجموعه مقادیر یک ناحیه فرآیند طبیعی8 را تشکیل می‌هد.
نمودار 2-1 توزیع دو متغیره متغیرهای طول 1و2 ازمطالعه موردی]24[
مقادیر درونی ناحیه طبیعی فرآیند با این اصل مشخص می‌گردند که فاصله آنها از بردار میانگین μ از مقادیر بحرانی9 تخطی نکند، قانون 3 سگیمای کلاسیک در این متن معادل این است که آزمایش کنیم مشاهده درون 99.73 درصد (0.9973=p ) مرکزی جمعیت مرجع10 قرار می‌گیرد یا خیر ،در موارد تک متغیره مقادیر بحرانی فوق‌الذکر حدود طبیعی فرآیند11 می‌نامند (ASQC)
نمودارهای 2-1 و 2-2 توزیع نرمال دو متغیره‌ای را نشان می‌دهند که واریانس‌ها، میانگین‌ها و ضریب همبستگی12 بر طبق مقادیر تجربی محاسبه شده از روی توزیع دو متغیر‌ه‌‌ی طول 1و طول 2 در 30 مشاهده‌ی اول مطالعه موردی13بدست آمده‌اند. که در آن μ^((1) )=49.91 و μ^((2) )=60.05 , δ_2=0.037 ,δ_2=0.037 ρ=0.723 نمودار 2.1 یک نمایش سه بعدی از توزیع فوق است در حالی که نمودار 2.2 خطوط کانتور14برای مقادیر مختلف f(length 1,length 2) را نشان می‌دهد.
وقتی پارامترهای فرآیند ناشناخته هستند و از روی نمونه‌ تخمین زده می‌شوند (مثل اکثر موارد معمول)، نمی‌توان ناحیه‌ی طبیعی فرآیند را که شامل نسبت بیان شده‌ی جمعیت باشد را با صراحت تعیین کنیم. چون اینک یک منبع اضافی عدم اطمینان15 داریم. هر تعبیری در مورد نسبت جمعیت در ناحیه‌ی خاص فقط با یک سطح اطمینان16 مشخص ساخته می‌شود. هر ترکیب از نسبت معین و سطح اطمینان معلوم یک ناحیه را تعریف می‌کند. ناحیه آماری تلرانس 17 در اینجا به جای ناحیه‌ی طبیعی18 فرآیند بکار می‌رود. در حالت تک متغیره حدود طبیعی فرآیند با حدود آماری تلرانس جایگزین می‌شوند. رویه‌ی نواحی تلرانس آماری در کنترل کیفیت چند متغیره در بخش هشتم تشریح می‌شوند.
نمودار2-2 :
خطوط کانتور تابع چگالی دو متغیره با پارامترهای طول 1 و طول 2از مطالعه موردی اول]24[
شکل توزیع چند متغیره به بردار میانگین μ ماتریس کوواریانس∑بستگی دارد. وقتی یکی یا هر دو این پارامترها نامعلوم باشند (مثل موارد معمول) به صورت تجربی و از داده‌ها تخمین زده می‌شوند. اگر x_1, …, x_n ،n بردارp بعدی مستقل مشاهدات از N_P (μ,∑) ،p≤n-1 باشد؛ بردار میانگین مشاهده‌شده‌ی x ̅ و ماتریس کوواریانس s بصورت زیر بدست می‌آیند:
x ̅=∑_(i=1)^n▒〖x_i/n〗
s=∑_(i=1)^n▒〖〖(x〗_i-x ̅)(〖(x〗_i-x ̅ )^’/n-1〗
که به ترتیب تخمین‌های نااریت ∑,µ هستند.
توجه داشته باشید تحت توزیع نرمال، بردار x ̅ یک تخمین حداکثر درستنمایی (MLE) برای μ است در حالیکه MLE مربوط به ∑ عبارت است از (n-1)/n S
(l,l’) امین عنصر ماتریس S کوواریانس تخمینی بین متغیرهای l,l’ است که l,l’ =1,…,P است یعنی:
S_ll’=∑_(i=1)^n▒(x_i^((l) )-¯x^((l) ) )(x_i^((l^’ ) )-¯x^((l^’ ) ) )⁄(n-1)
عناصر قطری S متناظر با واریانس‌های نمونه هستند، وقتی کوواریانس با انحراف معیاریهای مناسب استاندارد شود، مقدار تخمینی ،حاصل ضریب همبستگی بین دو متغیر را تخمین می‌زند.
اگر نمونه از k زیر گروه تشکیل شده باشد که اندازه‌ی هر کدام n باشد و اگر میانگین و ماتریس کوواریانس j امین زیر گروه به ترتیب s_j , x ̅_j باشد.j=1,..,k آنگاه میانگین کل و ماتریس کوواریانس آمیخته19 به صورت زیر تعریف می‌گردد.
x ̿=∑_(j=1)^k▒x ̅_j⁄k=∑_(j=1)^k▒∑_(i=1)^n▒〖x_ij⁄k n〗
s_p=∑▒((n-1)s_j)⁄[k(n-)]
محاسبات را با دو مجموعه داده‌های شبیه سازی شده تشریح می‌کنیم. اولین نمونه از یک توزیع دو متغیره با مشاهدات غیر گروهبندی تولید شده است.
مشاهدات در دومین گروه داده‌ها چهار متغیره دو به دو گروهبندی شده دارد، یعنی دو زیر گروه ((k=2. فایده‌ی استفاده از داده‌های شبیه سازی شده برای توضیح تئوری این است که توزیع اصلی و پارامترهایش معلوم هستند، بنابراین می‌توانیم عملکرد آزمون فرضیه آماری را در شرایط کنترل شده بررسی کنیم در اولین مجمموعه داده‌ها، پارامترهای 50 مشاهده‌ی اول همانند مقادیر تجربی محاسبه شده برای پارامتر 1 و پارامتر 2 برای 30 مشاهده‌ی اول مطالعه موردی اول هستند یعنی:
μ=μ_0=[■(μ_0^((1) )@μ_0^((2) ) )]=[■(49.91@60.05)]
و ρ=0.723, δ_2=0.037 , δ_1=0.037 و ماتریس کوواریانس جمعیت ∑10000 برابر است با :
∑▒〖=[■(13.69&9.90@9.90&13.69)] 〗
50 مشاهده‌ی اول یک نمونه پایه20 تحت کنترل (با قابلیت فرآیند21 تحت کنترل) را نشان می‌هد میانگین نمونه برای آن مشاهدات عبارت است از:
x ̅=[■(49.9026@60.0441)]
و عناصر ماتریس s عبارتند از:
s_11=∑_(i=1)^50▒(x_i^((1) )-49.9026)^2⁄(49=0.00122)
〖s_12=s〗_21=∑_(i=1)^50▒〖(x_i^((1) )-49.9026)^2 (x_i^((2) )-60.0441)^2⁄(49=0.00114)〗
s_22=∑_(i=1)^50▒(x_i^((2) )-60.0441)^2⁄(49=0.001367)
یعنی
s=[■(0.00122&0.00114@0.00114&0.001367)]
یادآوری می کنیم در سراسر کتاب محاسبات می‌توانند توسط minitab با سایرنرم افزارهای آماری انجام گیرد.
با داده‌های ضریب ماتریس s ضریب همبستگی نمونه به صورت زیر بدست می‌آید
r=0.00114/√(0.00122 0.001367)=0.883
برای دومین مجموعه داده‌ها پارامترهای 50 زیر گروه اول با مقادیر تجربی محاسبه شده برای 4 قطر (یعنی قطر 1-4) در 30 مشاهده‌ی اول مطالعه موردی اول تعیین می‌گردد یعنی:
μ=μ_0=[█(μ^((1) )@μ^((2) )@μ^((3) )@μ^((4) ) )][█(9.9863@9.9787@9.9743@14.9763)]
و ماتریس کوواریانس ∑ 10000 برابر است با:
∑▒〖=[█(1.8264 @1.7080 @1.8195 @1.8264)█(1.7080@1.8437@1.8529 @1.8460)█( 1.8195 @ 1.8529@2.1161@ 1.9575) █(1.8264@1.8460@1.9575@2.5092)] 〗
توزیع اصلی داده‌ها شبیه سازی شده نرمال چند متغیره با پارامتر های فوق است داده‌ها در 50 زیر گروه به اندازه 2 برای هر کدام دسته بندی شده‌اند بنابراین اولین گروه شامل مشاهدات زیر است:
x_1^’=[9.9976 9.9830 9.9804 14.9848]
x_2^’=[9.9553 9.9574 9.9543 14.9492]
و بردار میانگین اولین زیر گروه عبارت است از:
x_1^’ [9.9765 9.9702 9.9673 14.9670]
و ماتریس کوواریانس درونی زیر گروه (x10000) برابر است با:
s_1=[█(8.9558 5.4181 5.5307 7.5527 @5.4181 3.2779 3.3460 4.5692@5.5307 3.3460 3.4156 4.6642@7.5527 4.5692 4.6642 6.3693)]
و به همین ترتیب برای 50 زیر گروه محاسبات انجام شده و نتایج زیر بدست آمده‌اند:
x ̿=∑_(j=1)^50▒〖x ̅ 〗 j⁄(50=[9.9864 9.9793 9.9752 14.9768])
10000s_p=10000∑_(j=1)^50▒〖(50-1) ( s_j)⁄[50(2-1)] 〗
=[█(1.2151 @1.1428 @1.1600 @1.2669 )█(1.1428 @1.3559 @1.2854 @1.2792)█(1.1600@1.2854 @1.5728 @ 1.4183 )█( 1.2669@1.2792@1.4484@1.6854)]
برنامه minicab به راحتی ماتریس s_p محاسبه می کند.
جزئیات تئوی تخمین های s_p , s , x ̿ , x ̅ به صورت گسترده مطالعه شده، و سعی شده است تحت معیارهای مختلف (کفایت22، انطباق23، تمامیت24) بهینه باشد.
جزئیات تئوری تخمین برای نمونه‌های نرمال تصادفی x_n , …, x_1 با قضایای زیر بیان می‌گردند ]17[:
i)x ̅~N_P (μ,1/n∑)
ii) اگر x ̅ به صورت i توزیع شده باشد داریم:
n(x ̅-μ)’∑^(-1) (x ̅-μ)~χ_p^2

که χ_p^2 توزیع خی دو25 p درجه آزادی است.
(iii (n-1)S~W_p (n-1,∑)
که w(. ,.) توزیع ویشارت26 است. این توزیع حالت چند متغیره‌ی خی دو است.
iv) اگر Z و D متغیرهای تصادفی مستقل باشند که به صورت زیر توزیع شده‌اند.
Z~N_P (0 , ∑_z )
fD~W_p (f,∑_z)
فرم توان دوم زیر در قرار است:
T^2=Z’DZ
که به صورت زیر توزیع شده است:
T^2~fp/(f-p+1) F_(p,f-p+1)
که F_(p,f-p+1) توزیع فیشر27 با (p , f-p+1) درجه آزادی است. اگر ارزش انتظاری z را با μ_z نشان دهیم و مخالف صفر باشد (μ_z≠0) آنگاه T^2 (ضرب شده با ثابت‌های مناسب) یک توزیع f غیر مرکزی با پارامتر مرکزیت μ_z^’∑μ_z دارد.
v) اگر z~N_p (0 , ∑_z) و fD~w_p (f_p , ∑_z) که f>p باشد و fD را بتوانیم به صورت fD=(f-1) D_1+ZZ’ تجزیه کرد بطوری که:
(f-1) D_1~w_p (f-1, ∑) و z از D_1 مستقل باشد فرم توان دوم زیر را داریم:
T^2=Z’D^(-1) Z
و بصورت زیر توزیع می‌گردد:
T^2~fB(p , f-p)
که B(p, f-p) توزیع مرکزی بتا با (f, f-p) درجه آزادی است
اگر ارزش انتظاری μ_z , z مخالف صفر باشد T^2 توزیع غیر مرکزی با پارامتر عدم مرکزیت μ_z^’ ∑_z^(-1)▒μ_z دارد.
دقت کنید بر خلاف (iv) اگر چه Z از D_1 مستقل است ولی از D مستقل فرض نشده است.
vi) اگر نمونه از k زیر گروه به اندازه‌ای n تشکیل شده باشد که از توزیع بالا نشأت گرفته‌اند و میانگین زیر گروه‌ها x ̅_j j=1,…, k و میانگین کل x ̿ باشد داریم:
x ̿=∑_(j=1)^k▒〖x ̅_j⁄k=∑_(j=1)^k▒∑_(j=1)^k▒x_ij⁄kn〗
و
√(kn/(k-1)) (x ̅_j-x ̿ )~N_p (0 , ∑)
vii) تحت شرایط (ii) اگر y_1, …, y_n زیر گروه‌های اضافی از توزیع یکسان باشند آنگاه :
√(kn/(k+1)) (y ̅-x ̿ )~N_p (0 , ∑)
viii) اگر نمونه از k زیر گروه به اندازه‌ی n تشکیل شده باشد که عیناً توزیع نرمال چند متغیره دارند، و اگر s_j ماتریس کوواریانس j این زیر گروه باشد j=1, …, k داریم:
∑▒〖(n-1) s_j~w_p (k(n-1), ∑〗)
دقت کنید که خصوصیت اضافی مجموعه متغیرهای مستقل ویشارت، گسترش خصوصیت خی دو برای حالت تک متغیره است.
جزئیات توزیعی T^2 , s , x ̅ پایه‌ی تئوری برای استنتاج توزیع‌های آماری استفاده شده در کنترل کیفیت چند متغیره را فراهم می‌سازد که در فصول بعدی بحث می‌شوند.
آن آماره‌ها فاصله کل از بردار p بعدی میانگین‌های مشاهده‌ شده‌ی مقادیر هدف28 m^’=(m^((u) ), …,m^((p) )) را تخمین می‌زنند اگر y_i^((l) ) برای l=1, …p , i=1,…,n n معیار چند متغیره باشند و y^’=(y ̅_((1) ), …,y ̅_((p) ) ) میانگین‌های مشاهده شده باشند. آماره‌ی T^2 هتلنیگ29 با ضریب (y ̅-m)’ یعنی ترانهاده‌ی بردار انحرافات (y-m) محاسبه می‌گردد به آماره‌یT^2 هتلینگ در فصل قبل وقتی نمودار مقادیر کسب شده‌ی 30 مشاهده اول را از مطالعه موردی اول ارائه کردیم اشاره گردید.
وقتی نمونه‌ی y_1,…, y_n از n مشاهده‌ی p بعدی نرمال مستقل برای تخمین فاصله‌ی بین y ̅ و ارزش انتظاری μ بکار می‌رود؛آمارT^2ههتلینگ که با T_M^2نشان داده می شود به صورت زیر است:
T_M^2=n(y ̅-µ)^’ S^(-1) (y ̅-µ)
آماره‌ی T_m^2 می‌تواند به صورت رابطه‌ی بین میانگین‌های معیارهای y_i^((L) ) بیان شود:
T_M^2=n∑_(l=1)^p▒∑_(l^’=1)^p▒〖(y ̅^((l) )-μ^((l) ) ) S^((l,l^’ ) ) (y ̅^((l^’ ) )-μ^((l^’ ) ) ) 〗
که S^((l,l^’ ) ) و l,l^’ این عنصر ماتریس S^(-1) است.هنگامیکه برنامه Minitab آماره‌ی T^2 را می‌خواهد محاسبه کند باید معکوس ماتریس S را محاسبه کرده و برای فرم درجه دوم ماتریس‌های مناسب را در هم ضرب کند.
تحت فرض صفر که داده‌ها مستقل و دارای توزیع نرمال هستند. با فرض بردار میانگین μ آماره‌ی T_m^2 بلافاصله با (iv) تعریف می‌گردد.
((n-p))/(n-1)p T_m^2~f_(p,n-p)
وقتی می‌خواهیم فاصله بین تک مشاهده‌ی y از مقدار μ را محاسبه کنیم و ماتریس کوواریانس از n مشاهده‌ی محاسبه شده باشد آماره‌ی T_m^2 به صورت زیر بدست می‌آید:
T_m^2=(y-μ)’s^(-1) (y-μ)
حالت خاص دیگر زمان است p=1 باشد در این حالت آماره‌ایT_m^2 برای تخمین انحراف میانگین n مشاهده از مقدار میانگین از مربع آماره‌ی t کسر می‌شود t=(√n(y ̅-μ))/s که آماره t برای تست فرضیه‌ی میانگین جمعیت نرمال تک متغیر استفاده می‌شود. اگر ارزش انتظاری μ , y باشد، آماره‌ی t توزیع t استودنت30 با n-1 درجه آزادی دارد و چون ضریب T_m^2 به یک کاهش یافته است پس طبق انتظار t^2~F_(1, n-1)
محاسبات و فرضیه‌های با مجموعه داده‌های شبیه سازی شده‌ی بالا توضیح داده می‌شود. قبلاً اشاره کردیم که 50 مشاهده اول در مجموعه داده‌ها، داده‌ها را از یک فرآیند مطالعه‌ی قابلیت تحت کنترل شبیه سازی می‌کند. که توزیع نرمال دارد با :
μ=μ_0=[█(49.91@60.05)]
مقدار T_m^2 برای آن 50 مشاهده را محاسبه کرده و با مقادیر بحرانی مناسب که از توزیع (n-1)p/(n-p) f_(p, n-p) بدست آمد مقایسه می‌کنیم (در این حالت p=2 , n=50 می‌باشد) به ترتیب α=0.05 , α=0.005 , α=0.0027 مقادیر 6.64 , 12.35 , 13.97 داریم نتایج در ستون آخر جدول 2.1 آمده است می‌بینم که هیچ یک از مقادیر T_m^2 در نمونه از مقدار بحرانی α=0.05 تخطی نمی‌کند. این نتیجه مورد انتظار بود چون مافواصل داده‌های تجربی را از پارامترهای مکانی توزیع که داده‌ها را تولید کرده بود آزمودیم.
تنها منبع مشاهده‌ی اختلاف خطاهای تصادفی است . در بخش‌های بعد به این مثال بر می‌گردیم و از حالت گسترده‌تری از مجموعه داده‌ها استفاده می‌کنیم که هر دو دسته نمونه31 و نمونه آزمون شده32 را شبیه سازی می‌کند.
وقتی نمونه‌ای از kn مشاهده نرمال مستقل در k زیرگروه منطقی به اندازه‌ی n دسته بندی شده‌اند. فاصله‌ی بین میانگین y ̅_j ایj امین زیر گروه و مقدار انتظار μ ، T_m^2 زیر تعریف می‌شود.
T_m^2=n(y ̅_j-μ)S_p^(-1) (y ̅_j-μ)
دقت کنید برخلاف حالت گروهبندی نشده ماتریس کوواریاس از آمیختن33همه k زیر گروه تخمین زده می‌شود. دوبار تحت فرضیه‌ی صفر داده‌ها بر مبنای بردار میانگین μ_1 مستقل و دارای توزیع نرمال هستند. از (iv),(viii) دادیم.
(k(n-1)-p+1)/k(n-1)p T_m^2~f_(p, k(n-1)-p+1)
در این حالت دوم مجموعه‌ داده‌های شبیه سازی شده با p=4 و k=50 و n=2 مقادیری بحرانی T_m^2 برای α=0.05 , α=0.005 , α=0.0027 عبارتند از 10.94 , 18.8 , 20.17 در جدول 3.2 مشاهده می‌کنیم در میان 50 زیر گروه 4 مقدار T_m^2 از مقادیر متناظر α=0.005 فقط زیر گروه 32 ام مقادیر تخطی کرده است.
جدول 2-1
میانگین با مقادیر خارجی (49.91, 90.65) استفاده شده برای پارامترهای تولید داده ماتریس s از نمونه پایه (50 گروه مشاهده) مي‌باشد نمونه پايه عبارتند از]24[ :
جدول 2-2
ميانگين با مقادير (9.9863 9.9787 9.9763 14.9763) براي پارامترهاي در توليد داده ماتريس s آميخته از نمونه پايه (50 گروه 2 مشاهده‌اي)بدست آمده است. داده‌هاي نمونه عبارتند از]24[:
3-2 کنترل کیفیت با اهداف تعیین شده خارجی
روش ها و رویه‌های ارائه شده در این بخش برای حالتی است که مقادیر هدف از خارج (فرآیند) تعیین می گردند یعنی بر اساس یک نیاز خارجی یا وقتی که باید به مقار استاندر m0 دست یافت. باید توجه داشت که مقادیر هدف مشخص خارجی معمولاً در کنترل کیفیت مدنظر نیست زیرا چنین اهدافی ممکن است به طور طبیعی با فرآیند جاری قابل دستیابی نباشد و یا حتی با آن متناقض باشد. با این وجود هر زمان مجموعه استانداردهای از پیش تعیین شده‌‌ی چند متغیره داشته باشیم، رویه‌های کنترل کیفیت چند متغیره برای ارزیابی اینکه میانگین چند متغیره محصولات مساوی اهداف خارجی m0 است بکار می روند. دو فصل آینده با حالاتی سر و کار دارند که اهداف آزمون فرآیند منتج ‌و محاسبه می‌گردند. باید بین اهدافی که از نمونه‌ی تست شده منتج می‌شوند و اهدافی که از نمونه مرجع34 یا نمونه پایه35 منتج می‌شوند تمایز قائل شد. اگر میانگین چند متغیره، محصولات را با μ نشان دهیم آنالیز آماری در کنترل کیفیت با مقادیر خارجی معادل آزمون فرضیه به صورت زیر است:
H_0:μ=m_0
H_1:μ≠m_0
با داشتن یک نمونه به اندازه‌ی n از جمعیت می‌توان T_m^2=n_1 (y ̅-m_0 )^’ s^(-1) (y ̅-m_o) را محاسبه کنیم. در فصل قبل مشاهده کردید که برای داده‌های نرمال اگر m0 تعداد مورد انتظار y ̅ باشد توزیع آماره‌ی T_m^2 به صورت F_0=(n_1-p)/(p(n_1-p)) T_m^2~F_(P,n_1-p) است.
بنابراین تحت فرض صفر در نظر می‌‌گیریم F_0=~F_(P,n_1-p) و در فرض H1 وF0 توزیع فیشر(توزیعF) غیرمرکزی دارد. بنابراین مقدار بحرانی36 برای T_m^2 برابر است با:
UCL=(n_1-p)/(p(n_1-p)) F_(P,n_1-p)^α
که در آن 〖F_(P,n_1-p)^α〗_ ،αدرصد بالای توزیع مرکزیF با P,n_1-p) (درجه آزادی است. اگر مقدار T_m^2 از مقادیر بحرانی تخطی کند نتیجه می‌گیریم اختلاف بین y ̅ و مقدار هدف خارجی m0 تنها با خطاهای تصادفی قابل توجیع نیست و در این حالت احتمال می‌دهیم که یک عامل قابل بررسی روی فرآیند تاثیر گذاشته است.
به عنوان اولین مثال حالت گسترده‌تر مجموعه داده های شبیه‌سازی شده‌ی فصل قبل در اینجا نیز استفاده می‌گردد. در اینجا علاوه بر 50 مشاهده‌ی نمونه‌ی پایه فصل دوم، 25 مشاهده‌ی دو متغیره تولید کردیم که یک سری از نمونه‌های تست شده را شبیه‌سازی می‌کند که پارامترهای آن به صورت زیر است:
پارامترهای مشاهده‌ی 51 تا55 عیناً نمونه‌ی پایه هستند (یعنی داده‌ها تحت کنترل هستند) میانگین جمعیت برای اولین نمونه در مشاهدات 56 تا 65 دو انحراف استاندارد به بالا منتقل شده‌اند یعنی:
μ_2=μ_0+ [■(〖2σ〗_1@0)]=[■(49.984@60.050)]
سرانجام در مشاهدات 66 تا 75 میانگین جمعیت برای اولین مولفه یک انحراف معیار به پایین و برای دومین مولفه یک انحراف معیار به بالا منتقل شده‌اند یعنی:
μ_2=μ_0+ [■(〖-σ〗_1@〖+σ〗_1 )]=[■(49.873@60.087)]
یادآوری می‌شویم 50 مشاهده‌ی اول دو متغیره از توزیع نرمال با بردار میانگین زیر تولید شده است:
μ_0=[■(49.91@60.05)]
باید دو مجموعه مقادیر هدف را در نظر گرفت: اولین مجموعه m_0^((1))=μ_0 را ارضا می‌کند یعنی میانگین‌های استفاده شده برای تولید داده‌ها به عنوان مقادیر هدف می باشند. در مجموعه دوم مقادیر هدف عبارتند از:
m_0^((1))=[■(49.9@60.0)]
با آزمون فرضیه‌ای که داده های تولید شده از جهت، با اهداف از پیش تعیین شده سرچشمه می‌گیرند آغاز می‌کنیم یعنی m=m_0^((1)) بعلاوه اگر فرض کنیم ماتریس کوواریانس معلوم باشد (یعنی همانطور که در داده‌های شبیه‌سازی شده داشتیم) می‌توانی برای هر مشاهده در نمونه‌ی آزمایشی آماره‌ی زیر را محاسبه می‌کنیم و مقادیر آنرا با مقادیر بحرانی از توزیع خی دو با دو درجه آزادی (اصلvi را در بخش دوم ببیند) مقایسه می‌کنیم:
(y_i-m_0^((1) ) )^’ ∑^(-1) (y_i-m_0^((1) ) ) i=51,…,75
ماتریس کوواریانس ∑ می‌تواند از نمونه پایه با ماتریس تجربی s تخمین زده شود. آمار‌ه‌ی T_m^2 نتیجه شده با مقادیر بحرانی بر مبنای توزیع F که در این فصل ارائه می‌گردد مقایسه می‌شوند. اکنون برای هر 25 مشاهده نمونه آزمایشی (یعنی تک مشاهده‌ی (y) همانطور که آزمون t تک متغیره را برای هر کدام از دو مولفه انجام دادیم آزمون T_^2 چند متغیره را برای آماره‌ی T_m^2 انجام می‌دهیم. یادآوری می‌گردد که آزمون مشابه را در بخش قبل برای 50 مشاهده‌ی اول نمونه پایه انجام دادیم.
در آزمون چند مغیره فرضیه‌ی صفر این است که میانگین مشاهدات دو متغیره همانطور که آزمون تک متغیره هر دومولفه جداگانه بیان شد عبارت زیر را ارضا کند.
m_0^((1))=[■(49.9@60.05)]
مقادیر بحرانی T_m^2از توزیع (2*49)/48 F_2,48 بدست آمده و برای α=0.05,α=0.005,
α=0.0027 به ترتیب عبارتند از ,13,693,12.103,6.515 مقادیر بحرانی متناظر تست t دو طرفه برای αهای بالا به ترتیب 2.01,2.94,3.16 هستند.نتایج در جدول 3.3 آمده است.
جدول 2-3:
میانگین ها با مقادیر خارجی (4991,6005) که پارامترهای مورد استفاده برای تولید داده ها هستند. ماتریس s از نمونه پایه (50 مشاهده) داده‌های نمونه آزمایشی عبارتند از]24[:
برای هر کدام از سه زیر مجموعه نمونه آزمایشی (به ترتیب به اندازه‌های 5و10و10) در جدول 4. 3 تعداد مشاهداتی که هر فرض صفر رو می‌شود آمده است.
زیر مجموعه‌ی نخست شامل 5 مشاهده که تحت کنترل است همانطور که انتظار می رفت عمل می‌کند و در هیچ یک از مشاهدات T_m^2 از مقادیر بحرانی متناظر تخطی نمی‌کند. در زیر مجموعه دوم شامل 10 مشاهده که تنها میانگین مولفه‌ی اول (با دو انحراف استاندارد) تغییر کرد می بینیم که توان تجربی آزمون T_m^2 چند متغیر از آزمون تک متغیر‌ه ی صورت گرفته روی متغیر موثر، تخطی می‌کند. تک مشاهده‌ای که نشان می‌دهد مولفه ی دوم از مقدار بحرانی در α=0.05 تخطی می کند خطای نوع I است زیرا میانگین تغییر نکرده است
جدول 2-4
تعداد مردودین فرضH_0:m=m_0^((1)) برای سه نمونه آزمایشی]24[
.
مجموعه دوم مقادیر هدف را در نظر می‌گیریم ( که به عنوان میانگین‌های مورد استفاده برای تولید داده‌ها تعریف می‌شوند، ولی تنها با یک رقم اعشار) یعنی:
m_0^((2))=[■(49.9@60.0)]
برای 50 مشاهده‌ی نمونه پایه مثل 5 مشاهده‌ی اول نمونه آزمایشی اهداف توزیع دو متغیر‌ه‌ی -1.35σ_2,0.27σ_1 از میانگین‌های احتمالاً نامعلوم انحراف دارند. انحرافات برای دیگر مشاهدات آزمایشی مهم تر هستند.
نتایج آزمون 50 مشاهده‌ی نمونه پایه با ماتریس تخمینی S در جدول 3.5 ارائه شده‌اند، نتایج نمونه‌ی آزمایشی در جدول 2-6 آمده است .
جدول 2-5:
میانگین‌ها، مقادیر خارجی (499,60.0) ، ماتریسs از نمونه پایه 50 مشاهده‌ای محاسبه شده است داده ها نمونه پایه عبارتند از]24[:
جدول 3-6:
میانگین‌ها، مقادیر خارجی (49.9,60.0) ، ماتریسs از نمونه پایه 50 مشاهده‌ای محاسبه شده است داده ها نمونه پایه عبارتند از]24[:
جدول 3-7 تعداد مشاهدات که فرض صفر هر دو نمونه پایه و نمونه‌های آزمایشی را رو می‌کند ارائه می‌دهد. باز مشاهده می‌کنید که موفقیت آزمون تک متغیره برای یافتن انحرافات از آزمون چند متغیره کمتر است.
جدول 3-7 :
تعداد مردودین فرضH_0:m=m_0^((1)) برای سه نمونه آزمایشی]24[
در مقدمه اشاره کردیم که آماره‌ی T_m^2 پیرامون متغیرهایی که علائم خارج از کنترل را سبب شده‌اند اطلاعا مهمی را فراهم نمی‌کند. در مثال قبل دیدیم توان تست‌های یک متغیره از تست چند متغیره کمتر است. آزمون تک متغیره چندتایی به دلیل مقایسات متعدد شکل مرکب دارد که زمانی است که سطح معنی برآرود شده باشد (تخمیمی). در فصل هفتم روش‌های دیگر برای یافتن متغیرهای دور از مرکز37 ارائه می‌گردد، که تعمیم آزمون چند متغیره و استفاده از اطلاعات همه‌ی متغیرها و ساختار ماتریس کوواریانس آنها هستند.
.در مثال دوم اهداف خارجی اطلاعات واقعی مطالعه موردی سوم استفاده می‌کنیم که متغیرها ابعاد چندین قطعه‌ی سرامیکی است. مواد خام که در تولید استفاده می‌گردند شامل اجزائی نظیر رنگ‌ها، چسب‌ها و زیر لایه های سرامیکی هستند. صفحات سرامیکی چاپ و در کوره قرار داده می شوند پس لایه‌های رسانا و نارسانا،‌ مقاومتی و طلا یا پلاتین به صفحات افزوده می‌شوند. قدم‌های بعدی شامل آماده‌سازی‌های لیزری و نصب اجزاء و لحیم‌کاری جزئی با اتصال سیم چیپ است. آخرین مرحله‌ی ساخت، بسته‌بندی محصول نهایی است. اولین دسته های38 تولیدی (مراجع مشخص شده) کیفیت بسیار بالای تولید را فراهم می‌کنند که همه‌ی سطوح تولید بدون شیب و تعمیر هستند. بنابراین پومین اولین قطعات به عنوان استاندارد برای بقیه‌ی بسته‌ها در نظر گرفته می شوند. 5 بعد با نشانه‌گذاری (a,b,c,w,l) در مطالعه موردی سوم در نظر گرفته می‌شوند. سه بعد اول با فرآیند ثبت لیزری39 تعیین می گردند و دوتای آخر ابعاد خارجی هستند. در این مثال تنها سه بعد اول را در نظر می‌گیریم.
نمونه مرجع ابعاد (a,b,c)=(199,550,615,550,923) را بر حسب mm دارند. مشخصات اسمی مهندسی تولید (200 550 550) می‌باشد، تعریف مجدد ابعاد (a,b,c) به صورت انحراف از مشخصات اسمی مقادیر هدف، فرضیه‌ی صفر برای آزمون سه بار میانگین جمعیت عبارتند از:
H_0:μ=[■(0@0@0)]
H_a:μ≠[■(0@0@0)]
جدول 3-8:
ابعاد در نمونه مرجع موردی سوم ]24[
میانگین‌ها (با توجه به مرکز مشخصات اسمی) و ماتریس s-1 نمونه مرجع از جدول 3.6 آمده است. چون نمونه مرجع13 واحد دارد پس n=13 است:
T_m^2=B(y ̅-0)^’ s^(-1) (y ̅-0)
=13(-1.00 0.615 0.923)[█(1.081 0.100 -0.482@0.100 1.336 0.063 @0.432 0.063 2.620)] [■(-1.00@0.615@0.923)]
=13×4.58=59.54
چون F_(3,12-3)^0.01=27.23 باید H0 را در سطح معنی40 1درصد رد کنیم بنابراین نتیجه می‌گیرم که به طور متوسط اگر چه نمونه مرجع شدیداً کیفیت خوبی دارد ولی مشخصات اسمی مورد نیاز را برآورده نمی‌کند.
گروهبندی داده‌ها:
اگر نمونه آزمایشی به اندازه‌ی n1 در k زیر گروه منطقی به اندازه های njو n_1=∑_(j=1)^k▒n_j گروهبندی شوند، ماتریس کوواریانس آمیخته41 از k ماتریس کوواریانس نمونه تخمین زده می شود یعنی:
s_P=∑_(j=1)^K▒〖(n_j-1) s_j/∑_(j=1)^K▒(n_j-1) 〗
بعلاوه اگر اندازه‌ی همه‌ی زیر گروه‌ها مساوی باشد یعنی n1=kn ماتریس کوواریانس sp میانگین k ماتریس مجزا می‌باشد.
s_P=∑_(j=1)^K▒〖s_j/k〗
وقتی



قیمت: تومان

دسته بندی : مقاله و پایان نامه

دیدگاهتان را بنویسید