دانشکده علوم
پایاننامه کارشناسی ارشد در رشته آمار ریاضی
استنباط آماری پیرامون ضرایب تغییرات در چند جامعه نرمال بر اساس روش Parametric bootstrap
به کوشش:
احسان خراتی کوپایی
استاد راهنما:
پروفسور سلطان محمد صدوقی الوندی
شهریور ماه 1393
به نام خدا
اظهارنامه
اینجانب احسان خراتی کوپایی ( 9131069 ) دانشجوی رشتهی آمار گرایش آمار ریاضی دانشکده علوم اظهار میکنم که این پایان نامه حاصل پژوهش خودم بوده و در جاهایی که از منابع دیگران استفاده کردهام، نشانی دقیق و مشخصات کامل آن را نوشتهام. همچنین اظهار میکنم که تحقیق و موضوع پایان نامهام تکراری نیست و تعهد مینمایم که بدون مجوز دانشگاه دستاوردهای آن را منتشر ننموده و یا در اختیار غیر قرار ندهم. کلیه حقوق این اثر مطابق با آییننامه مالکیت فکری و معنوی متعلق به دانشگاه شیراز است.
نام و نام خانوادگی: احسان خراتی کوپایی
تاریخ و امضا:
به نام خدا
استنباط آماری پیرامون ضرایب تغییرات در چند جامعه نرمال بر اساس روش
Parametric bootstrap
به کوشش
احسان خراتی کوپایی
پایان نامه
ارائه شده به تحصیلات تکمیلی دانشگاه شیراز به عنوان بخشی
از فعالیتهای تحصیلی لازم برای اخذ درجه کارشناسی ارشد
در رشتهی:
آمار ریاضی
از دانشگاه شیراز
شیراز
جمهوری اسلامی ایران
ارزیابی کمیته پایان نامه با درجه: عالی
آقای دکتر سلطان محمد صدوقی الوندی، استاد بخش آمار ( رئیس کمیته )………………………………..
آقای دکتر امین قلمفرسا، استادیار بخش آمار ( استاد مشاور )…………………………………………………….
خانم دکتر مینا توحیدی، دانشیار بخش آمار (داور )………………………………………………………………….
شهریور ماه 1393
تقدیم به
پدر و مادر مهربانم
که همواره وجودشان تکیهگاه محکمی برای من بوده است
سپاسگزاری
سپاس باد، ایزد دانا و توانا را که لطف و عنایت خود را شامل این بنده ناچیز کرد تا در راه رسیدن به اهداف و خواستههایم قدمی کوچک بردارم. اکنون که به مدد خداوند این دست نوشته به اتمام رسیده است، بر خود واجب میدانم تا از تمام دوستان و عزیزانی که مرا در تهیه این رساله همراهی نمودهاند تشکر و قدردانی کنم. از پدر، مادر، برادران و خواهر عزیزم صمیمانه تشکر میکنم که با صبر و بردباریشان مایه دلگرمی اینجانب شده و آرامش روحی و فکری مرا تأمین نمودهاند.
تشکر و سپاس بیپایان خود را تقدیم به استاد ارجمند جناب آقای دکتر محمد صدوقی که با کولهباری از تجربه همواره راهنمای من در به اتمام رساندن این رساله بودهاند، میکنم و همچنین از اساتید بزرگوار، دکتر امین قلمفرسای ، دکتر مینا توحیدی و دکتر محمود خراتی که با راهنماییهای ارزنده خود این رساله را بررسی کردهاند کمال تشکر را دارم.
چکیده
استنباط آماری پیرامون ضرایب تغییرات در چند جامعه نرمال بر اساس روش Parametric bootstrap
به کوشش
احسان خراتی کوپایی
ضریب تغییرات کمیتی بسیار مهم و پرکاربرد در علومی مانند فیزیک، زیست شناسی، پزشکی و … می باشد .یکی از دلایل اهمیت ضریب تغییرات، وابسته نبودن آن به مقیاس اندازه گیری است که می توان از آن جهت مقایسه پراکندگی چند جامعه با واحد های اندازه گیری مختلف، استفاده نمود. از ضریب تغییرات به عنوان شاخصی برای سازگاری یا یکنواختی مجموعه ای از مشاهدات نیز استفاده می شود. ما در این پایان نامه دو روش جدید بر پایه بوت استراپ پارامتری جهت آزمون برابری ضرایب تغییرات در چند جامعه نرمال ارائه می دهیم. از آن جهت که در هر مساله آزمون فرض آماری، ارائه روشی که بتواند خطای نوع اول را به خوبی کنترل کند اهمیت دارد نخست با استفاده از شبیه سازی عملکرد روش پیشنهادی از لحاظ کنترل خطای نوع اول بررسی می شود. سپس به مقایسه توان آزمون پیشنهادی با روش هایی که اخیرا ارائه شده اند؛ می پردازیم.
کلید واژه : ضرایب تغییرات، آزمون والد، روش بوت استراپ پارامتری، نسبت درستنمایی، p- مقدار تعمیم یافته
فهرست مطالب
عنوان صفحه
فصل اول: مقدمه
1-1- مقدمه و تاریخچه2
1-2- آشنایی با نماد ها4
1-3- P- مقدار تعمیم یافته 5
1-4- روش بوت استراپ پارامتری6
1-5- معرفی آماره آزمون والد6
فصل دوم: معرفی روش های موجود برای آزمودن
2-2- روش لیو و همکاران8
2-3- روش جعفری و کاظمی9
2-4- روش بهینه شده جعفری و کاظمی15
فصل سوم: روش جدید پیشنهادی
3-1- روش جدید پیشنهادی20
3-2- روش کریشنامورتی و میسوک لی22
3-3- تفاوت های روش جدید پیشنهادی با دو روش اخیر23
فصل چهارم: شبیه سازی، مثال عددی و بحث و نتیجهگیری
4-1- شبیه سازی29
4-2- مثال عددی40
4-3- نتیجهگیری41
پیوست
پیوست 1: برنامهنویسی43
منابع و مراجع51
چکیده انگلیسی53
فهرست جدول ها
عنوان و شماره صفحه
جدول 1: برآورد خطای نوع اول برای k=3 جامعه نرمال مستقل برای روش های
JKL، MJKL. ……………………………………………………………………………………………………………………… 31
جدول 2: برآورد توان برای k=3 جامعه نرمال مستقل برای روش های JKL،
MJKL………………………………………………………………………………………………………………………………………32
جدول 3: برآورد خطای نوع اول برای k=4 جامعه نرمال مستقل برای روش های
GPT، JKL، JKW، WT ، New و MLRT…………………………………………………………………….33
جدول 4: برآورد خطای نوع اول برای k=7 جامعه نرمال مستقل برای روش های
GPT، JKL، JKW، WT، New و MLRT…………………………………………………………………….34
جدول 5: برآورد توان برای k=3 جامعه نرمال مستقل برای روش های New و
MLRT…………………………………………………………………………………………………………………………………….35
جدول 6: برآورد توان برای k=4 جامعه نرمال مستقل برای روش های New و
MLRT……………………………………………………………………………………………………………………………………..36
جدول 7: برآورد توان برای k=5 جامعه نرمال مستقل با حجم نمونه برابر برای
روش های New و MLRT…………………………………………………………………………………………………….37
جدول 8: برآورد توان برای k=3 جامعه نرمال مستقل براساس جدول کریشنامورتی
و میسوک لی (2014)………………………………………………………………………………………………………………..39
جدول 9: اطلاعات مربوط به تعداد صید 4 نوع ماهی در درایالت کارناتاکا هند ……………………..40
جدول 10: نتایج آزمون ها ………………………………………………………………………………………………………..40
فهرست اشکال
عنوان و شماره صفحه
شکل 1: تخمین چگالی آماره جعفری و کاظمی (2013) …………………………………………………….. 24
شکل 2: تخمین چگالی آماره جعفری و کاظمی (2013) بعد از ضرب نمون ضریب ……………….24
شکل 3: چگالی خی دو با دو درجه آزادی………………………………………………………………………………..24

فهرست نشانه های اختصاری
فصل اول: مقدمه
1- مقدمه
1-1- مقدمه و تاریخچه
بدلیل اینکه ضریب تغییرات به واحد اندازه گیری بستگی ندارد، معیاری مناسب جهت مقایسه پراکندگی چند جامعه با واحد های اندازه گیری مختلف می باشد و به همین دلیل نیز ضریب تغییرات مورد توجه آمار دانان قرا گرفته است. هدف ما در این پایان نامه ارائه آزمونی برای آزمودن برابری ضرایب تغییرات در چند جامعه نرمال براساس آزمون والد1 و روش بوت استراپ پارامتری2 می باشد. تاکنون روش های مختلفی برای آزمون برابری ضرایب تغییرات در چند جامعه نرمال ارائه شده اند؛ اما هیچ یک از روش های ارائه شده دقیق نیستند به این معنی که خطای نوع اول آنها دقیقا در سطح اسمی آزمون نمی باشد. از مهمترین روش ها می توان به این موارد اشاره کرد. بنت3 در سال 1976 آزمونی براساس روش نسبت درستنمایی ارائه کرد. همچنین گوپتا و ما4 در سال 1996، رائو و جوز5 در سال 2001 و نیری و رائو6 درسال 2003 آزمون والد را برای این مساله به کار گرفتند. تسو7 در سال 2009 از آزمون تقریبی نمره8 جهت آزمون برابری ضرایب تغییرات استفاده کرد. اخیرا نیز، لیو و همکاران9 (2010)، جعفری و کاظمی ( 2013) و کریشنامورتی و میسوک لی10 (2014) به ترتیب روش هایی بر اساس p- مقدار تعمیم یافته، بوت استراپ پارامتری و آزمون نسبت درستنمایی ارائه نمودند و خطای نوع اول و توان آزمون خود را با استفاده از شبیه سازی با روش های موجود مقایسه کردند. ما نیز در این پایان نامه، ابتدا با بهینه سازی روش جعفری و کاظمی (2013) روشی جدید بر پایه والد و بوت استراپ پارامتری جهت آزمون برابری ضرایب تغییرات در چند جامعه نرمال ارائه می دهیم و سپس با بهینه سازی آزمون والد روش جدید دیگری که عملکرد نسبتا بهتری نسبت به سایر روش ها دارد معرفی می کنیم. اما آماره آزمون ما متفاوت از جعفری و کاظمی (2013) می باشد. از آن جهت که در هر مساله آزمون فرض آماری، ارائه روشی که بتواند خطای نوع اول را به نحو مطلوبی کنترل کند اهمیت دارد نخست با استفاده از شبیه سازی، خطای نوع اول روش جدید پیشنهادی را با روش های نیری و رائو (2003)، لیو و همکاران (2010)، کاظمی و جعفری ( 2013 ) و کریشنامورتی و میسوک لی (2014) مقایسه می کنیم. نتایج شبیه سازی نشان می دهد که بر اساس خطای نوع اول، روش جدید پیشنهادی و کریشنامورتی و میسوک لی (2014) عملکرد بهتری نسبت به دیگر روش ها دارند. لذا فقط توان آزمون روش جدید پیشنهادی، با روش ارائه شده توسط کریشنامورتی و میسوک لی (2014) مقایسه می گردد. نتایج شبیه سازی نشان می دهد که در برخی موارد، توان آزمون روش جدید پیشنهادی بهتر از روش کریشنامورتی و میسوک لی (2014) می باشد. در مواردی نیز عکس این موضوع اتفاق می افتد و در برخی موارد دیگر، عملکرد این دو روش از دیدگاه توان مانند هم است. همچنین لازم به ذکر است که روش جدید پیشنهادی از لحاظ محاسباتی ساده تر از روش کریشنامورتی و میسوک لی (2014) است. ساختار پایان نامه به صورت زیر می باشد. در فصل 2، روش های مختلفی برای آزمون برابری ضرایب تغییرات در چند جامعه نرمال تاکنون ارائه شده است از جمله روش های لیو و همکاران (2010)، جعفری و کاظمی (2013)، روش جدید بهینه شده جعفری و کاظمی (2013)، کریشنامورتی و میسوک لی (2014) و آزمون والد نیری و رائو (2003) را به طور مختصر معرفی می کنیم. در فصل 3 آزمون جدیدی که براساس روش والد و استفاده از روش بوت استراپ پارامتری می باشد پیشنهاد و شرح می دهیم. در فصل 4، با استفاده از شبیه سازی به مقایسه آزمون جدید پیشنهادی با روش های دیگر از دیدگاه کنترل خطای نوع اول و توان آزمون می پردازیم. در همین فصل با ارائه یک مثال به توصیف روش های ارائه شده می پردازیم و با نتیجه گیری مبحث را به پایان خواهیم برد.
در این قسمت، نخست به معرفی نماد ها و مفاهیم اولیه مورد نیاز می پردازیم. سپس روش هایی را که اخیرا جهت آزمون برابری ضرایب تغییرات در چند جامعه نرمال ارائه شده اند معرفی می کنیم.
1-2- آشنایی با نماد ها
فرض کنید X_ij برای i=1,…k;j=1,…n_i نشان دهنده j– امین نمونه از i- امین جامعه نرمال با میانگین μ_i و واریانس σ_i^2 باشد. میانگین و واریانس جامعه i- ام به صورت زیر برآورد می شوند:
.X ̅_i=1/n_i ∑_(j=1)^(n_i)▒X_ij و〖S_i〗^2=1/(n_i-1) ∑_(j=1)^(n_i)▒〖(X_ij-X ̅_i 〗 )^2
همچنین x ̅_i و 〖s_i〗^2 را به عنوان مقادیر مشاهده شده از X ̅_i و 〖S_i〗^2 در نظر می گیریم. ضریب تغییرات جامعه i- ام را با ϕ_i=σ_i  /μ_i نشان می دهیم. هدف ما انجام آزمون برای فرضیه های زیر است :
{█(H_0: ϕ_1=ϕ_2 = … = ϕ_k=ϕ@〖 H〗_1:ϕ_i≠ϕ_j i≠j یک حداقل برای)┤
واضح است که فرضیه های فوق معادل با
{█(H_0: θ_1=θ_2 = … = θ_k=θ@ H_1:θ_i≠θ_j i≠j یک حداقل برای)┤
است که در آن θ_i=1/ϕ_i می باشد.
اگر H ماتریس مقابله ها با اندازه (k-1)×k و C برداری k×1 باشد به طوری که
H=(█(■(1&-1&0)…■(0&0)@■(1 &0&-1)…■(0&0)@⋮⋱⋮@■(1&0&0@1&0&0)…■(■(-1&0)@■(0&-1))))_((k-1)×k) و C=〖(■(θ_1&,⋯,&θ_k ))^’〗_(k×1)
آنگاه فرضیه مورد علاقه را می توان به صورت زیر نوشت:
H_0: HC=0 مقابل در H_1:HC≠0
در ادامه روش هایی را که اخیرا جهت آزمون فرض H_0 معرفی شده اند بیان می کنیم.
1-3- p- مقدار تعمیم یافته

فرض کنید Y یک متغیر تصادفی از توزیعی با پارامترهای (θ,δ) باشد به گونهای که θ پارامتر مورد علاقه و δ پارامتر مزاحم میباشد. (پارامتر مزاحم پارامتری است که در توزیع متغیر Y وجود دارد اما پارامتر مورد علاقه نیست.)
فرض کنید علاقهمند به آزمون Η_0:θ≤θ_0 در مقابل Η_1:θ>θ_0 هستیم به گونهای که θ_0 مقداری مشخص و معلوم میباشد. همچنین فرض کنید y نشان دهنده مقدار مشاهده شده متغیر Y باشد. آماره تعمیم یافته Τ(Y;y,θ,δ) که یک کمیت تصادفی است و به مقدار مشاهده شده y و پارامترها بستگی دارد را به همراه شرایط زیر در نظر بگیرید:
توزیع آماره Τ(Y;y,θ_0,δ) به پارامتر مزاحم δ بستگی نداشته باشد.
مقدار مشاهده شده Τ(Y;y,θ_0,δ) یعنی Τ(y;y,θ_0,δ) به پارامتر مزاحم δ بستگی نداشته باشد.
به ازای y و δ ثابت، P[Τ(Y;y,θ,δ)≥t] نسبت به θ غیر نزولی باشد. (3-2-1)
براساس شرایط فوق p- مقدار تعمیم یافته به صورت زیر تعریف میشود:
p-value=P[Τ(Y;y,θ_0,δ)≥t]
به گونهای که t=Τ(y;y,θ_0,δ) است.
1-4- روش بوت استراپ پارامتری
در این روش ابتدا پارامتر مجهول مورد علاقه را با توجه به مشاهداتی که در اختیار داریم برآورد و سپس آن را جایگزین پارامتر مجهول می کنیم و نمونهای دیگر از توزیع مورد نظر که برآورد پارامتر مجهول از مشاهدات جایگزین آن شده است را تولید میکنیم. (Efron, 1993). در واقع با نمونه گیری به دفعات زیاد با روش بوت استراپ پارامتری، می توان توزیع آماره ای را که توزیع آن نامعلوم است، تخمین زد.
1-5- معرفی آماره آزمون والد
فرض کنید H_0:μ=μ_0 باشد. در حالت کلی اگر Y_(k×1) برداری از متغیرهای تصادفی باشد به طوری که Y~N_k (μ,Σ) آنگاه
〖(Y〖-μ〗_0)〗^’ Σ^(-1) (Y〖-μ〗_0)~χ_k^2.
و اگر Y~^asy N_k (μ,Σ) آنگاه
〖(Y〖-μ〗_0)〗^’ Σ^(-1) (Y〖-μ〗_0)~^asy χ_k^2.
فصل دوم: معرفی روش های موجود برای آزمودن برابری ضرایب تغییرات در چند جامعه نرمال
2- معرفی روش های موجود
روش لیو و همکاران (2010)
روش لیو و همکاران (2010) بر اساس مفهوم کمیت های تعمیم یافته می باشد (ویرهاندی11، 1995). در این روش، کمیت های تعمیم یافته برای μ_i و σ_i   به صورت زیر می باشند:
R_(μ_i )=X ̅_i-s_i/S_i (X ̅_i-μ_i )=x ̅_i-1/√(n_i ) s_i T_i
و
R_(σ_i )=s_i/S_i σ_i=〖√(n_i-1) s〗_i/U_i
که در آنT_i~t_(n_i-1) و U_i^2~χ_(n_i-1)^2. بنابراین کمیت تعمیم یافته برای μ_i  /σ_i به صورت
R_(μ_i )/R_(σ_i ) =(X ̅_i-s_i/S_i (X ̅_i-μ_i ) )/(s_i/S_i σ_i )
می باشد. همچنین آماره آزمون به صورت زیر معرفی می شود:
.‖d‖^2=μ_R^’ Σ_R^(-1) μ_R و ‖D‖^2=(R_Hc-μ_R )^’ Σ_R^(-1) (R_Hc-μ_R )
که در آن
R_HC=H(R_(μ_1 )/R_(σ_1 ) ,…,R_(μ_k )/R_(σ_k ) )^’,
μ_R=E(R_HC│(x ̅,s) )=H(E( R_(μ_1 )/R_(σ_1 ) │(x ̅,s) ), …, E( R_(μ_k )/R_(σ_k ) │(x ̅,s) ))^’,
Σ_R=Cov(R_HC│(x ̅,s) )=Hdiag{Var( R_(μ_1 )/R_(σ_1 ) │(x ̅,s) ) ,…, Var( R_(μ_k )/R_(σ_k ) │(x ̅,s) )} H^’.
با توجه به اینکه:
E( R_(μ_i )/R_(σ_i ) │(x ̅,s) )=x ̅_i/(√((n_i-1) ) s_i ) E(U_i )=x ̅_i/(√((n_i-1) ) s_i ) Γ(n/2)/Γ((n-1)/2) √2,
Var( R_(μ_i )/R_(σ_i ) │(x ̅,s) )=(x ̅_i^2)/((n_i-1) s_i^2 ) var(U_i )+1/n_i
=(x ̅_i^2)/((n_i-1) s_i^2 ) [n_i-1-(Γ(n/2)/Γ((n-1)/2) √2)^2 ]+1/n_i .
در حالت کلی diag{a_1,…,a_k } نشان دهنده ماتریس قطری k×k است که اعضای روی قطر اصلی آن a_i ها هستند.
فرض صفر در سطح α زمانی رد می شود که
P_(H_0 ) (‖D‖^2≥‖d‖^2 )≤α.
برای جزئیات بیشتر جهت محاسبه احتمال فوق به لیو و همکاران (2010) مراجعه کنید.
2-3- روش جعفری و کاظمی (2013)
ساختار آماره این آزمون شبیه به آماره والد می باشد.اگر C ̃ و V^* را به صورت زیر تعریف کنیم.
C ̃=〖(■(X ̅_1/S_1 &,…,&X ̅_k/S_k ))^’〗_(k×1), و V^*=diag{1/n_1 ,…,1/n_k }
آنگاه آماره آزمون به صورت زیر معرفی می شود:
Q=(HC ̃ )^’ [HV^* H^’ ]^(-1) (HC ̃ ) (1-2)
برای محاسبه ساده آماره فوق نیاز به قضیه زیر داریم.
قضیه 2-1- اگر A ماتریسی معکوس پذیر، d یک بردار و k یک مقدار ثابت باشد آنگاه
(A+kdd^’ )^(-1)=A^(-1)-(kA^(-1) dd^’ A^(-1))/(1+kd^’ A^(-1) d).
اثبات:
برای اثبات قضیه فوق کافی است در عبارت (A+kdd^’ )x=b که در آن x و b بردارهایی با بعد مناسب هستند؛ x را بیابیم. با توجه به عبارت بالا داریم:
x+kA^(-1) dd^’ x=A^(-1) b (*)
و در نتیجه
d^’ x+kd^’ A^(-1) dd^’ x=d^’ A^(-1) b
با توجه با اینکه d^’ x کمیتی یک بعدی خواهد بود؛ داریم:
d^’ x(1+kd^’ A^(-1) d)=d^’ A^(-1) b
d^’ x=(d^’ A^(-1) b)/(1+kd^’ A^(-1) d) (**)
با توجه به عبارت (*)، داریم:
x=A^(-1) b-kA^(-1) dd^’ x
و با استفاده از (**)، x برابر است با:
〖x=A〗^(-1) b-kA^(-1) d (d^’ A^(-1) b)/(1+kd^’ A^(-1) d)=A^(-1) b-(kA^(-1) dd^’ A^(-1) b)/(1+kd^’ A^(-1) d)
=(A^(-1)-(kA^(-1) dd^’ A^(-1))/(1+kd^’ A^(-1) d))b
که نتیجه، حاصل و اثبات تمام می گردد.

حال به راحتی می توان نشان داد که
HV^* H^’=1/n_1 11^’+diag{1/n_2 ,…,1/n_k },
که در آن 1^’=(1,…,1)^’ است.
و برای محاسبه آماره Q اگر قرار دهیمD=diag{1/n_2 ,…,1/n_k } باتوجه به قضیه 2-1- داریم:
Q=(HC ̃ )^’ [HV^* H^’ ]^(-1) (HC ̃ )
=(HC ̃ )^’ [D^(-1)-(1/n_1 D^(-1) 〖11〗^’ D^(-1))/(1+1/n_1 1^’ D^(-1) 1)](HC ̃ )
=(HC ̃ )^’ D^(-1) (HC ̃ )-B(HC ̃ )^’ D^(-1) 〖11〗^’ D^(-1) (HC ̃ ),
که در آن B یک مقدار ثابت و برابر است با:
B=(1/n_1 )/(1+1/n_1 1^’ D^(-1) 1).
بنابراین
Q=∑_(i=1)^k▒〖n_i 〖(θ ̃_1-θ ̃_i)〗^2 〗-1/(∑_(i=1)^k▒n_i ) [∑_(i=1)^k▒〖n_i 〖(θ ̃〗_1-θ ̃_i)〗]^2
=θ ̃_1^2 ∑_(i=1)^k▒n_i -2θ ̃_1 ∑_(i=1)^k▒〖n_i θ ̃_i 〗+∑_(i=1)^k▒〖n_i θ ̃_i^2 〗-(θ ̃_1^2)/(∑_(i=1)^k▒n_i ) (∑_(i=1)^k▒n_i )^2+(2θ ̃_1)/(∑_(i=1)^k▒n_i ) ∑_(i=1)^k▒n_i ∑_(i=1)^k▒〖n_i θ ̃_i 〗-1/(∑_(i=1)^k▒n_i ) (∑_(i=1)^k▒〖n_i θ ̃_i 〗)^2
=∑_(i=1)^k▒n_i 〖θ ̃_i〗^2-1/n (∑_(i=1)^k▒n_i θ ̃_i )^2
=∑_(i=1)^k▒n_i (X ̅_i/S_i )^2-1/n (∑_(i=1)^k▒n_i (X ̅_i/S_i ))^2.
در نتیجه آماره آزمون روش جعفری و کاظمی (2013) به صورت زیر خواهد بود:
Q=∑_(i=1)^k▒n_i (X ̅_i/S_i )^2-1/n (∑_(i=1)^k▒n_i (X ̅_i/S_i ))^2.
قضیه 2-2- آماره Q تحت فرض صفر، نسبت به پارامتر مقیاس پایاست.
اثبات:
با توجه به اینکه θ_i=μ_i  /σ_i ، تحت فرض صفر داریم i=1,…,k ;μ_i=〖θσ〗_i. در نتیجه تحت فرض صفرX_ij~N(θσ_i,σ_i^2 ) برای .j=1,…,n_i ; i=1,…,k اگر قرار دهیم Z_ij=(X_ij-θσ_i)/σ_i آنگاه X_ij=Z_ij σ_i+〖θσ〗_i ، X ̅_i=Z ̅_i σ_i+θσ_i و S_i^2=(σ_i^2)/(n_i-1) ∑_(j=1)^(n_i)▒(Z_ij-Z ̅_i )^2 که در آن Z ̅_i~N(0, 1/(n_i )). در نتیجه نسبت X ̅_i/S_i، مستقل از σ_i است.

فرض H_0 برای مقادیر بزرگ Q، رد می شود. برای محاسبه p- مقدار، از روش بوت استراپ پارامتری استفاده می شود.
در روش جعفری و کاظمی (2013) نیز توزیع آماره Q با روش بوت استراپ پارامتری تخمین زده می شود. به این صورت که نخست، آماره بوت استراپ به صورت زیر معرفی می گردد:
Q_B=∑_(i=1)^k▒n_i ((X ̅_i^B)/(S_i^B ))^2-1/n (∑_(i=1)^k▒n_i ((X ̅_i^B)/(S_i^B )))^2,
که در آن n=∑_(i=1)^k▒n_i ، X ̅_i^B~N(θ ̃,1/n_i )، 〖S_i^2〗^B~1/(n_i-1) χ_(n_i-1)^2 و θ ̃ برآوردگری مناسب برای θ (مقدار مشترک θ_i ها) می باشد. برای محاسبه p- مقدار، از Q_B تحت H_0 مشاهداتی به دفعات زیاد (مثلا 10000 مرتبه) تولید می شود و نسبت دفعاتی که مقادیر تولید شده Q_B از مقدار مشاهده شده Q بیشتر باشد به عنوان برآوردی برای p- مقدار در نظر گرفته می شود. ذکر این نکته لازم است که آماره Q تحت فرص صفر نسبت به پارامتر مقیاس پایاست. پس بدون از دست دادن کلیت مسئله فرض شده است که σ_i=1; i=1,…,k. برای برآورد مقدار مشترک θ_i ها، یک برآوردگر معقول، میانگین وزنی X ̅_i/S_i ها یعنی (∑_(i=1)^k▒n_i (X ̅_i/S_i ))⁄n است. این برآوردگر توسط جعفری و کاظمی (2013) در حالتی که فقط اطلاعات میانگین و واریانس نمونه ای در دسترس می باشد توصیه شده است. اما همانطور که در شبیه سازی خواهیم دید؛ در صورت استفاده از این برآوردگر وضعیت خوبی در کنترل خطای نوع اول نخواهیم داشت ولی با استفاده از برآورد درستنمایی ماکزیمم θ نتایج کمی بهتر خواهد بود. اما برآورد درستنمایی ماکزیمم برای θ و σ_i ها به صورت صریح بدست نمی آیند و برای یافتن آنها باید از روشهای عددی استفاده نمود. زیرا تابع درستنمایی تحت فرض صفر به صورت زیر حاصل می گردد:
L_0=∏_(i=1)^k▒(1/(√2π θμ_i ))^(n_i ) e^(-∑_(i=1)^k▒∑_(j=1)^(n_i)▒〖1/(2θ^2 μ_i^2 ) (X_ij-μ_i )〗^2 )
همچنین مشتقات تابع درستنمایی نسبت به μ_i و θ به صورت زیر می باشند:
∂Ln(L_0 )/( ∂μ_i )=-n_i/μ_i +∑_(j=1)^(n_i)▒(X_ij (X_ij-μ_i ))/(θ^2 μ_i^3 )
و
∂Ln(L_0 )/( ∂θ)=-n_i/θ+∑_(j=1)^(n_i)▒(X_ij-μ_i )^2/(θ^3 μ_i^2 ).
واضح است که با مساوی صفر قرار دادن عبارت فوق، برآورد درستنمایی ماکزیمم برای θ و σ_i ها به صورت صریح بدست نمی آیند.
نکته دیگر در مورد آماره Q اینست که به نظر می آید این آماره بر خلاف ادعای جعفری و کاظمی (2013) به صورت مجانبی تحت فرض صفر دارای توزیع کای مربع نمی باشد. با استفاده از واریانس تقریبی X ̅_i/S_i می توان نشان داد با در نظر گرفتن ضریب 2/(2+θ^2) برای Q، این آماره به صورت مجانبی تحت فرض صفر دارای توزیع کای دو با k-1 درجه آزادی می شود یعنی
Q_c=(2/(2+θ^2 ))Q~^asy χ_((k-1))^2.
این مطلب را در قالب قضیه زیر بیان و اثبات می کنیم.
قضیه 3-1- Q_c تحت فرض صفر به صورت مجانبی دارای توزیع کای مربع با k-1 درجه آزادی است.
اثبات:
با استفاده از بسط تیلور برای توابع دو متغیره، می توان امید ریاضی و واریانس تقریبی (از مرتبه n^(-1)) X ̅_i/S_i را به صورت زیر بدست آورد:
E(X ̅_i/S_i )=E(θ ̂_i )=θ_i+O(n^(-1) )
Var(X ̅_i/S_i )=Var(θ ̂_i )=((2+〖θ_i〗^2)/(2n_i ))+O(n^(-1) ).
برای اینکه Q تحت فرض صفر به صورت مجانبی دارای توزیع کای مربع با k-1 درجه آزادی باشد باید امید ریاضی آماره Q برابر با مقدار k-1 شود. پس
E_(H_0 ) (Q)=E_(H_0 ) [∑_(i=1)^k▒n_i (X ̅_i/S_i )^2-1/n (∑_(i=1)^k▒n_i (X ̅_i/S_i ))^2 ]=∑_(i=1)^k▒n_i 〖E_(H_0 ) (X ̅_i/S_i )〗^2-1/n E_(H_0 ) (∑_(i=1)^k▒n_i (X ̅_i/S_i ))^2
=∑_(i=1)^k▒n_i [Var(X ̅_i/S_i )+E_(H_0)^2 (X ̅_i/S_i )]-1/n [Var(∑_(i=1)^k▒n_i (X ̅_i/S_i ))+E_(H_0)^2 (∑_(i=1)^k▒n_i (X ̅_i/S_i ))]
=∑_(i=1)^k▒n_i Var(X ̅_i/S_i )+〖∑_(i=1)^k▒n_i E〗_(H_0)^2 (X ̅_i/S_i )-1/n ∑_(i=1)^k▒n_i^2 Var(X ̅_i/S_i )-1/n [∑_(i=1)^k▒n_i 〖E_H〗_0 (X ̅_i/S_i )]^2
=∑_(i=1)^k▒(2+θ^2)/2+θ^2 ∑_(i=1)^k▒n_i -(2+θ^2)/2n ∑_(i=1)^k▒n_i -θ^2/n (∑_(i=1)^k▒n_i )^2
=k+θ^2/2 k+nθ^2-(2+θ^2)/2-nθ^2=k+θ^2/2 k-1-θ^2/2
=k-1+θ^2/2 (k-1)=(k-1)(1+θ^2/2)=(k-1)((2+θ^2)/2).
در نتیجه
E(2/(2+θ^2 ) Q)=k-1.
پس
Q_c=(2/(2+θ^2 ))Q~^asy χ_((k-1))^2.

2-4- روش بهینه شده جعفری و کاظمی (2013)
در این قسمت با بهینه سازی روش جعفری و کاظمی (2013)، روشی جدید برای آزمون برابری ضرایب تغییرات در چند جامعه نرمال ارائه می شود. به راحتی می توان دید که X ̅_i/S_i و S_i به ترتیب برای θ_i و σ_i برآوردگرهای اریب هستند. لذا ما به جای این دو برآوردگر از θ ̂_i=X ̅_i/〖d_i S〗_i
و
σ ̂_i=s_i √((n_i-1)/2) [(Γ((n_i-1)/2))/(Γ(n_i/2))]
استفاده می کنیم که در آن d_i=√((n_i-1)/2) [(Γ(n_i/2-1))/(Γ((n_i-1)/2))] است. θ ̂_i و σ ̂_i برای θ_i و σ_i برآوردگرهای ناریب با کمترین واریانس (UMVUE) هستند. در این روش بر خلاف جعفری و کاظمی (2013) به منظور دقت بیشتر واریانس دقیق θ ̂_i محاسبه می شود.
Var(θ ̂_i )=((n_i-1)/(n_i-3))((θ_i^2)/(d_i^2 )+1/(d_i^2 n_i ))-θ_i^2,
و یک برآوردگر UMVU برای Var(θ ̂_i ) عبارت است از:
V_i=(X ̅_i/S_i )^2 (1/(d_i^2 )-(n_i-1)/(n_i-3))+1/n_i .
با تعریف C ̂ و V به صورت
C ̂=〖(■(X ̅_1/〖d_1 S〗_1 &,…,&X ̅_k/〖d_k S〗_k ))^’〗_(k×1) و V=diag{V_1,…,V_k}
می توان آماره آزمون اصلاح شده را بر اساس روش والد به صورت زیر تعریف نمود.
T=(HC ̂ )^’ [HVH^’ ]^(-1) (HC ̂ )
=∑_(i=1)^k▒〖W_i θ ̂_i^2 〗-1/(∑_(i=1)^k▒W_i ) (∑_(i=1)^k▒〖W_i θ ̂_i 〗)^2,
که در آن W_i=1/V_i می باشد. نحوه محاسبه آماره T با استفاده از قضیه 2-1 و همانند روش ارائه شده در قسمت 2-3 می باشد. در نتیجه آماره بوت استراپ در روش جعفری و کاظمی (2013) به صورت زیر تغییر می یابد.
T_B=∑_(i=1)^k▒W_i^B ((X ̅_i^B)/(〖d_i S〗_i^B ))^2-1/(∑_(i=1)^k▒W_i^B ) (∑_(i=1)^k▒W_i^B ((X ̅_i^B)/(〖d_i S〗_i^B )))^2
که در آن W_i^B=1/(V_i^B ) ، V_i^B=((X ̅_i^B)/(S_i^B ))^2 (1/(d_i^2 )-(n_i-1)/(n_i-3))+1/n_i ، X ̅_i^B~N(θ ̃,1/n_i ) ، S_i^2B~1/(n_i-1) χ_(n_i-1)^2 و θ ̃ برآوردگری مناسب برای برآورد مقدار مشترک ضرایب تغییرات است که بر خلاف روش جعفری و کاظمی (2013) تفاوتی در استقاده از برآوردگر ماکزیمم درستنمایی یا برآوردگر وزنی θ ̅  ̂_w=(∑_(i=1)^k▒W_i (X ̅_i/〖d_i S〗_i ))/(∑_(i=1)^k▒W_i ) نیست و البته پرواضح است که استفاده از θ ̅  ̂_w در عمل بسیار ساده تر خواهد بود چرا که برآورد ماکزیمم درستنمایی مقدار مشترک ضرایب تغییرات به صورت صریح بدست نمی آید و باید با روش های عددی محاسبه گردد. آماره T نیز با اثبات مشابه با قضیه 2-2، تحت فرض صفر نسبت به پارامتر مقیاس پایاست لذا فرض شده است σ_i=1; i=1,…,k. فرض صفر زمانی رد می شود که
P(T_B≥t)≤α,
که در آن t مقدار مشاهده شده T می باشد.
در روش بهینه شده جعفری و کاظمی، بر خلاف روش جعفری و کاظمی (2013)، آماره T تحت فرض صفر به صورت مجانبی دارای توزیع خی دو با k-1 درجه آزادی است. این مطلب با استفاده از قضیه زیر قابل اثبات است.
قضیه 2-4-1 فرض کنید X_i1,…X_(in_i ) نمونه ای تصادفی از توزیع F(.) با میانگین μ_i و واریانس σ_i^2 باشد. آنگاه
√n_i ((■(X ̅_i@S_i^2 ))-(■(μ_i@σ_i^2 ))) □(→┴D ) N((■(0@0)),[■(σ_i^2&μ_i3@μ_i3&μ_i4-σ_i^4 )])
که در آن X ̅_i=∑_(j=1)^(n_i)▒X_ij ، 〖S_i〗^2=1/n_i ∑_(j=1)^(n_i)▒〖(X_ij-X ̅_i 〗 )^2 و E(X_i^r )=μ_ir.
اثبات:
باتوجه به قضیه حد مرکزی براحتی می توان نشان داد که
(*) √n_i (X ̅_i-μ_i)□(→┴D ) N(0,σ_i^2).
همچنین می دانیم که 〖S_i〗^2=(X^2 ) ̅_i-X ̅_i. بدلیل اینکه 〖S_i〗^2 به پارامتر مکان بستگی ندارد بدون از دست دادن کلیت مسئله فرض می کنیم μ_i=0. بنابراین E((X^2 ) ̅_i )=σ_i^2 و E(X ̅_i )=0. بار دیگر با استفاده از قضیه حد مرکزی داریم:
√n_i ((■(X ̅_i@(X_i^2 ) ̅ ))-(■(0@σ_i^2 ))) □(→┴D ) N((■(0@0)),Σ)
که در آن Σ=[■(V(X_i)&Cov(X_i,X_i^2)@Cov(X_i,X_i^2)&V(X_i^2))].
تابع g: R^2 □(→┴ ) R را به صورت g(■(x@y))=y-x^2 تعریف می کنیم. با استفاده از قضیه اسلاتسکی داریم:
√n_i (g(■(X ̅_i@(X_i^2 ) ̅ ))-g(■(0@σ_i^2 ))) □(→┴D ) N((■(0@0)),[g^’ (■(0@σ_i^2 ))]Σ[g^’ (■(0@σ_i^2 ))]^T ),
که در آن g^’ (■(x@y))=[■(∂g/∂x&∂g/∂y)]. بنابراین
(**) √n_i (〖S_i〗^2-σ_i^2)□(→┴D ) N(0,μ_i4-σ_i^4)
با درنظر گرفتن عبارات (*) و (**) اثبات کامل می شود.

تابع h: R^2 □(→┴ ) R را به صورت h(■(x@y))=x/(√y) در نظر بگیرید. با استفاده از عبارت (**) و قضیه اسلاتسکی داریم:
√(n_i ) (X ̅_i/S_i -μ_i/σ_i )=√(n_i ) (θ ̂_i-θ_i ) □(→┴D ) N((■(0@0)),[h^’ (■(μ_i@σ_i^2 ))]Σ[h^’ (■(μ_i@σ_i^2 ))]^T )
بنابراین X ̅_i/S_i به صورت مجانبی دارای توزیع نرمال و به تبع آن X ̅_i/d_i S_i به صورت مجانبی دارای توزیع نرمال است. لذا با اندک تفاوت در جزییات داریم:
HC ̂~^asy N(HC,HVH^’ ).
در نتیجه با استفاده از تعریف آماره والد ارایه شده در 1-5- آماره T تحت فرض صفر به صورت مجانبی دارای توزیع خی دو با k-1 درجه آزادی است.
ضمن اینکه شبیه سازی ها نشان می دهد که این روش عملکرد مناسبتری در کنترل خطای نوع اول نسبت به روش جعفری و کاظمی (2013) دارد (قسمت 4-1، جدول 1و2را ملاحظه کنید).
فصل سوم:روش جدید پیشنهادی
3- روش جدید پیشنهادی
3-1- روش جدید پیشنهادی
نیری و رائو12(2003) با استفاده از بسط تیلورX ̅_i⁄S_i ، برآورد واریانس تقریبی آن را (از مرتبه n^(-1)) به صورت زیر محاسبه نمودند:
R_i=(2+(X ̅_i/S_i )^2)/(2n_i ).
اگر قرار دهیم R=diag{R_1,…,R_k} آنگاه آماره آزمون بر اساس ایده والد به صورت زیر خواهد بود:
WT=(HC ̃ )^’ [HRH^’ ]^(-1) (HC ̃ )
=∑_(i=1)^k▒L_i (X ̅_i/S_i )^2-1/(∑_(i=1)^k▒L_i ) (∑_(i=1)^k▒L_i (X ̅_i/S_i ))^2. (3-1)
که در آن L_i=1/R_i . نحوه بدست آمدن آماره WT با استفاده از قضیه 2-1 و شبیه روش ارائه شده در قسمت 2-3 می باشد. نیری و رائو (2003) نشان دادند که WT تحت فرض صفر، به صورت مجانبی دارای توزیع کای دو با k-1 درجه آزادی است و فرض صفر زمانی رد می شود که WT>χ_((k-1))^2 (α). این آماره از لحاظ محاسباتی راحت است ولی همچنان که خواهیم دید از دیدگاه خطای نوع اول عملکرد مطلوبی برای حجم نمونه های کم ندارد. روش جدید پیشنهادی ما استفاده از تکنیک بوت استراپ پارامتری برای آمارهWT می باشد. یعنی آماره بوت استراپ را به صورت زیر در نظر می گیریم.
WT_B=∑_(i=1)^k▒L_i^B ((X ̅_i^B)/(S_i^B ))^2-1/(∑_(i=1)^k▒L_i^B ) (∑_(i=1)^k▒L_i^B ((X ̅_i^B)/(S_i^B )))^2, (3-2)
که در آنL_i^B=1/(R_i^B )، R_i^B=((2+((X ̅_i^B)/(S_i^B ) )^2 ) )⁄(2n_i )، X ̅_i^B~N(θ ̃,1/n_i ) ، S_i^2B~1/(n_i-1) χ_((n_i-1))^2 و θ ̃ برآوردگری مناسب برای مقدار مشترک θ_i ها می باشد. این برآوردگر می تواند میانگین وزنی X ̅_i/S_i ها یعنی θ ̅  ̂_L=(∑_(i=1)^k▒L_i (X ̅_i/S_i ))⁄(∑_(i=1)^k▒L_i ) یا برآورد ماکزیمم درستنمایی θ باشد. شبیه سازی ها نشان می دهند بر خلاف روش کاظمی و جعفری (2013)، در روش جدید پیشنهادی ما تفاوتی در استفاده از θ ̅  ̂_L و برآوردگر ماکزیمم درستنمایی θ نیست. لذا به مانند روش کاظمی و جعفری (2013) مجبور به یافتن برآوردگر ماکزیمم درستنمایی با استفاده از روشهای عددی نیستیم. واضح است استفاده از θ ̅  ̂_L به عنوان برآورد θ، بسیار راحت تر خواهد بود. لازم به ذکر است که آماره WT با اثباتی شبیه به قضیه 2-2 نسبت به پارامتر مقیاس پایا است. پس بدون از دست دادن کلیت مسئله فرض شده است که σ_i=1, i=1,…,k. همچنین مانند قسمت 2-4 می توان نشان داد که برخلاف آماره ارائه شده توسط جعفری و کاظمی (2013)، WT تحت فرض صفر دارای توزیع مجانبی کای دو با k-1 درجه آزادی است. بنابراین در روش پیشنهادی ما، در سطح α فرض صفر رد می شود اگر
P_(H_0 ) (〖WT〗_B≥wt)≤α, (3-3)
که در آن wt مقدار مشاهده شده ی WT است. پیشنهاد ما برای محاسبه p- مقدار استفاده از روش بوت استراپ پارامتری است. یعنی به دفعات زیاد از 〖WT〗_B تحت H_0 مشاهده تولید می کنیم و تعداد دفعاتی که مشاهدات تولید شده بیشتر از wt هستند به عنوان برآوردی برای p- مقدار ارائه می شود. (برای الگوریتم محاسبه P- مقدار ، فصل 4 را ملاحظه کنید).
کریشنامورتی و میسوک لی نیز در سال 2014 آزمون بهینه شده ی نسبت درستنمایی را برای این مسئله بکار گرفتند که بدلیل عملکرد نسبتا مناسب این روش، ما آن را نیز به اختصار معرفی می کنیم.
3-2- روش کریشنامورتی و میسوک لی (2014)
در این روش آماره آزمون نسبت درستنمایی بهینه سازی شده است. لگاریتم تابع درستنمایی بر اساس k جامعه نرمال تحت فرض صفر و بعد از حذف نمودن مقادیر ثابت به صورت زیر می باشد:
l(μ,ϕ)=-∑_(i=1)^k▒〖n_i ln〗⁡(μ_i ϕ) -∑_(i=1)^k▒(n_i (σ ̂_i^2+(X ̅_i-μ_i )^2 ))/(2ϕ^2 μ_i^2 ),
که در آن σ ̂_i^2=(n_i-1)/n_i S_i^2 و ϕ مقدار مشترک ضرایب تغییرات تحت H_0 می باشد. همانطور که قبلا ذکر شد برآورد ماکزیمم درستنمایی ϕ و μ_i به صورت صریح قابل محاسبه نیستند و برای بدست آوردن آن ها باید از روشهای عددی استفاده نمود. در نهایت آماره آزمون نسبت درستنمایی به صورت زیر حاصل می گردد:
Λ=2[ln⁡(μ ̂  ̂_1,ϕ ̂  ̂_1,…,μ ̂  ̂_k,ϕ ̂  ̂_k )-ln⁡〖(μ ̂_1,ϕ ̂_1,…,μ ̂_1,ϕ ̂_1 )] 〗
=-2[∑_(i=1)^k▒〖n_i ln〗⁡((μ ̂_i ϕ ̂)/(σ ̂_i^2 )) ],
که در آن μ ̂_i و ϕ ̂ برآوردگر های ماکزیمم درستنمایی تحت فرض صفر برای μ_i و ϕ و μ ̂  ̂_i,ϕ ̂  ̂_i برآوردگر های ماکزیمم درستنمایی تحت فضای کلی پارامتر هستند. برای جزییات بیشتر به کریشنامورتی و میسوک لی (2014)مراجعه گردد. اگر میانگین و واریانس Λ را به ترتیب با m(Λ) و v(Λ) نشان دهیم آماره بهینه شده ی روش نسبت درستنمایی به صورت زیر خواهد بود:
Λ_M=√(2(k-1) ) ((Λ-m(Λ))/√(v(Λ) ))+(k-1),
که تحت H_0 دارای توزیع تقریبیχ_((k-1))^2 می باشد. اما چون بدست آوردن m(Λ) و v(Λ) مشکل می باشد با استفاده از نمونه گیری به روش بوت استراپ پارامتری می توان آنها را برآورد کرد. به این صورت که نخست از X ̅_i^B~N(μ ̂_i,(μ ̂_i ϕ ̂)/n_i ) و S_i^2B~(μ ̂_i ϕ ̂)/n_i χ_((n_i-1))^2 مشاهداتی تولید و کمیت زیر محاسبه می شود
Λ^B=-2[∑_(i=1)^k▒〖n_i ln〗⁡((μ ̂_i^B ϕ ̂^B)/(σ ̂_i^2B )) ],
که در آن μ ̂_i^B، σ ̂_i^2B و ϕ ̂^B برآوردگر های ماکزیمم درستنمایی بر اساس مشاهدات بوت استراپ تولید شده از X ̅_i^B و S_i^2B هستند. سپس میانگین و واریانس Λ^B ها یعنی m(Λ^B) و v(Λ^B)، به ترتیب تقریبی برای m(Λ) و v(Λ) خواهند بود که این خود مستلزم استفاده مجدد از روش درستنمایی ماکزیمم (و روش های عددی جهت یافتن آن ها) در نمونه های بوت استراپ می باشد. در روش کریشنامورتی و میسوک لی (2014) در سطح α فرض صفر زمانی رد می شود وقتی که
Λ_M>χ_((k-1))^2 (α),
که در آن χ_((k-1))^2 (α) چندک _(1-α)ام از توزیع کای مربع با k-1 در جه آزادی است.
3-3- تفاوت های روش جدید پیشنهادی با دو روش اخیر
در اینجا لازم است که تفاوت های عمده روش جدید پیشنهادی ما با روش جعفری و کاظمی (2013) و کریشنامورتی و میسوک لی (2014) بیان گردد.
الف- بر خلاف ظاهر آماره آزمون جعفری و کاظمی (2013) و همچنین بر خلاف آنچه که جعفری و کاظمی (2013) در مقاله خود بیان داشته اند به نظر می آید آماره Q در عبارت (1) تحت فرض H_0 دارای توزیع خی دو با k-1 درجه آزادی نمی باشد. با استفاده از واریانس تقریبی X ̅_i/S_i می توان نشان داد با در نظر گرفتن ضریب 2/2+θ^2 برای Q، این آماره به صورت مجانبی تحت فرض صفر دارای توزیع خی دو با k-1 درجه آزادی می شود یعنی
Q_c=(2/(2+θ^2 ))Q~^asy χ_((k-1))^2.
این در حالی است که آماره آزمون پیشنهادی ما بر اساس ساختار آماره آزمون والد تحت فرض H_0 دارای توزیع مجانبی خی دو با k-1 درجه آزادی است. این نتیجه که آماره جعفری و کاظمی (2013) دارای توزیع خی دو نیست ابتدا در شبیه سازی ها بدست آمد. در شبیه سازی مشاهده گردید که آماره جعفری و کاظمی (2013) مقادیر بسیار بزرگی بدست می دهد که سازگاری با مقادیر توزیع خی دو مثلا با 4 یا 5 درجه آزادی ندارد.
برای مثال زمانی که n=(100,100,100) و (0/1,0/1,0/1) θ= از آماره جعفری و کاظمی (2013) قبل و بعد از ضرب نمودن ضریب در آماره، 10000 مشاهده تولید شده است و بافت نگار آن ها را رسم کرده ایم و آن را با بافت نگار حاصل از 10000 مقدار مشاهده شده از توزیع خی دو با k-1=2 درجه آزادی مقایسه می نماییم.
شکل1. تخمین چگالی آماره جعفری و کاظمی (2013)
شکل 2و3. تخمین چگالی آماره جعفری و کاظمی (2013) بعد از ضرب نمون ضریب و چگالی خی
دو با دو درجه آزادی
مشاهده می شود که آماره جعفری وکاظمی (2013) بعد از ضرب نمودن ضریب، به چگالی خی دو شبیه می شود.
2- عمده ترین تفاوت روش جدید پیشنهادی ما و جعفری و کاظمی (2013) ، عملکرد آن ها در کنترل خطای نوع اول بر اساس شبیه سازی ها می باشد.. جعفری و کاظمی (2013) دو برآوردگر برای مقدار مشترک ضرایب تغییرات ارایه دادند. در صورت استفاده از برآوردگر وزنی (∑_(i=1)^k▒n_i (X ̅_i/S_i ))⁄n برای برآورد θ ، روش جعفری و کاظمی (2013) عملکرد بسیار ضعیفی در برآورد خطای نوع اول خواهد داشت و در بسیاری موارد مقدار صفر را به عنوان برآورد خطای نوع اول ارائه می دهد.(فصل 4 جدول 3و4 را ملاحظه کنید). پس زمانی که فقط اطلاعات میانگین و واریانس نمونه ای موجود می باشد(وقتی که خود مشاهدات در دسترس نیست) استفاده از این روش مناسب نمی باشد. در صورت استفاده از برآورد ماکزیمم درستنمایی برای θ، عملکرد این روش در برآورد خطای نوع اول کمی بهبود می یابد اما باز هم در برخی موارد مقادیر بسیار کوچکی را به عنوان برآورد خطای نوع اول ارائه می دهد (فصل 4 جدول 3و4 را ملاحظه کنید). لازم به ذکر است که کاهش خطای نوع اول باعث کاهش توان آزمون می شود.
3- در روش جدید پیشنهادی ما تفاوتی در استفاده از برآوردگر وزنی یا ماکزیمم درستنمایی برای θ نیست. پر واضح است که در روش پیشنهادی ما استفاده از برآوردگر وزنی θ ̅  ̂_w=(∑_(i=1)^k▒W_i (X ̅_i/S_i ))⁄(∑_(i=1)^k▒W_i ) بسیار راحت تر از استفاده از برآوردگر ماکزیمم درستنمایی برای برآورد مقدار مشترک ضرایب تغییرات یعنی θ خواهد بود زیرا برآورد ماکزیمم درستنمایی θ به صورت صریح بدست نمی آید و باید به صورت عددی محاسبه گردد. لذا ما به مانند روش های جعفری و کاظمی (2013) و کریشنامورتی و میسوک لی (2014) مجبور به یافتن برآورد ماکزیمم درستنمایی برای θ نیستیم.
لازم به ذکر است به دلیل اینکه آماره های آزمون والد و آزمون نسبت درستنمایی تحت فرض صفر به صورت مجانبی معادلند Engle)1984، صفحه 798(13. بنابراین انتظار داریم که آزمون پیشنهادی ما با آزمون کریشنامورتی و میسوک لی (2014) تقریبا از لحاظ خطای نوع اول عملکردی شبیه به یکدیگر داشته باشند اما در توان آزمون با یکدیگر متفاوت باشند. این مطلب در قالب قضیه زیر بیان می کنیم.
قضیه 3-2- آزمون های والد و نسبت درستنمایی تحت فرض صفر و برقراری شرایط نظم برای برآرودهای ماکزیمم درستنمایی به صورت مجانبی معادلند.
اثبات این مطلب در حالت کلی از حوصله این پایان نامه خارج است اما ایده اثبات از مسیر زیر می تواند باشد.
فرض کنید که نمونه تصادفی X_1,…,X_n از چگالی f(x│θ) و فرض صفر به صورت H_0:θ_(k×1) ∈Θ_0 که در آن Θ_0 فضای پارامتر تحت H_0 و Θ فضای پارامتر باشد. اگر برآورد ماکزیمم درستنمایی θ تحت Θ_0 را با θ_n^* و برآورد ماکزیمم درستنمایی θ تحت Θ را با θ ̂_n نشان دهیم آنگاه آماره نسبت درستنمایی به صورت
λ_n=(L_n (θ_n^*))/(L_n (θ ̂_n))
خواهد بود واضح است که
-2ln(λ_n )=2[l_n (θ ̂_n )-l_n (θ_n^* )]
که درآن l_n (.)=ln(L_n (.)) است. با استفاده از بسط تیلور l_n (θ_n^* ) ، حول θ ̂_n داریم:
l_n (θ_n^* )=l_n (θ ̂_n )+(l_n ) ̇(θ ̂_n )(θ_n^*-θ ̂_n )-n(θ_n^*-θ ̂_n )^’ I_n (θ_n^*)(θ_n^*-θ ̂_n )
که در حالت کلی
(l_n ) ̇(X_(k×1) )=(∂/(∂x_1 ) l_n (X),…,∂/(∂x_k ) l_n (X))
و
I_n (X)=[■(∂^2/(∂x_1 )^2 l_n (X)&⋯&∂^2/(∂x_1 ∂x_k ) l_n (X)@⋮&⋱&⋮@∂^2/(∂x_1 ∂x_k ) l_n (X)&⋯&∂^2/(∂x_k )^2 l_n (X))].
می توان نشان داد I_n (θ_n^* ) □(→┴(a.s.) ) 1/2 I(θ_0) که θ_0 در فرض صفر برقرار است (Ferguson 1996، صفحه 145). برای حجم نمونه زیاد (l_n ) ̇(θ ̂_n )=0 است بنابراین:
-2ln(λ_n )≈n(θ_n^*-θ ̂_n )^’ I(θ_0)(θ_n^*-θ ̂_n ).

فصل چهارم: شبیه سازی، مثال عددی و نتیجه گیری
4- شبیه سازی، مثال عددی و نتیجه گیری
شبیه سازی
در این قسمت ابتدا روش جعفری و کاظمی (2013) را با روش جدید بهینه شده جعفری و کاظمی که آنرا با نماد MJKL نشان می دهیم، از لحاظ کنترل خطای نوع اول و توان آزمون با یکدیگر مقایسه می کنیم. سپس روش جدید پیشنهادی ارائه شده در فصل 3 را با روش های ارائه شده توسط لیو وهمکاران (2010)، جعفری و کاظمی (2013)، والد کلاسیک نیری ورائو (2003) و کریشنامورتی و میسوک لی (2014) از لحاظ خطای نوع اول و توان با استفاده از شبیه سازی با یکدیگر مقایسه می کنیم. لازم به ذکر است که برای روش جعفری و کاظمی (2013) دو حالت موجود را بررسی کرده ایم. اول حالتی که مقدار مشترک ضرایب تغییرات از روش درستنمایی برآورد می شود که این روش را با علامت اختصاری JKL نمایش داده ایم. دوم حالتی که مقدار مشترک ضرایب تغییرات از میانگین وزنی X ̅_i⁄S_i ها برآورد می شود که این روش را با علامت اختصاریJKW نمایش می دهیم. روش های لیو وهمکاران (2010)، نیری ورائو (2003) و کریشنامورتی و میسوک لی (2014) نیز به ترتیب با علائم اختصاری GPT، WT و MLRT نمایش داده می شوند. همچنین روش جدید پیشنهادی نیز با نماد New معرفی می گردد.
در شبیه سازی برای روش جدید پیشنهادی، ناحیه بحرانی با استفاده از روش بوت استراپ پارامتری بدست آمده است. یعنی توزیع WT تحت H_0 و H_1 با استفاده از نمونه گیری به روش بوت استراپ پارامتری تخمین زده می شود. مراحل کار به صورت زیر است:
فرض کنید x_i1,…,x_(in_i ) برای i=1,…k داده شده باشد. با استفاده از شبیه سازی مونت کارلو مراحل زیر را انجام می دهیم:
محاسبه θ ̅  ̂_L که در 3-1 معرفی شده است.
محاسبه مقدار مشاهده شده ی آماره WT در عبارت (1-3).
تولیدX ̅_i^B و 〖S_i^2〗^B برای i=1,…,k، که در زیر بخش 3-1 معرفی شده اند.
محاسبه WT_B براساس عبارت (2-3).
تکرار مراحل 3و4 (10000 مرتبه).
برآورد مونت کارلو برای p- مقدار در عبارت (3-3) میانگین تعداد دفعاتی است که WT_B بیشتر از wt می باشد. نسبت تعداد دفعاتی که در N=10000 مرتبه، p- مقدار کمتر از α می شود برآورد خطای نوع اول (در صورتی که مقادیر WT_B تحت H_0 تولید شوند) و یا توان آزمون (در صورتی که مقادیر WT_B تحت H_1 تولید شوند) خواهد بود.
در روش WT، برای بررسی خطای نوع اول از تقریب توزیع کای دو با k-1 درجه آزادی (نیری و رائو، 2003) استفاده شده است. در روش های GPT، JKL و JKW با استفاده از روش مونت کارلو خطای نوع اول و توان آزمون تخمین زده شده اند (باN=10000 تکرار). برای جزییات بیشتر در ارتباط با نحوه محاسبه توان و خطای نوع اول آزمون، به لیو وهمکاران (2010)، کاظمی و جعفری (2013) و کریشنامورتی و میسوک لی (2014) مراجعه کنید. نتایج برآورد خطای نوع اول برای k=4و7 جامعه مستقل نرمال برای حجم نمونه و ضرایب تغییرات مختلف در جدول های 3و4 ارائه شده اند. در تمامی حالات خطای نوع اول اسمی، 5% در نظر گرفته شده است. لازم به ذکر است که روش های ارائه شده در این مقاله دارای توزیع تقریبی به ازای حجم نمونه های بزرگ هستند؛ لذا در شبیه سازی انجام شده، سعی بر این شده است که رفتار آزمون ها در حجم نمونه های کوچک بررسی شوند.
حجم نمونهآزمون مقدار مشترک ضرایب تغییرات05/01/03/035/03,3,5JKL0/0300 0/041 0/036 MJKL0/04970/053 0/051 3,5,5JKL0/034 0/026 0/040 MJKL0/0501 0/051 0/051 3,10,10JKL0/044 0/041 0/032 MJKL0/0514 0/052 0/051 3,20,20JKL0/047 0/038 0/041 MJKL0/0487 0/046 0/053 5,5,5JKL0/030 0/027 0/034 MJKL0/0486 0/050 0/054 5,6,7JKL0/030 0/041 0/027 MJKL0/0468 0/052 0/053 5,10,15JKL0/039 0/047 0/040 MJKL0/0482 0/048 0/053 5,5,20JKL0/040 0/039 0/035 MJKL0/0498 0/052 0/054 جدول 1. برآورد خطای نوع اول برای k=3 جامعه نرمال مستقل برای روش های JKL، MJKL.
همانطور که از جدول 1 مشاهده می شود روش MJKL عملکرد بهتری در برآورد احتمال خطای نوع اول دارد در حالی که روش JKL با اینکه خطای نوع اول را کنترل می کند اما در مواردی مقادیر کوچکی را به عنوان برآورد احتمال خطای نوع اول ارائه می دهد مانند حالتn=(3,5,5) و n=(5,5,5) برای θ=0/3 در نتیجه از این جهت روش MJKL نسبت به روش JKL برتری دارد.

جدول 2. برآورد توان برای k=3 جامعه نرمال مستقل برای روش های JKL، MJKL.
حجم نمونهآزمون مقدار مشترک ضرایب تغییرات0/1,0/1,0/30/1,0/1,0/20/1,0/2,0/30/1,0/3,0/33,3,5JKL0/2880/1190/1330/128MJKL0/00080/00540/0110/0453,5,5JKL0/3840/1290/1810/223MJKL0/3000/1000/0530/0253,10,10JKL0/5780/2240/2250/319MJKL0/6960/2790/0850/0173,20,20JKL0/7160/6210/2520/311MJKL0/9770/6610/2050/0165,5,5JKL0/4610/1270/2200/304MJKL0/5860/2720/3430/3665,6,7JKL0/5640/2690/3300/450MJKL0/6150/2510/2410/2125,10,15JKL0/8360/3680/5900/661MJKL0/8460/3670/2000/0815,5,20JKL0/7100/3210/5270/494MJKL0/1590/0180/0250/073
با توجه به جدول 2 با اینکه در برخی موارد توان آزمون در روش MJKL بیشتر از روش JKL است اما در برخی موارد نادر، روش MJKL عملکرد بسیار ضعیفی در برآورد توان دارد مانند حالت n=(5,5,20) برای0/1,0/1,0/2) θ=( که این حکایت از اریب بودن آزمون در روش MJKL دارد. لذا چه در برآورد خطای نوع اول و چه در برآورد توان ما حالات دیگر را بررسی نکرده ایم و به ارائه همین حالات اکتفا می نماییم. لازم به ذکر است که روش MJKL در موارد بسیاری نیز عملکرد بسیار بهتری در توان آزمون نسبت به روش JKL دارد اما بدلیل عملکرد ضعیف این روش در موارد ذکر شده حالات دیگر در این پایان نامه بررسی نشده اند.
جدول 3. برآورد خطای نوع اول برای k=4 جامعه نرمال مستقل برای روش های GPT، JKL، JKW، WT ، New و MLRT.
حجم نمونهآزمون مقدار مشترک ضرایب تغییرات3,3,3,3
05/01/015/02/025/03/035/04/0GPT0/0011 0/001 0/00090/0011 0/001 0/00070/0019 0/0017 JKL0/0298 0/0321 0/0255 0/0273 0/0294 0/0327 0/0302 0/0309 JKW0/0000 0/0000 0/0000 0/0000



قیمت: تومان

دسته بندی : مقاله و پایان نامه

دیدگاهتان را بنویسید