دانشکده علوم
پایان نامه ی کارشناسی ارشد در رشته آمار
برآورد میانگین درنمونه گیری مضاعف برای طبقه بندی با استفاده ازاطلاعات کمکی چند متغیره
به کوشش
لیلا سینایی اصفهانی
استاد راهنما
دکتر محمد صدوقی الوندی
اسفند ماه 1392
به نام خدا
اظهارنامه
اینجانب لیلا سینایی اصفهانی (900369) دانشجوی رشته ی آمار گرایش ریاضی دانشکده ی علوم اظهارمی کنم که این پایان نامه حاصل پژوهش خودم بوده و درجاهایی که از منابع دیگران استفاده کرده ام، نشانی دقیق و مشخصات کامل آن
را نوشته ام. همچنین اظهارمی کنم که تحقیق و موضوع پایان نامه ام تکراری نیست و تعهد می نمایم که بدون مجوز دانشگاه دستاوردهای آن را منتشرننموده و یا در اختیار غیر قرار ندهم. کلیه حقوق این اثر مطابق با آیین نامه مالکیت فکری و معنوی متعلق به دانشگاه شیراز است.
نام و نام خانوادگی :لیلا سینایی اصفهانی
تاریخ و امضا :4/12/1392
تقدیم به
پدر و مادر عزيزم
به خاطر همه ی تلاش های محبت آمیز ی که در دوران مختلف زندگی ام
انجام داده اند و با مهربانی چگونه زیستن را به من آموخته اند
و
برادرم، محمد و خواهرم، فهیمه همراهان همیشگی و پشتوانه های زندگیم .
سپاسگزاری
با سپاس فراوان از راهنمائی‌ها و زحمات استاد محترم و گرانقدر جناب آقای دکتر محمد صدوقی که از ابتدای راه و در طی انجام این تحقیق، با راهنمائی‌های خود مرا در نگارش این اثر یاری نمودند. قدردانی و تقدیر از اساتید محترم مشاور، سرکار خانم دکتر زهرا سجادنیا و جناب آقای دکتر
امین قلمفرسا که دلسوزانه، زحمت مشاوره ی این پایان نامه را بر عهده گرفته اند، همچنین از استاد محترم سر کار خانم دکتر مینا توحیدی که زحمت داوری این اثر را برعهده گرفته اند سپاسگزاری می کنم.
در پایان از کسانی که در این راه از هم فکری و راهنمایی های آن ها برخوردار شدم به خصوص سرکار خانم دکتر ساره گلی، استادیار دانشگاه صنعتی اصفهان و دوستانی که بودنشان باعث دلگرمی من شد، صمیمانه سپاسگزارم.
چکیده
برآورد ميانگين در نمونه گيري مضاعف براي طبقه بندي
با استفاده از اطلاعات کمکي چند متغيره
به کوشش
لیلا سینایی اصفهانی
نمونه گیری مضاعف (یا نمونه گیری دو فازی) یک طرح نمونه گیری است که با استفاده از اطلاع از متغیر یا متغیرهای کمکی متعدد که در ارتباط با متغیر مورد مطالعه می باشند، دقت برآوردگرهای میانگین جامعه را افزایش می دهند. در طرح نمونه گیری مضاعف برای
طبقه بندی (DSS) در فاز اول یک نمونه ی اولیه بزرگ از متغیرهای کمکی گرفته شده و واحدهای نمونه طبقه بندی می شوند سپس در فاز دوم، زیر نمونه ای انتخاب شده و متغیر مورد مطالعه اندازه گیری می شود. در این پایان نامه با استفاده از طرح نمونه گیری DSS، دو کلاس از برآوردگرها ی میانگین جامعه مطرح می شوند. همچنین در بین این کلاس ها، بهترین برآوردگرها بطور مجانبی و واریانس تقریبی آن ها بدست می آیند، سپس این کلاس از برآوردگرها با کلاس برآوردگرهای مربوط به طرح نمونه گیری مضاعف طبقه بندی نشده (USDS) مورد مقایسه قرار می گیرند. در پایان با استفاده از یک جامعه واقعی نتایج بدست آمده را اثبات می کنیم.
کلمات کلیدی : متغیر مورد مطالعه – متغیر کمکی – اریبی – واریانس –
نمونه گیری مضاعف برای طبقه بندی
فهرست مطالب
عنوان
صفحهفصل اول: مباحث مقدماتی
1-1 مقدمه……………………………………………………………………………………………………………………………..1 1-2 تعاریف و مفاهیم پایه ای………………………………………………………………………………………………..3 1-3 طرح های نمونه گیری…………………………………………………………………………………………………12
فصل دوم: طرح نمونه گیری مضاعف برای طبقه بندی با استفاده ازیک
اطلاع کمکی
2-1 مقدمه…………………………………………………………………………………………………………………………..19 2-2 پارامترهای جامعه و طبقات…………………………………………………………………………………………22 2-3 آماره های نمونه ای طبقات…………………………………………………………………………………………24 2-4 برآورد معمولی میانگین در نمونه گیری مضاعف برای طبقه بندی……………………………27 2-5 برآوردگر رگرسیونی مرکب و برآوردگر رگرسیونی جدا در نمونه گیری مضاعف
برای طبقه بندی…………………………………………………………………………………………………………..28 2-5-1 برآوردگر رگرسیونی مرکب برای میانگین جامعه……………………………………………….29 2-5-2 برآوردگر رگرسیونی جدا برای میانگین جامعه……………………………………………………30 2-6 یک کلاس بزرگ از برآوردگرها برای میانگین جامعه با استفاده از یک متغیر کمکی.30 2-7 یک کلاس از برآوردگرهای مرکب برای میانگین جامعه در نمونه گیری مضاعف
برای طبقه بندی…………………………………………………………………………………………………………..32 2-7-1 محاسبه اریبی و واریانس کلاس برآوردگرهای مرکب………………………………………..34 2-7-2 کلاس برآوردگرهای مرکب بر اساس برآورد مقدار بهینه…………………………………..39 2-7-3 مقایسه کلاس برآورد گرهای مرکب و برآوردگر معمولی y ̅_ds ………………………….43 2-8 یک کلاس از برآوردگرهای جدا برای میانگین جامعه بر اساس نمونه گیری مضاعف
برای طبقه بندی…………………………………………………………………………………………………………..44 2-8-1 محاسبه اریبی و واریانس کلاس برآوردگرهای جدا …………………………………………..47 2-8-2 کلاس برآوردگرهای جدا بر اساس برآورد مقدار بهینه……………………………………….50 2-9 مقایسه دو کلاس برآوردگرهای مرکب و برآوردگرهای جدا در طرح نمونه گیری
مضاعف برای طبقه بندی……………………………………………………………………………………………..53
فصل سوم: طرح نمونه گیری مضاعف برای طبقه بندی با استفاده از اطلاعات کمکی
چند متغیره
3-1 مقدمه…………………………………………………………………………………………………………………………..54 3-2 پارامترهای جامعه و طبقات…………………………………………………………………………………………55 3-3 آماره های نمونه ای طبقات…………………………………………………………………………………………57 3-4 برآوردگرهای رگرسیونی مرکب و جدا در نمونه گیری مضاعف برای طبقه بندی با
استفاده از اطلاعات کمکی چند متغیره……………………………………………………………………….59 3-4-1 برآوردگر رگرسیونی مرکب چند متغیره برای میانگین جامعه……………………………60 3-4-2 برآوردگر رگرسیونی جدا چند متغیره برای میانگین جامعه……………………………….61 3-5 یک کلاس بزرگ از برآوردگرها برای میانگین جامعه با استفاده از اطلاعات کمکی
چند متغیره…………………………………………………………………………………………………………………..62 3-6 یک کلاس از برآوردگرهای مرکب برای میانگین جامعه در نمونه گیری مضاعف برای
طبقه بندی……………………………………………………………………………………………………………………65 3-6-1 محاسبه اریبی و واریانس کلاس برآوردگرهای مرکب………………………………………..67 3-6-2 کلاس برآوردگرهای مرکب بر اساس برآورد مقدار بهینه……………………………………72 3-6-3 مقایسه کلاس برآورد گرهای مرکب و برآوردگر معمولی y ̅_ds …………………………..74 3-7 یک کلاس از برآوردگرهای جدا در نمونه گیری مضاعف برای طبقه بندی……………….75 3-7-1 محاسبه اریبی و واریانس کلاس برآوردگرهای جدا……………………………………………78 3-7-2 کلاس برآوردگرهای جدا بر اساس برآورد مقدار بهینه……………………………………….84 3-7-3 مقایسه کلاس برآورد گرهای جدا و برآوردگر معمولی y ̅_ds……………………………….87
فصل چهارم: مقایسه طرح نمونه گیری مضاعف برای طبقه بندی با طرح نمونه گیری
مضاعف (طبقه بندی نشده)
4-1 مقدمه…………………………………………………………………………………………………………………………..89 4-2 یک کلاس از برآوردگرها برای میانگین جامعه در طرح نمونه گیری مضاعف
طبقه بندی نشده (USDS) با استفاده از یک متغیر کمکی………………………………………90 4-2-1 آماره های نمونه ای……………………………………………………………………………………………..90 4-2-2 کلاس برآوردگرهای میانگین جامعه بر اساس برآورد مقدار بهینه…………………….92 4-3 مقایسه دو کلاس برآوردگرهای مرکب و جدا در طرح نمونه گیری DSS با کلاس
برآوردگرها در طرح نمونه گیری USDS با استفاده از یک متغیر کمکی……………………93 4-4 یک کلاس از برآوردگرهای میانگین جامعه در نمونه گیری مضاعف طبقه بندی نشده
(USDS) با استفاده از اطلاعات کمکی چند متغیره……………………………………………………..96 4-5 مقایسه کلاس برآوردگرهای مرکب در طرح نمونه گیری DSS و کلاس برآوردگرها در
طرح نمونه گیری USDS با استفاده از اطلاعات کمکی چند متغیره………………………..103
فصل پنجم: مثال کاربردی و نتیجه گیری
5-1 مقدمه…………………………………………………………………………………………………………………………106 5-2 معرفی و نحوه جمع آوری داده ها…………………………………………………………………………….107 5-3 کارایی نمونه گیری مضاعف برای طبقه بندی………………………………………………………….112
پیوست (برنامه های نرم افزاری)……………………………………………………………………115 واژه نامه فارسی به انگلیسی………………………………………………………………………….127واژه نامه انگلیسی به فارسی………………………………………………………………………….130فهرست منابع………………………………………………………………………………………………132
فهرست جدول ها
عنوان و شماره صفحه
جدول 5-1 : حجم نمونه در هر یک از طبقات در دو فاز از نمونه گیری مضاعف برای
طبقه بندی……………………………………………………………………………………………………………108جدول 5-2 : آماره های توصیفی……………………………………………………………………………………………109جدول 5-3 : ضریب همبستگی پیرسون……………………………………………………………………………….110جدول 5-4 : مقایسه برآوردگرها بر اساس میزان کارایی آن ها…………………………………………….113

فهرست شکل ها
عنوان و شماره صفحه
شکل 1-1 نمونه گیری تصادفی ساده به اندازه 40 از جامعه 400 واحدی……………………..13شکل 1-2 نمونه گیری تصادفی طبقه ای………………………………………………………………………………15شکل 1-3 نمونه گیری مضاعف………………………………………………………………………………………………17نمودار 5-1 نمودارهای پراکنش ضریب همبستگی میان متغیر مورد مطالعه و متغیرهای کمکی………………………………………………………………………………………………………………………………………111نمودار 5-2 میزان کارایی برآوردگرها…………………………………………………………………………………..114

فهرست نشانه های اختصاری
SRS = Simple Random Sampling
SRSWR = Simple Random Sampling With Replacement
SRSWOR = Simple Random Sampling With Out Replacement
DSS = Double Sampling for Stratification
USDS = Un-Stratified Double Sampling
Deff = Design effect
RE = Relative Efficeincy

فصل 1
مباحث مقدماتی
1-1 مقدمه
یکی از توانایی های علم آمار تحلیل موضوعاتی با اطلاعات عددی انبوه می باشد. در واقع در هر بررسی آماری مراحل جمع آوری، پاک سازی، تلخیص و تحلیل داده ها و نتیجه گیری مورد توجه قرار می گیرد. مرحله ی جمع آوری داده ها به عنوان زیر بنای بررسی های آماری دارای اهمیت ویژه ای می باشد، زیرا در صورت وجود نقصی در این مرحله از ارزش و اعتبار کل پژوهش کاسته می شود. یک جامعه متناهی در نظر بگیرید. جمع آوری اطلاعات عددی از این جامعه با استفاده از دو روش سرشماری و نمونه گیری امکان پذیر است، در صورتی که در جوامع نامتناهی سرشماری امکان پذیر نمی باشد و باید تنها از روش نمونه گیری استفاده کرد. هدف از انواع روش های نمونه گیری، تهیه ی اطلاعاتی از جامعه با مطالعه ی بخشی از آن به نام نمونه است. در واقع نمونه گیری، فرایند انتخاب واحدها از جامعه می باشد به طوری که به کمک آن ها بتوان از جامعه کسب اطلاع کرد. بنابراین یکی از مسائل مهم در نمونه گیری، تطابق نمونه با کل جامعه است.
در حالت کلی برای نمونه گیری، دو روش نمونه گیری احتمالی و غیراحتمالی معرفی
می گردد. در نمونه گیری احتمالی1 که اولین بار توسط دمینگ2 ]7[ در سال 1950 مطرح شده است، هر واحد نمونه با احتمالی مشخص از جامعه استخراج می شود. کاربرد گسترده ی این روش امروزه به گونه ای است که این روش جايگزين نمونه گیری غیر احتمالی شده است.همچنین در بسیاری از نمونه گیری ها، در حین جمع آوری اطلاعات مربوط به متغیر مورد مطالعه و یا قبل از آن، ممکن است اطلاعاتی درباره متغیر یا متغیرهای دیگری که با متغیر مورد مطالعه همبستگی دارند موجود باشد که به این نوع اطلاعات، اطلاعات کمکی گفته مي شود. از اطلاعات کمکی در مرحله ی برآوردیابی و در طرح نمونه گیری می توان استفاده کرد.
راه دست یابی به اطلاعات کمکی مفید از منابع متعدد می باشد و اغلب این اطلاعات در جوامع متناهی باعث افزایش دقت برآوردگرها می شود. الکلین3 ]18[ در سال 1958، رائو4 ]21[ در سال 1967، سینگ5 ]37[ در سال 1967، جان6 ]13[ در سال 1969، سریواستاوا7 ]40[ در سال 1971 و ویشواکارما و همکاران8 ]49[ در سال 2012 در مطالعات خود از اطلاعات کمکی به طور گسترده استفاده کرده اند.
در این فصل، در بخش (1-2) به بیان تعاریف و مفاهیم پایه ای در نمونه گیری که شامل جامعه متناهی، نمونه، طرح نمونه گیری و… است، پرداخته و سپس در بخش (1-3) انواع
طرح های نمونه گیری را تعریف می کنیم.
1-2 تعاریف و مفاهیم پایه ای
در مباحث نمونه گیری داشتن تعاریف دقیق و درست از مفاهیمی هم چون جامعه، نمونه، طرح نمونه گیری و… از ضروری می باشد. از این رو در این فصل به بیان تعاریف پایه ای و برخی نماد ها که در فصل های بعدی رساله مورد استفاده قرار خواهند گرفت، می پردازیم. نماد ها به صورتی در نظر گرفته شده که در اغلب متون نمونه گیری مورد استفاده قرار گرفته است. عمده مطالب این بخش مبتنی بر مراجع کاکران ]4[ و عمیدی ]52[ است.
جامعه ی متناهی 9 : یک جامعه ی متناهی از مجموعه ای مشتمل بر تعداد متناهی عناصر متمایز تشکیل شده است. مقدارN ، اندازه ی جامعه نامیده می شود. یک جامعه ی متناهی U را به صورت زیر نمایش می دهیم:
U={u_1,…,u_k,…,u_N }
طرح نمونه‌گيري10 : با در نظر گرفتن يك طرح نمونه‌اي معين مي‌توان احتمال انتخاب يك نمونه دلخواه مانند s را بيان نمود. اين احتمال را با نماد p(s) نمایش خواهیم داد. حال با فرض این كه تابع p(.) به‌گونه‌اي وجود دارد كه p(s) احتمال انتخاب s را تحت فرض استفاده از طرح مورد نظر به ‌دست دهد، تابع p(.) طرح نمونه‌گيري ناميده مي‌شود. هر نمونه s بر اساس هر طرح نمونه‌گيري مفروض p(.) را مي‌توان به عنوان مشاهده‌اي از متغير تصادفي مجموعه- مقدار S كه توزيع احتمال آن بوسيله تابع p(.) بيان مي‌شود، مورد توجه قرار داد. اگر φ را معرف تمام نمونه‌هاي ممكن s در نظر بگيريم، در اين صورت با در نظر گرفتن زير مجموعه‌هاي تهي و U، φ مجموعه‌اي شامل N2 زير مجموعه با اندازه‌هاي متفاوت از U خواهد بود. لذا براي هر s∈φ داريم:
P(S=s)=p(s) .از آنجا كه p(s) يك توزيع احتمال بر روي φ است، داريم:
p(s)≥0، براي هر s∈φ
∑_(s∈φ)▒〖p(s)=1〗
نمونه 11 : عناصري از جامعه كه مشخصات آن‌ها‌ اندازه‌گيري مي‌شود، تشكيل يك نمونه مي‌دهند. در واقع يك نمونه، زيرمجموعه‌اي از جامعة U است كه طبق برنامة خاصي به ‌دست مي‌آيد. این زيرمجموعه به طور معمول با s نمایش داده شده و n(s) تعداد عناصر نمونه s است. در بسياري از مواقع نمونه‌هايي را در نظر مي‌گيريم كه با استفاده از يك طرح نمونه‌گيري احتمالي تحقق مي‌يابند. دو تعريف براي اصطلاح نمونه وجود دارد كه در اكثر مواقع مورد استفاده قرار مي‌گيرند:
الف- نمونه ي با جايگذاري: دنباله‌اي متناهي به صورت{k_1,…,k_(n(s)) }، كه براي هر n(s) داشته باشيم( k_i∈U : i=1,2,…)، در اين حالت واحدهاي انتخاب شده الزاماً متفاوت نيستند. در این روش انتخاب هر واحد از انتخاب واحدهای دیگر مستقل است.
ب- نمونه ‌ي بدون جايگذاري: مثل حالت قبل زير مجموعه‌اي غير تهي از U شامل n عنصراست. در اين حالت واحدهاي انتخاب شده الزاماً مجزا مي‌باشند. در واقع در این روش به صورت تصادفی یک واحد انتخاب شده سپس بدون برگرداندن این واحد به جامعه به تصادف واحد دوم انتخاب می شود و این فرایند تا انتخاب n واحد نمونه ادامه می یابد.
حجم نمونه يا اندازه نمونه كه با n(s) نشان داده مي‌شود، برابر با تعداد اعضاي s است. مقدار n(s) براي تمام نمونه‌هاي ممكن الزاماً برابر نيست. چنان چه طرح نمونه‌گيري به‌گونه‌اي باشد كه حجم نمونه قبل از پيمايش معلوم و برابر با عدد ثابتي باشد، آن را طرح با حجم ثابت گوييم. در اين حالات تمام نمونه‌هاي ممكن داراي حجم يكسان بوده و براي سادگي از نماد n براي معرفي حجم نمونه استفاده خواهيم نمود.
نشانگر عضويت نمونه 12: براي هر عنصر جامعه و هر طرح نمونه‌گيري مشخص p(.)، به‌صورت يك پيشامد تصادفي دو وضعيتي كه انتخاب يا عدم انتخاب عنصر مزبور در نمونه s را نشان مي‌دهد، تعريف مي‌شود. مقدار اين تابع براي عنصر k- ام با I_K نشان داده مي‌شود و داريم:
I_K={█(1 ، باشد s درون ام k عنصر اگر @0 ، صورت این غير در )┤
توجه كنيد كه I_K=I_K (S) تابعي از متغير تصادفي S است. براي طرح‌هاي با حجم ثابت n از جامعه‌اي به حجم N داريم:
∑_(k=1)^N▒〖I_K=n〗 .
متغير مورد مطالعه13 : معمولاً هدف از يك تحقیق، بررسي صفت )هايي( خاص از جامعه است. به اين صفت، متغير مورد مطالعه گفته شده و معمولاً متغير مورد مطالعه با y و مقدار آن براي k- امين عنصر جامعه با y_k نشان داده می شود.
متغير کمکی14 : متغیر x را یک متغیر کمکی گوییم هرگاه با متغیر مورد مطالعه y در ارتباط باشد و بتوان با استفاده از x استنتاج های دقیق تری در مورد y انجام داد.
اطلاعات کمکی 15: به مجموعه ای از یک یا چند متغیر کمکی که با متغیر مورد مطالعه y در ارتباط باشند اطلاعات کمکی گویند هر گاه از این اطلاعات بتوان در مرحله برآورد و طرح نمونه گیری استفاده کرد. به عنوان مثال اگر متغیر مورد مطالعه حجم تنه ی درختی از ناحیه ای از جنگل باشد، آن گاه قطر تنه ی درخت و برآورد چشمی از حجم درخت می تواند به عنوان اطلاعات کمکی در نظر گرفته شود.
پارامتر جامعه متناهی : به هر تابع حقیقی از مقادیر (y_1,y_2,…,y_N) یک پارامتر گویند.
θ به عنوان نماد عمومي يك پارامتر معرفی می شود. پارامترهاي مهم جامعه كه در اين رساله مورد توجه قرار مي‌گيرند، عبارتند از:
ميانگين جامعه
واريانس جامعهθ=y ̅_U=∑_U▒y_k⁄N ,
θ=S_yU^2=∑_U▒〖(y_k-y ̅_U)〗^2⁄N-1 .

لازم به ذکر است که ∑_U▒y_k نماد اختصاري براي ∑_(k∈U)▒y_k است. به ‌منظور برآورد پارامترها، به جاي مشاهده ی مقادير متغير y در مورد تمام عناصر جامعه، مقادير y_k را براي زير مجموعه‌اي از U مشاهده مي كنيم. در ابتدا يك نمونه انتخاب شده و سپس مقدار y_k براي عضو k-ام درون نمونه مشاهده و در نهايت از اين مجموعه ی محدود از مقادير y_k ها به‌ منظور
محاسبه ی برآوردهايي از پارامترهاي مورد نظر استفاده مي‌شود.
برآوردگر16 : يك برآوردگر مانند θ ̂=θ(s,y) به‌صورت آماره‌اي حقیقی – مقدار از مقادیر y است که برای تخمین پارامتر θ به کار می رود. امید ریاضی و واریانس برآورد گر θ ̂ به صورت زیر تعریف می شود :
اميد رياضي θ ̂ : معيار ميانگين وزني مقادير ممكن θ ̂(s) با به ‌كارگيري احتمالات p(s) به عنوان وزن مي‌باشد :
E(θ ̂ )=∑_(s∈φ)▒p(s) θ ̂(s) .
واريانس θ ̂ : ميزان پراكندگي برآوردگر θ ̂ حول ميانگين آن را نشان مي‌دهد:
Var(θ ̂ )=∑_(s∈φ)▒p(s) 〖( θ ̂(s)-E(θ ̂ ) )〗^2=E(θ ̂^2 (s))-E^2 (θ ̂(s)) .

براي انتخاب يك برآوردگر از بين برآوردگرهاي رقيب، شاخص های سنجشی جهت مطلوبیت وجود داردكه در میان آن ها شاخص نااريبي و كمترين مجموع مربعات خطا داراي اهميت ويژه‌اي هستند.
نا اريبي17 : فرض کنید p(s) یک طرح نمونه گیری تعریف شده روی فضای φ باشد. برآوردگر θ ̂ براي θ نااريب ناميده مي‌شود، هر گاه:
E(θ ̂ )=θ ,
و اريبي به‌صورت زير تعريف مي‌شود:
B(θ ̂ )=E(θ ̂ )-θ .
وقتی B(θ ̂ ) مثبت (منفی) باشد، گوییم θ ̂ پارامتر θ را فرابرآورد (دون برآورد) می کند.
ميانگين توان دوم خطا 18θ ̂ : معیاری که به طور معمول برای ارزیابی دقت یک برآوردگر مورد استفاده قرار می گیرد، ميانگين توان دوم خطا بوده و به‌ صورت زير بيان مي‌شود:
MSE(θ ̂ )=E(θ ̂-θ)^2=∑_(s∈φ)▒p(s) 〖( θ ̂(s)-θ )〗^2 .
می توان نشان داد که ميانگين توان دوم خطا برابر است با :
MSE(θ ̂ )=Var(θ ̂ )+(B(θ ̂ ))^2 .

اگر θ ̂ براي θ نااريب باشد، مي‌توان نتيجه گرفت كه:
MSE(θ ̂ )=Var(θ ̂ ) .
اغلب برآوردگرهاي مهم در نمونه‌گيري، نااريب و يا نااريب مجانبي‌هستند. خاصيت يك برآوردگر نااريب مجانبي‌ آن است كه اريبي آن به ‌ازاي نمونه‌هاي بزرگ ناچيز می باشد. اكثر برآوردگرهاي نااريب مجانبي‌ كه در نظر مي‌گيريم، حتي در نمونه‌هاي با حجم متوسط نیز مقدار اريبي واقعاً كوچكي دارند. حال از بین برآوردگرهاي نااريب مجانبي، برآوردگري با كوچكترين واريانس را به عنوان بهترین برآوردگر انتخاب مي‌كنيم.
خطاي استاندارد 19θ ̂ : جذر واريانس برآوردگر θ ̂، یعني √(Var(θ ̂ ) )، خطاي استاندارد اين برآوردگر ناميده مي شود.
خطاي استاندارد نسبي يا ضريب تغييرات20 : نسبت خطاي استاندارد برآوردگر به مقدار مورد انتظار آن است که به آن خطاي استاندارد نسبي يا ضريب تغييرات گفته شده و به صورت زیر بدست می آید:
CV(θ ̂ )=√(Var(θ ̂ ) )/E(θ ̂ ) .
کارایی 21 : فرض کنید برای برآورد پارامتر θ بر اساس طرح نمونه گیری p(s) دو برآوردگر متفاوتθ ̂_1 و θ ̂_2 وجود داشته باشد کارایی برآوردگر θ ̂_2 نسبت به θ ̂_1 به صورت زیر بیان
می شود:
e(θ ̂_2, θ ̂_1 )=MSE(θ ̂_1 )/MSE(θ ̂_2 ) ,
به عبارت دیگر اصطلاح کارایی همان میزان مطلوبیت دو برآوردگر نسبت به یکدیگر است.در صورتی که این معیار در بازه ی (1و0) قرار گیرد برآوردگر θ ̂_1 کاراتر از برآوردگر θ ̂_2 است و اگر این معیار از یک بزرگ تر بدست آید بیان گر این است که کارایی برآوردگر θ ̂_2 بیشتر است.
اثر طرح 22: براي آن كه بتوان از بين روش‌ها يا طرح‌هاي نمونه‌گيري رقيب، بهترين آن‌ها را انتخاب کرد، لازم است بُعد مسأله را به يك نوع برآوردگر محدود نمود. در اين صورت
می توان از بين طرح‌هاي پيش رو، بهترين آن‌ها را با توجه به معيارهاي مناسب فرض ‌شده انتخاب نمود. اثر طرح یک شاخص جهت سنجش اثر طرح های نمونه گیری بر انحراف استاندارد آماره های پیچیده است که توسط کیش23 معرفی شده و با نماد deff (p,θ ̂) نمایش داده می شود. واریانس برآوردگر θ ̂ تحت این طرح به صورت 〖Var〗_p (θ ̂) و تحت نمونه‌گيري تصادفي سادة با جايگذاري ( این روش نمونه گیری بعدا معرفی می شود) با 〖Var〗_srs (θ ̂) نشان داده شود، آن گاه اثر طرح p(s) برای θ ̂ با عبارت زیر سنجیده می شود:
deff(p, θ ̂ )=(〖Var〗_p (θ ̂ ))/(〖Var〗_srs (θ ̂ ) ) .
توجه كنيد كه زيرنويس هر يك از واريانس‌ها معرف طرح مورد استفاده مي باشد.
مقايسة بين دو طرح p و تصادفي ساده به‌صورت زیر بیان می شود:
deff(p, θ ̂ ){█(<1 .است كاراتر ساده تصادفي طرح@=1 . است یکسان طرح دو کارایی@>1 .است كاراتر p طرح )┤
به عبارتي دیگر وقتي‌كه deff(p, θ ̂ ) بزرگتر از يك باشد، استفاده از طرح p مناسب تر است.
مرتبه همگرایی24 : مرتبه همگرایی را می توان به دو دسته ی عمده، مرتبه کوچکی و مرتبه بزرگی تقسیم بندی کرد:
مرتبه کوچکی : این مرتبه همگرایی را به طور معمول به صورت o نمایش می دهند. طبق تعریف، a_n از مرتبه کوچکی b_n نامیده می شود هر گاه برای هر ϵ>0 عدد صحیحی مانند n_ϵ یافت شود، به طوری که :
اگر n>n_ϵ ، آن گاه : |a_n |<ϵ|b_n | این تعریف را به طور مختصر با نماد a_n=o(b_n) نمایش می دهيم.
همچنین a_n را از مرتبه کوچکی احتمال b_n نامیده و به طور مختصر با نماد a_n=o_p (b_n) نمایش می دهند، هر گاه برای هرϵ>0 :
وقتی که n→∞ آن گاه P(|a_n |<ϵ|b_n |)→1 .
مرتبه بزرگی : این مرتبه همگرایی را به طور معمول به صورت O نمایش می دهند. طبق تعریف a_n از مرتبه بزرگی b_n نامیده می شود، هر گاه مقادیر حقیقی α و n_α صحیح وجود داشته باشد به طوری که:
اگر n>n_α ، آن گاه : |a_n |<α|b_n | و به طور مختصر آن را با نماد a_n=O(b_n) نمایش
می دهيم.
همچنین a_n را از مرتبه بزرگی احتمال b_n نامیده و به طور مختصر با نماد a_n=O_p (b_n) نمایش می دهند، هر گاه برای هرϵ>0 ، ثابتی مانند δ و عدد صحیح n_δ وجود داشته باشند به طوری که:
وقتی که n>n_δ آن گاه P(|a_n |<δ|b_n |≥1-ϵ) .

در نمونه گیری از جامعه متناهی برای بررسی همگرایی برآوردگرθ ̂ ، از تفاضل θ ̂-θ به عنوان a_n استفاده می شود و اغلب b_n مقادیر n^(-1) یا n^(-1⁄2) را اختیار می کند.
1-3 طرح های نمونه گیری
در این بخش به معرفی مختصری از طرح های نمونه گیری معروف که در فصل های بعدی مورد استفاده قرار می گیرند می پردازیم. عمده مطالب این بخش مبتنی بر مراجع عمیدی ]52[، کاکران ]4[، سوخاتمه ]44[ و تامپسون ]45[ است.
طرح نمونه گیری تصادفی ساده 25
طرح نمونه‌گيري تصادفي ساده يكي از ساده‌ترين و مهم ترين طرح‌هاي نمونه‌گيري محسوب مي‌شود. به ‌طور معمول از اين طرح به عنوان شكل اساسي نمونه‌گيري احتمالي در مواردي كه هيچ گونه اطلاعات كمكي از ساختار جامعه در دست نيست، استفاده مي‌شود. اگردر انتخاب یک نمونه n تایی از جامعه N تایی، تمام نمونه های ممکن هم شانس باشند بنا به تعریف یک نمونه تصادفی ساده داریم. احتمال انتخاب هر يك از عناصر جامعه بر اساس اين طرح يكسان بوده و این نمونه‌گيري با حجم ثابت معمولاً به دو صورت بدون جايگذاري و باجايگذاري انجام مي‌شود.
برآوردگر نااريب براي ميانگين كل جامعه به صورت زیر معرفي خواهد شد که از اين برآوردگر معمولا به عنوان يك برآوردگر ميانگين معمولي ياد مي‌شود:
y ̅_s=1/n ∑_(k∈s)▒y_k .واريانس اين برآوردگر برابر است با :
Var(y ̅_s )=((N-n)/(N-1)) σ^2/n .
که در آن ضريب ((N-n)/(N-1)) را معمولاً ضريب كاهش در نمونه‌گيري بدون جايگذاري مي‌نامند. همچنين كسر f=n/N كسر نمونه‌گيري و -f1 ضريب تصحيح نمونه‌گيري بدون جايگذاري ناميده مي شود.
معمولاً در جامعه‌هاي بسيار بزرگ، كه حجم نمونه در مقايسه با حجم جامعه ناچيز است، مي‌توان از كسر نمونه‌گيري چشم ‌پوشي كرد.
برای درک بهتر طرح نمونه گیری تصادفی ساده به شکل زیر توجه نمایید. در این شکل جامعه ی مورد نظر برای نمونه گیری تصادفی ساده به 400 واحد مربع شکل تقسیم شده و یک نمونه تصادفی شامل 40 واحد از آن انتخاب شده است.
شکل 1-1 نمونه گیری تصادفی ساده به اندازه 40 از جامعه 400 واحدی
طرح نمونه گيري طبقه اي26
در برخي مواقع جامعه به زيرجامعه هايي ناهم پوشا تقسيم مي شود . اصطلاح ناهم پوشا بر اين مطلب دلالت دارد كه هر عنصر جامعه تنها و تنها درون يكي از زيرجامعه ها قرار دارد. هريك از اين زير جامعه ها يك طبقه ناميده مي شود. چنانچه يك نمونه ی احتمالي درون هر طبقه انتخاب شود، به طوري كه انتخاب ها بين طبقات، مستقل از يكديگر باشند، آن گاه نمونه ی به دست آمده را يك نمونه ی طبقه اي و طرح مولد آن را يك طرح نمونه گيري طبقه اي می نامند. نمونه گيري طبقه اي روشي قدرتمند و انعطاف پذيراست كه به شكل گسترده مورد استفاده قرار مي گيرد.
برای درک بهتر طرح نمونه گیری تصادفی طبقه ای به شکل 1-2 توجه نمایید. در این شکل جامعه ی مورد نظر که شامل 4 طبقه است برای نمونه گیری طبقه ای به 400 واحد مربع شکل تقسیم شده است. حجم طبقه اول 200 واحد مربع شکل، حجم طبقه دوم 100 واحد مربع شکل و حجم طبقات سوم وچهارم هر کدام 50 واحد مربع شکل در نظر گرفته شده است. یک نمونه تصادفی شامل 40 واحد از بین طبقات این جامعه به صورت تصادفی ساده بدون جایگذاری انتخاب شده است. در واقع از طبقه اول نمونه ای به حجم 20 واحد مربع شکل تیره، از طبقه دوم نمونه ای به حجم 10 واحد مربع شکل تیره و از هر یک از طبقات سوم و چهارم نمونه ای به حجم 5 واحد مربع شکل تیره انتخاب شده است. بر این اساس مجموعه واحدهای مربع شکل تیره نمونه ی انتخابی از این جامعه است.
شکل 1-2 نمونه گیری تصادفی طبقه ای
1-3-1 طبقه بندي پسين27 (طبقه بندي پس از نمونه گيري)
در برخي مواقع که نمونه ی احتمالي بر اساس يك طرح نمونه گيري تصادفي ساده صورت
مي پذيرد، مي توان در مرحله برآورد از روش هاي مربوط به نمونه گيري تصادفي طبقه اي استفاده نمود. اين استراتژي كه از طرح نمونه گيري تصادفي ساده، و برآورد طبقه اي تشكيل شده است را طبقه بندي پس از نمونه گيري، يا طبقه بندي پسین مي نامند. كارآيي اين استراتژي در مقايسه با استراتژي طرح نمونه گيري تصادفي طبقه اي و برآورد متناظر آن چندان كم نيست .براي استفاده از روش طبقه بندي پسين لازم است به همراه متغير مورد مطالعه، متغير طبقه اي هر واحد نمونه نيز اندازه گيري و ثبت شده باشد، همچنین حجم كل طبقات جامعه نیز معلوم باشد.
طرح نمونه گیری مضاعف 28
درشرایطی که هزینه ی جمع آوری اطلاعات در مورد متغیر کمکی به مراتب کم تر از هزینه ی جمع آوری اطلاعات در مورد متغیر مورد مطالعه باشد، طرح نمونه گیری مضاعف مورد استفاده قرار می گیرد. اگر میانگین جامعه ی کمکی یعنی X ̅_N نامعلوم باشد نمی توانیم از روش برآورد نسبتی استفاده کنیم. در چنین وضعیتی از طرح نمونه گیری مضاعف یا طرح نمونه گیری دو فازی 29 استفاده می شود. در این طرح ابتدا در فاز اول، نمونه ای اولیه به روش تصادفی ساده با حجم n^’ از جامعه ی متغیرهای کمکی X گرفته می شود. در فاز دوم، از نمونه ی اولیه زیر نمونه ای به حجم n به تصادف از نمونه ی کمکی X ها گرفته و سپس واحدهای متناظر آن ها از متغیر مورد مطالعه y انتخاب می شود. اگر در این طرح، زیر نمونه در فاز دوم به صورت نمونه گیری تصادفی ساده بدون جایگذاری انتخاب گردد، این طرح، طرح نمونه گیری مضاعف طبقه بندی نشده30 نامیده می شود.
برای درک بهتر طرح نمونه گیری مضاعف به شکل 1-3 توجه نمایید. در این شکل در ابتدا جامعه ی مورد نظر برای نمونه گیری مضاعف به 400 واحد مربع شکل تقسیم شده است. در فاز اول یک نمونه اولیه ی تصادفی از متغیر کمکی شامل 60 واحد مربع شکل از این جامعه به صورت تصادفی ساده گرفته می شود و در فاز دوم از این نمونه اولیه زیر نمونه ای به حجم 20 واحد مربع شکل تیره بر اساس متغیر کمکی و مقادیر متناظر متغیر مورد مطالعه انتخاب شده است.
شکل 1-3 نمونه گیری مضاعف
طرح نمونه گیری مضاعف برای طبقه بندی 31
درشرایطی که می خواهیم جامعه به زیر جامعه هایی (طبقات مختلف) تقسیم شود اما وزن طبقات W_h=N_h/N , ( h=1,2,…,L ) قبل از شروع نمونه گیری مقادیر معلومی ندارند، طرح نمونه گیری مضاعف برای طبقه بندی می تواند ایده ی مناسبی باشد؛ این طرح برای اولین بار توسط نیمن32 ]17[ در سال 1938 معرفی شده است. ایده اصلی طرح نمونه گیری مضاعف برای طبقه بندی این است که ابتدا در فاز اول یک نمونه ی اولیه بزرگ از متغیرهای کمکی گرفته می شود و بر این اساس طبقات بدست می آیند. در فاز دوم، برای جمع آوری اطلاعات در مورد متغیر مورد مطالعه نمونه ای کوچک تر در این طبقات گرفته می شود.
از کاربردهای دیگر این طرح نمونه گیری، پایین آوردن اریبی ناشی از بی پاسخی 33 است. در واقع، در نمونه گیری مضاعف لازم است ابتدا به جمع آوری داده های اولیه (مثلاً پرسشنامۀ پستی) بپردازیم، به دنبال آن، گروه بندی عناصر در دو طبقه صورت گرفته (مانند پاسخگویان به پرسشنامۀ پستی و بی پاسخ ها ) و سپس نمونه ای از افراد در یکی از طبقه ها انتخاب
می شود (مانند بی پاسخ های پرسشنامۀ پستی ) و برآوردگر نهایی، به صورت ترکیبی موزون از برآوردگرهای هر یک از دو طبقه بدست می آید.
فصل 2
طرح نمونه گیری مضاعف برای طبقه بندی
با استفاده ازیک اطلاع کمکی
2-1 مقدمه
از پیشرفت های عمده ای که اخیرا در بررسی های نمونه ای به چشم می خورد، استفاده از صفت کمکی x است که در ارتباط با متغیر مورد مطالعه y می باشد. استفاده از متغیر کمکی x در روش های مختلف برآوردیابی باعث افزایش دقت می شود. برای مثال در برآوردهای نسبتی و رگرسیونی نیاز به کسب اطلاعاتی در مورد میانگین جامعه ی متغیر کمکی x داریم. وقتی میانگین جامعه ی متغیر کمکی x معلوم باشد از یک نمونه گیری تصادفی ساده بدون جایگذاری و وقتی میانگین جامعه ی متغیر کمکی x مجهول باشد از روش نمونه گیری مضاعف استفاده می شود. به عبارت دیگر میانگین جامعه ی متغیر کمکی x از یک نمونه اولیه با حجم زیاد برآورد می شود به طوری که مشخصه ی کمکی x از پیش معلوم باشد و مقدار X ̅ توسط مقدار برآورد آن جایگزین می شود. در این روش مقادیر x به آسانی در دسترس است و جمع آوری آن ها نسبت به مقادیر y هزینه کم تری دارد.
از جمله طرح های نمونه گیری که در عمل کاربرد گسترده اي دارد، طرح نمونه گیری طبقه ای است. این طرح زمانی کاربرد دارد که جامعه به چند بخش یا ناحیه افراز شده باشد که هر کدام از این بخش ها یک طبقه را مشخص می کند. از نتایج موثر طبقه بندی جامعه افزایش دقت در مرحله ی برآورد می باشد. علاوه بر این استنباط روی هر زیر جامعه ی دلخواه از جامعه بر اساس طرح نمونه گیری طبقه ای میسر خواهد شد. چنانچه برای طبقه بندی کردن جامعه بر اساس یک متغیر موثر، تا قبل از انتخاب نمونه نتوان طبقه ی مربوط به یک واحد مشخص از جامعه را تعیین نمود یا در برخی از موارد که انتخاب یک متغیر به عنوان طبقه بندی پس از جمع آوری اطلاعات انجام می پذیرد، نمونه گیری طبقه ای پسین پیشنهاد می گردد. یکی از طرح های نمونه گیری که برای طبقه بندی کردن مناسب می باشد، طرح نمونه گیری مضاعف است. در صورتی که حجم طبقات یا وزن آن ها نامعلوم باشد یا در واقع اطلاعات از متغیری که براساس آن طبقات تعیین می شوند به آسانی در دسترس نباشد و یا با گذشت زمان برخی از طبقات اطلاعات از دست داده و نیاز به بروز کردن نمونه داشته باشند می توان از این طرح استفاده کرد. طرح نمونه گیری مضاعف برای طبقه بندی، در جنگل و منابع موجود در اکوسیستم های جنگلی کاربرد گسترده ای دارد. تئوری نمونه گیری مضاعف یا نمونه گیری دو فازی برای اولین بار توسط نیمن ]17[ در سال 1938 معرفی شد. پس از آن رائو34 ]20[ در سال 1973 از این طرح نمونه گیری در بررسی بی پاسخی ها و مقایسه های تحلیلی استفاده کرد. کاکران 35 ]4[ در سال 1977 نیز برخی از نتایج اساسی طرح نمونه گیری مضاعف را در کتاب خود ارائه کرده است. ایگ و همکاران36 ]11[ در سال 1987 به ارائه برآوردگرهای مطلوب بر اساس طرح نمونه گیری مضاعف برای طبقه بندی با استفاده از اطلاعات کمکی در فاز اول و فاز دوم پرداخته اند. همچنین سینگ و همکاران 37 ]32[ در سال 2007 کلاس بزرگی از برآوردگرهای میانگین جامعه را بر اساس این طرح نمونه گیری و بر اساس یک متغیر کمکی بدست آورده اند.
تعریف 2 . 1. نمونه گیری مضاعف برای طبقه بندی
طرح نمونه گیری مضاعف برای طبقه بندی در دو فاز صورت می گیرد. در فاز اول یک نمونه ی اولیه به حجم زیاد از متغیرهای کمکی گرفته شده و بر اساس آن طبقات شکل می گیرند و سپس در فاز دوم برای جمع آوری اطلاعات در مورد متغیر مورد مطالعه، از هر طبقه یک نمونه گرفته می شود. با توجه به این که میانگین صفت کمکی x، X ̅، مجهول است، بهترین روش نمونه گیری استفاده از نمونه گیری مضاعف برای طبقه بندی است، زیرا بر اساس نمونه ی با حجم زیاد که در فاز اول گرفته شده است می توان پارامتر مجهول X ̅ را برآورد نمود.
مثال2.2.1 ( عمیدی ]52[ )
فرض کنید اطلاعات مقدماتی نظیر جنسیت رای دهندگان برای طبقه بندی به آسانی به دست می آیند اما اطلاعات مفصل تر، مانند نظر سیاسی آن ها یا علت مخالفت آن ها با موضوع رای گیری به آسانی در اختیار نیست و نیاز به مصاحبه دارد. واضح است که انجام مصاحبه با همه رای دهندگان کاری وقت گیر و پر هزینه است.
فازهای نمونه گیری مضاعف برای طبقه بندی DSS
فاز اول : برای مشخص کردن جنسیت رای دهندگان نمونه ای بزرگ انتخاب می کنیم.
فاز دوم : برای تکمیل اطلاعات به تصادف با تعدادی از افراد انتخاب شده مصاحبه
می نماییم.
2-2 پارامترهای جامعه و طبقات
فرض کنید یک جامعه متناهی به حجم N داشته باشید. متغیر مورد مطالعه Y و متغیر کمکی X می باشند.
میانگین متغیر مورد مطالعه Y و متغیر کمکی X در طبقه ی h ام را به ترتیب با نماد های Y ̅_hوX ̅_h نمایش داده و از فرمول های زیر بدست می آیند:
(2-1)Y ̅_h=1/N_h ∑_(i=1)^(N_h)▒Y_hi ,

(2-2)X ̅_h=1/N_h ∑_(i=1)^(N_h)▒X_hi .
به طوری که متغیر مورد مطالعه Y عضو i ام در طبقه ی h ام را Y_hi و متغیر کمکی X را برای این عضو را X_hi همچنین حجم طبقه ی h ام را با N_h نمایش می دهند.
میانگین متغیر مورد مطالعه Y و میانگین متغیر کمکی X برای تمام جامعه از جمع کردن وزنی میانگین طبقات به صورت زیر بدست می آیند:
(2-3)
Y ̅=∑_(h=1)^L▒〖W_h Y ̅_h 〗 ,
(2-4)X ̅=∑_(h=1)^L▒〖W_h X ̅_h 〗 ,
(2-5)W_h=N_h/N.که در آن W_h وزن طبقه ی h ام است.
واریانس طبقه h ام برای متغیر Y را با نماد S_hy^2 و برای متغیر کمکی X با نماد S_hx^2 نشان
می دهیم که از فرمول های زیر بدست می آیند:
(2-6)S_hy^2=1/(N_h-1) ∑_(i=1)^(N_h)▒〖(Y_hi-〗 〖Y ̅_h)〗^2 ,

(2-7)S_hx^2=1/(N_h-1) ∑_(i=1)^(N_h)▒〖(X_hi-〗 〖X ̅_h)〗^2 .
کوواریانس بین متغیر Y و متغیر کمکی X در طبقه h ام جامعه را با نماد S_hyx نشان می دهیم و از فرمول زیر بدست می آید:
(2-8)S_hyx=1/(N_h-1) ∑_(i=1)^(N_h)▒〖(Y_hi-〗 Y ̅_h)(X_hi-X ̅_h ) .
واریانس متغیر Y برای تمام جامعه را با نماد S_y^2 و واریانس متغیر کمکی X برای تمام جامعه را با نماد S_x^2 نشان داده و از فرمول های زیر محاسبه می کنیم:
(2-9)S_y^2=1/(N-1) ∑_(i=1)^N▒〖(Y_i-〗 〖Y ̅)〗^2 ,
(2-10)S_x^2=1/(N-1) ∑_(i=1)^N▒〖(X_i-〗 〖X ̅)〗^2 .
ضریب رگرسیونی جامعه که با β نشان داده می شود از میانگین وزنی ضریب رگرسیونی طبقه h ام، β_h و به صورت زیر بدست می آید:
(2-11)β_h=S_hyx/(S_hx^2 ) ,
(2-12)β=(∑_(h=1)^L▒(1/γ_h -1) W_h S_hx^2 β_h)/(∑_(h=1)^L▒(1/γ_h -1) W_h S_hx^2 ) .
که در آن N_h=γ_h N_h^’ است.
ضریب همبستگی بین متغیر Y و متغیر کمکی X در طبقه h ام با نماد ρ_h نمایش داده شده و از فرمول زیر بدست می آید:
(2-13)ρ_h=S_hyx/(S_hy S_hx ) .
ضریب همبستگی بین متغیر Y و متغیر کمکی X درجامعه را با ρ نشان داده و از فرمول زیر بدست می آید:
(2-14)ρ=(∑_(h=1)^L▒(1/γ_h -1) W_h S_hyx)/√({∑_(h=1)^L▒(1/γ_h -1) W_h S_hx^2 }{∑_(h=1)^L▒(1/γ_h -1) W_h S_hy^2 } ) .

2-3 آماره های نمونه ای طبقات
حجم نمونه ی اولیه S_((1)) در فاز اول را n^’ در نظر می گیریم. نمونه ی اولیه S_((1)) به L طبقه تقسیم بندی شده كه طبقه ی h ام به حجم n_h^’ است و بنابراین
∑_(h=1)^L▒〖n_h^’=n^’ 〗.در فاز دوم، زیر نمونه ای از هر یک از طبقات به حجم n_h گرفته شده و همچنین ν_h نسبت حجم هر طبقه در فاز دوم به حجم هر طبقه در فاز اول است به طوری که:
n_h=ν_h n_h^’ 0<ν_h<1 , ( h=1,…,L )فرض کنید در فاز دوم از هر طبقه نمونه ای تصادفی انتخاب شود. برای مثال از طبقه h ام، نمونه ای تصادفی به اندازه n_h، که واحدهای انتخاب شده از 1 تا n_h اندیس گذاری شده اند، را انتخاب می کنیم که y_hi نشان دهنده عنصر شماره iام نمونه در طبقه h ام است. آماره های میانگین درطبقه h ام برای متغیر y و متغیر کمکی x به ترتیب به صورت زیر تعریف می شوند:
(2-15)y ̅_h=1/n_h ∑_(i=1)^(n_h)▒y_hi ,
(2-16)x ̅_h=1/n_h ∑_(i=1)^(n_h)▒x_hi .
همچنین چون در روش نمونه گیری مضاعف برای طبقه بندی در فاز اول، نمونه اولیه بر اساس متغیر کمکی بدست آمده و حجم هر یک از طبقات 〖n_h〗^’ فرض می شود، میانگین نمونه ای در طبقه h ام برای متغیر کمکی در این فاز 〖x ̅_h〗^’، می باشد. همچنین میانگین نمونه ای متغیر کمکی، x ̅^’، است که به صورت زیر تعریف می شوند :
〖x ̅_h〗^’=1/〖n_h〗^’ ∑_(i=1)^(〖n_h〗^’)▒x_hi ,

(2-17)x ̅^’=∑_(h=1)^L▒〖〖w_h〗^’ 〖x ̅_h〗^’ 〗 .
لازم به ذکر است که x ̅^’ یک برآوردگر نااریب برای میانگین جامعه کمکی، X ̅، است.
واریانس نمونه ای درطبقه h ام برای متغیر y و متغیر کمکی x که به ترتیب با 〖 s〗_(hy )^2 و 〖 s〗_hx^2 نمایش داده می شوند و فرمول های زیر بدست می آیند :
(2-18)s_hy^2=1/(n_h-1) ∑_(i=1)^(n_h)▒〖(y_hi-〗 〖y ̅_h)〗^2 ,(2-19)s_hx^2=1/(n_h-1) ∑_(i=1)^(n_h)▒〖(x_hi-〗 〖x ̅_h)〗^2 .
کوواریانس نمونه ای بین متغیر y و متغیر کمکی x در یک طبقه h ام را با نماد s_hyx نشان داده و از فرمول زیر بدست می آید :
(2-20)s_hyx=1/(n_h-1) ∑_(i=1)^(n_h)▒〖(y_hi-〗 y ̅_h)(x_hi-x ̅_h ) .
برآورد ضریب رگرسیونی که با β ̂ نشان داده می شود از فرمول زیر بدست می آید :
(2-21)
β ̂=(∑_(h=1)^L▒(1/ν_h -1) 〖w_h〗^’ s_hyx)/(∑_(h=1)^L▒(1/ν_h -1) 〖w_h〗^’ s_hx^2 )=(∑_(h=1)^L▒〖a_h β ̂_h 〗)/(∑_(h=1)^L▒a_h ) .
که β ̂_h ضریب رگرسیونی طبقه h ام، w_h^’و a_h به صورت زیر تعریف می شوند :
w_h^’=(n_h^’)/n^’ ,a_h=(1/ν_h -1) 〖w_h〗^’ s_hx^2 .
β ̂_h=s_hyx/(s_hx^2 ) ,
2-4 برآورد معمولی میانگین در نمونه گیری مضاعف برای طبقه بندی
در برآورد میانگین جامعه اگر y ̅_h برآوردگر میانگین متغیر مورد مطالعه در طبقه h ام و〖w_h〗^’ برآورد وزن طبقات باشد، آن گاه برآوردگر میانگین جامعه Y ̅  ̂ که با y ̅_ds نشان داده می شود به صورت زیر تعریف می شود :
(2-22)Y ̅  ̂=y ̅_ds=∑_(h=1)^L▒〖〖w_h〗^’ y ̅_h 〗 .
همچنین اگر فرض کنیم x ̅_h برآوردگر میانگین متغیر کمکی در طبقه h ام باشد، برآوردگر میانگین جامعه کمکی را با x ̅_ds نمایش می دهیم و از فرمول زیر بدست می آید :
x ̅_ds=∑_(h=1)^L▒〖〖w_h〗^’ x ̅_h 〗 .
در طرح نمونه گیری مضاعف برای طبقه بندی در ابتدا وزن طبقات، W_h، نامعلوم است و پس از بدست آوردن نمونه ی اولیه در فاز اول 〖w_h〗^’ برآورد وزن طبقات بدست می آید که یک برآوردگر نااریب برای W_h است. در این روش نمونه گیری از امید ریاضی مکرر استفاده
می شود. در واقع با فرض اینکه در فاز اول 〖w_h〗^’ برآورد شده و یک مقدار معلوم است، نشان
می دهیم y ̅_ds یک برآوردگر نااریب برای میانگین جامعه Y ̅ است.
w_h^’=(n_h^’)/n^’ ,
E(〖w_h〗^’ )=W_h ,
(2-23)E(y ̅_ds )=E(E(∑_(h=1)^L▒〖〖w_h〗^’ y ̅_h 〗│〖w_h〗^’ ))=E(∑_(h=1)^L▒〖〖w_h〗^’ Y ̅_h 〗)=∑_(h=1)^L▒〖W_h Y ̅_h 〗=Y ̅ .
به طور مشابه می توان نشان داد كه x ̅_ds نيز یک برآوردگر نااریب برای میانگین جامعه کمکی، X ̅، است.
واریانس برآوردگر میانگین جامعه، y ̅_ds ، به صورت زیر بدست می آید :
(2-24)Var(y ̅_ds )=(1/n^’ -1/N) S_y^2+1/n^’ ∑_(h=1)^L▒(1/ν_h -1) W_h S_hy^2 .
اثبات واریانس این برآوردگر توسط کاکران ]4[ در سال 1977 محاسبه شده است.
برآورد واریانس برآوردگر y ̅_ds توسط راﺋو ]20[ در سال 1973 به صورت زیر ارایه شد :
(2-25)V ̂ar(y ̅_ds )=(N-1)/N ∑_h▒〖((〖n_h〗^’-1)/(n^’-1)-(n_h-1)/(N-1)) (〖w_h〗^’ s_hy^2)/n_h + (N-n^’)/N(n^’-1) ∑_h▒〖〖w_h〗^’ (y ̅_h-y ̅_ds )^2 〗〗.

2-5 برآوردگر رگرسیونی مرکب و برآوردگر رگرسیونی جدا در نمونه گیری مضاعف برای طبقه بندی
فرض کنید یک متغیر کمکی در اختیار دارید که با متغیر پاسخ همبستگی نسبتا بالایی داشته باشد، در این صورت برآوردگر رگرسیونی، یک برآوردگر مناسب است. در جامعه های دارای طبقه بندی از برآوردگر رگرسیونی به دو صورت مرکب و جدا استفاده می شود.
برآوردگر رگرسیونی مرکب38 برآوردگری است که برای بدست آوردن آن، ابتدا میانگین طبقه ای دو متغیر پاسخ و کمکی در فاز دوم طرح نمونه گیری مضاعف برای طبقه بندی به طور جداگانه برآورد می شود و سپس در فرمول برآوردگر رگرسیونی قرار داده می شود.
برآوردگر رگرسیونی جدا 39 برآوردگری است که برای بدست آوردن آن، ابتدا در هر طبقه میانگین طبقه به کمک فرمول برآوردگر رگرسیونی در آن طبقه برآورد شده سپس با استفاده از میانگین موزون برآوردهای تمام طبقات، برآورد میانگین جامعه حاصل می شود.
زمانی که شیب خط رگرسیونی درون طبقات با هم برابر باشد دو روش کارایی یکسانی دارند، ولی در حالتی که شیب خط های رگرسیونی درون طبقات با هم برابر نباشد برآوردگر رگرسیونی جدا کاراتر خواهد بود.
2-5-1 برآوردگر رگرسیونی مرکب برای میانگین جامعه
سینگ و همکاران ]32[ در سال 2007 برآوردگر رگرسیونی مرکب میانگین جامعه که به صورت y ̅_lc نمادگذاری می کنند و از فرمول زیر بدست می آید :
(2-26)y ̅_lc=y ̅_ds-β ̂(x ̅_ds-x ̅^’ ) .
واریانس y ̅_lc برای یک نمونه بزرگ با تقریب مرتبه اول به صورت زیر است:
(2-27)Var(y ̅_lc )=((1-f)/n^’ ) S_y^2+1/n^’ (1-ρ^2 ) ∑_(h=1)^L▒(1/ν_h -1) W_h S_hy^2 .
که f=n^’/N و ρ در رابطه (2-14) تعریف شده است.
2-5-2 برآوردگر رگرسیونی جدا برای میانگین جامعه
سینگ و همکاران ]32[ در سال 2007 برآوردگر رگرسیونی جدا برای میانگین جامعه که به صورت y ̅_ls نمادگذاری می کنند و از فرمول زیر بدست می آید :
(2-28)y ̅_ls=∑_(h=1)^L▒〖〖w_h〗^’ {y ̅_h-β ̂_h (x ̅_h-〖x ̅_h〗^’)} 〗 .
واریانس y ̅_ls برای یک نمونه بزرگ با تقریب مرتبه اول عبارت است از :
(2-29)Var(y ̅_lc )=((1-f)/n^´ ) S_y^2+1/n^´ ∑_(h=1)^L▒(1/ν_h -1) (1-〖ρ_h〗^2 ) W_h S_hy^2 .

2-6 یک کلاس بزرگ از برآوردگرها برای میانگین جامعه با استفاده از یک متغیر کمکی
سریواستاوا ]41[ در سال1980 برای برآورد میانگین جامعه ¯Y با معلوم فرض شدن میانگین جامعه ی کمکی ¯X کلاسی به صورت زیر تعریف کرد:
y ̃_h=y ̅ h(x ̅/X ̅ ) .
که در آن h(.) یک تابع پارامتری است کهh(1)=1 ، همچنین y ̅ و x ̅ به ترتیب میانگین های نمونه ای متغیرهای X و Y هستند.
سریواستاوا کلاس فوق را با اعمال فرضیاتی به صورت تابع g گسترش داد. وی فرض کرد Y ̅  ̂ و X ̅  ̂ برآوردگرهای سازگار برای Y ̅ و X ̅ هستند. همچنین مقادیر (X ̅  ̂ و Y ̅  ̂) را در یک زیر مجموعه ی محدب و بسته R در نظر گرفته، با فرض اینکه تابع g(Y ̅  ̂ , X ̅  ̂) به عنوان یک تابع پیوسته و مشتق پذیر جزیی مرتبه اول و دوم باشد و g(Y ̅,X ̅)=Y ̅. کلاس برآوردگرهای میانگین جامعه، ¯Y، به صورت زیر بدست می آید :
Y ̅  ̂_g=g(Y ̅  ̂ , X ̅  ̂ ) .
با استفاده از بسط تیلور مرتبه دوم g(Y ̅  ̂



قیمت: تومان

دسته بندی : مقاله و پایان نامه

دیدگاهتان را بنویسید