دانشکده علوم دامی و شیلات
رساله‌ي دکتری رشتهی ژنتیک و اصلاح دام
عنوان رساله:
مقایسه صحت برخی روش‌های بیزی در استراتژی‌های مختلف ارزیابی ژنومی صفات آستانه‌ای
دانشجو:
حسن بانه
استادان راهنما:
دکتر قدرت الله رحیمی
دکتر اردشیر نجاتی جوارمی
استاد مشاور:
دکتر محمود هنرور
خرداد 1394
کلیه حقوق مادی مترتب بر نتایج مطالعات، ابتکارات
و نوآوری‌های ناشی از تحقیق موضوع این پایان‌نامه
متعلق به دانشگاه علوم کشاورزی و منابع طبیعی ساری است
تشکر و قدردانی
خداوند متعال را شاکرم که بنده حقير را در درياي ژرف و بيكران انديشه، قطره‌ای ساخت تا وسعت آن را از دريچه اندیشه‌های ناب آموزگاراني بزرگ به تماشا نشيند. اکنون‌که در سايه‌سار بنده‌نوازی‌هایش رساله حاضر به انجام رسيده است، بر خود لازم می‌دانم مراتب سپاس از بزرگواراني به‌جا آورم كه اگر دست ياريگرشان نبود اين پژوهش به انجام نمي‌رسيد. از استاد بزرگوار جناب آقای دکتر رحیمی كه همواره شاگردي ایشان برایم افتخار بوده و هست به خاطر مساعدت‌ها و مهربانی‌هایشان تشکر می‌کنم. از زحمات بی‌دریغ جناب آقای دکتر نجاتی که همواره صمیمانه پذیرای بنده بودند و با گشاده‌رویی به سؤالات بنده پاسخ می‌دادند بسیار سپاسگزارم. همچنین از جناب آقای دکتر محمود هنرور بابت راهنمایی‌های ارزنده‌شان تشکر می‌کنم. از اساتيد محترم و گران‌قدر از جناب آقایان دكتر حسن حافظيان، دكتر روح‌الله عبدالله پور و دكتر محسن قلی زاده كه زحمت داوري اين رساله را تقبل فرمودند صميمانه تشكر می‌کنم. همکلاسی‌های ارجمندم دكتر مظاهر صفدریان، دكتر فرهاد غفوری کسبی و دكتر بیژن سلیمانی كه آخرين مقطع تحصيلي را شيرين و پرخاطره نمودند و همواره مشوق و يار این‌جانب بوده‌اند صميمانه تشكر می‌کنم. از دوستان عزيز و عالي‌قدر مجتبی نجفی، رستم عبدالهي آرپناهي، شورش شريفي، محمد رزم کبیر، محمد رکوعی، شهرام نیک‌نفس، خه‌بات خسروي، سعيد شیوخی، محمد قادر زاده، سليمان جهانگيري، سامان امینی، شهاب سهرابي، سیما ساور سفلی كه هر يك به‌نوعی بنده را مراحل مختلف انجام اين پژوهش ياري نمودند تشكر و قدردانی می‌کنم. همچنين جا دارد مراتب سپاس خود را تقديم استاد عزیز Jose Fernando Garcia نمايم که موجبات اداري و مالي سفر کوتاه مطالعاتی این‌جانب را به برزیل فراهم نمودند. از استادان محترم MP Clus، de los Campus و VanRaden که با کمال متانت و در اسرع وقت به سؤالات بنده پاسخ دادند تشکر می‌کنم. از پدر و مادر عزيزم كه دلسوزانه برايم زحمت كشيدند، خواهران و برادرم، و خانواده محترم کهنه پوشی که همواره مشوق این‌جانب بودند صمیمانه قدردانی می‌کنم. سپاس آخر را به مهربان ياورم، همسر عزيزم، تقديم می‌کنم كه حضورش در فضاي زندگي مصداق بی‌ریای رفاقت است.
حسن بانه
خرداد 1394
چکیده
این مطالعه با هدف ارزیابی صحت روش‌های مختلف بیزی در پیش‌بینی ارزش‌های اصلاحی ژنومی صفات آستانه‌ای انجام شد. به همین منظور، ژنومی متشکل از سه کروموزوم هر یک به طول یک مورگان، و روی هر کروموزوم 2000 نشانگر چند شکل تک نوکلئوتیدی شبیه‌سازی شد. جمعیت پایه شامل 100 جفت بود که 50 نسل آمیزش تصادفی (جمعیت تاریخی) منجر به عدم تعادل لینکاژی (در سطح تقریباً 2/0) شد. نسل 51 که دارای اطلاعات فنوتیپی و ژنوتیپی بود به‌عنوان جمعیت مرجع در نظر گرفته شد و به‌منظور برآورد اثرات آللی استفاده شد. نسل‌های بعد که فقط دارای اطلاعات نشانگری بودند به‌عنوان جمعیت تایید در نظر گرفته شدند. اطلاعات فنوتیپی صفت نرمال در جمعیت مرجع با توجه به ارزش فنوتیپی فرد و نقاط آستانه به دو صفت آستانه‌ای زنده‌مانی (صفت یک آستانه) و تعداد همزادان (صفت دو آستانه) تبدیل گردید. سناریوهای مورد مطالعه به‌صورت ترکیبی از سطوح مختلف تعداد QTL (01/0، 05/0 و 1/0 تعداد کل نشانگر)، توزیع اثرات ژنی (توزیع نرمال، گاما و یکنواخت)، وراثت‌پذیری صفت (05/0، 1/0، 15/0 و 2/0) و اندازه جمعیت مرجع (250، 500، 1000، 2000 و 5000) بود. ارزش‌های اصلاحی ژنومی افراد جمعیت مرجع و تایید با استفاده از اثرات نشانگری برآورد شده توسط رگرسیون ریج بیزی (BRR)، بیز A (Bayes A)، بیز B (Bayes B)، بیز C (Bayes C) و بیز L (Bayes L) پیش‌بینی شد. همبستگی پیرسون بین ارزش‌های اصلاحی برآورد شده و واقعی به‌عنوان صحت پیش‌بینی هر سناریو در نظر گرفته شد. نتایج نشان داد که صحت پیش‌بینی تمام روش‌های مورد مطالعه (به دلیل تشابه ماهیت محاسباتی) به هم نزدیک بوده ولی در این میان روش‌های بیز A و بیز B توانستند نسبت به سایر روش‌ها، اثرات آللی را اندکی بهتر (3 تا 7 درصد) برآورد کنند. همچنین زمانی که توزیع اثرات ژنی به‌صورت گاما بود، صحت برآوردها اندکی بالاتر از توزیع‌های نرمال و یکنواخت بود. اما در این دو توزیع، برآوردهای تقریباً مشابهی به دست آمد. مقایسه نتایج حاصل از سطوح مختلف تعداد (درصد) QTL نشان داد زمانی که صفت به‌وسیله تعداد QTL بیشتری کنترل می‌شود ارزش‌های اصلاحی ژنومی با صحت بالاتری پیش‌بینی می‌شوند. در هر دو صفت، این افزایش در توزیع اثرات ژنی گاما، نمایان‌تر بود. با افزایش وراثت‌پذیری صفت، صحت برآورد اثرات آللی و متعاقب آن پیش‌بینی ارزش‌های اصلاحی ژنومی افزایش یافت. هرچند که تفاوت صحت‌های به‌دست‌آمده در ضرایب پایین (05/0 و 1/0) بیشتر بوده ولی در ضرایب بالاتر (15/0 و 2/0) این تفاوت کمتر بود. به‌طورکلی، صحت پیش‌بینی در سطوح مختلف وراثت‌پذیری بین 54/0 تا 84/0 (در صفت تعداد همزادان) و 41/0 تا 70/0 (در صفت زنده‌مانی) متغیر بود. همان‌طور که انتظار می‌رفت در هر دو صفت، با افزایش تعداد افراد جمعیت مرجع، صحت پیش‌بینی ارزش‌های اصلاحی ژنومی افزایش یافت. اما صحت پیش‌بینی‌ها در صفت زنده‌مانی، با افزایش تعداد مشاهدات در جمعیت مرجع نسبت به صفت تعداد همزادان، افزایش بیشتری نشان داد. با افزایش فاصله بین نسل‌های جمعیت مرجع و جمعیت تأیید، صحت پیش‌بینی‌ها کاهش یافت. اما صفت زنده‌مانی و روش‌های بیز A و بیز B دارای نرخ کاهش آهسته‌تری بودند. همچنین نتایج نشان داد که نرخ کاهش، مستقل از وراثت‌پذیری صفت و تعداد افراد جمعیت مرجع بوده و بیشتر تابع سطح عدم تعادل لینکاژی در جمعیت است. صحت استنباط ژنوتیپی با روش جنگل تصادفی نسبت به روش تصادفی تفاوت چشمگیری داشت. همچنین صحت استنباط ژنوتیپی به روش جنگل تصادفی با افزایش سطح عدم تعادل لینکاژی افزایش یافت. صحت ارزیابی ژنوتیپ‌های استنباط شده، در سطوح مختلف عدم تعادل لینکاژی، تفاوت چندانی نداشت. نتایج این مطالعه نشان داد که روش‌های بیزی، روش‌های قدرتمندی در پیش‌بینی ارزش‌های اصلاحی ژنومی بوده و استفاده از این روش‌ها، در سناریوهای مختلف ژنومی و جمعیتی، می‌تواند منجر به پیشرفت ژنتیکی چشمگیری در صفات آستانه‌ای شود. روش جنگل تصادفی تا سطح 70% ژنوتیپ ازدست‌رفته کارایی بالایی دارد اما صحت استنباط آن در سطوح بالاتر شدیداً کاهش پیدا می‌کند.
کلمات کلیدی: صفات آستانه‌ای، معماری ژنتیکی، ژنوم، روش‌های بیزی، جنگل تصادفی، استنباط ژنوتیپی.
فهرست مطالب
عنوانشماره صفحهفصل اول1
مقدمه و کلیات1
1-1- مقدمه2
2-1- اهداف پژوهش4
فصل دوم5
بررسی منابع5
2-1- اهداف اصلاح نژاد6
2-2- روش‌های ارزیابی کلاسیک6
2-3- استفاده از منابع اطلاعاتی نشانگری7
2-4- انتخاب به کمک نشانگر8
2-5- چند شکلي‌هاي تک نوکلئوتيدي9
2-6- ميکرو تراشه‌های DNA9
2-7- انتخاب ژنومی10
2-8- مزایای انتخاب ژنومی13
2-9- روش‌هاي آماري پيش‌بيني ژنومي13
2-10- روش‌های بیزی در انتخاب ژنومی16
2-11- استنباط ژنوتيپي17
2-11-1- استنباط مبتني بر شجره18
2-11-2- استنباط مبتني بر ساختار جمعيت18
2-12- اصلاح نژاد ژنومي در گوسفند19
2-13- مروري بر نتايج برخي مطالعات انجام شده20
فصل سوم26
مواد و روش‌ها26
3-1- شبیه‌سازی ژنوم27
3-2- شبیه‌سازی جمعیت‌ها27
3-3- محاسبه عدم تعادل لینکاژی27
3-4- صفات مورد مطالعه28
3-5- سناریوهای مورد آزمایش29
3-5-1- توزیع اثرات QTL29
3-5-2- تعداد QTL29
3-5-3- وراثت‌پذیری صفت29
3-5-4- تعداد مشاهدات30
3-5-5- پایداری صحت پیش‌بینی‌ها30
3-6- روش‌های ارزیابی30
3-7- برآورد ارزش‌های اصلاحی ژنومی34
3-8- مقایسه صحت روش‌ها34
3-9- استنباط ژنوتیپی34
3-10-1-روش تخصیص تصادفی34
3-10-2- روش جنگل تصادفی35
3-11- صحت استنباط ژنوتیپ35
3-12- صحت پیش‌بینی ارزش‌های اصلاحی ژنومی حاصل از ژنوتیپ استنباط شده36
فصل چهارم37
نتایج37
4-1- سطح عدم تعادل لينکاژي38
4-2- صحت ارزيابي‌ها در سناريوهاي مختلف38
4-3- توزيع اثرات ژني39
4-4- تعداد QTL40
4-5- وراثت‌پذیری صفت41
4-6- تعداد افراد جمعیت مرجع44
4-7- پايداري صحت پيش‌بيني در نسل‌های جمعیت تايید45
4-8- استنباط ژنوتیپی48
فصل پنجم50
بحث و نتیجه‌گیری50
5-1- بحث51
5-2- نتیجه‌گیری60
5-3- پیشنهادها61
منابع و ماخذ62
فهرست جداول
عنوانشماره صفحهجدول 4-1- صحت ارزش‌های اصلاحی ژنومی روش‌های مورد مطالعه در تعداد افراد مرجع و وراثت‌پذیری‌های مختلف46
فهرست شکل‌ها
عنوانشماره صفحهشکل 2-1- فرایند انتخاب ژنومی12شکل 4-1- تغییرات عدم تعادل لینکاژی در نسل‌های مختلف جمعیت تاریخی38شکل 4-2- صحت ارزش‌های اصلاحی ژنومی برای صفت تعداد همزادان با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در سه حالت توزیع اثرات ژنی یکنواخت، نرمال و گاما39شکل 4-3- صحت ارزش‌های اصلاحی ژنومی برای صفت زنده‌مانی با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در سه حالت توزیع اثرات ژنی یکنواخت، نرمال و گاما40شکل 4-4- صحت ارزش‌های اصلاحی ژنومی برای صفت تعداد همزادان با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در سه حالت توزیع اثرات ژنی یکنواخت، نرمال و گاما41شکل 4-5- صحت ارزش‌های اصلاحی ژنومی برای صفت زنده‌مانی با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در سه حالت توزیع اثرات ژنی یکنواخت، نرمال و گاما42شکل 4-6- صحت ارزش‌های اصلاحی ژنومی برای تعداد همزادان با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در وراثت‌پذیری‌های مختلف و توزیع اثرات ژنی یکنواخت، نرمال و گاما43شکل 4-7- صحت ارزش‌های اصلاحی ژنومی برای صفت زنده‌مانی با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در وراثت‌پذیری‌های مختلف و توزیع اثرات ژنی یکنواخت، نرمال و گاما43شکل 4-8- صحت ارزش‌های اصلاحی ژنومی برای صفت تعداد همزادان با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در تعداد افراد مرجع و وراثت‌پذیری‌های مختلف44شکل 4-9- صحت ارزش‌های اصلاحی ژنومی برای صفت زنده‌مانی با استفاده از روش‌های بیز A (BA)، بیز B (BB)، بیز C (BC)، بیز لاسو (BL)، رگرسیون ریج بیزی (BRR) در تعداد افراد مرجع و وراثت‌پذیری‌های مختلف45شکل 4-10- تابعیت صحت ارزش‌های اصلاحی روش‌های مورد مطالعه به نسل (صفت تعداد همزادان)47شکل 4-11- تابعیت صحت ارزش‌های اصلاحی روش‌های مورد مطالعه به نسل (صفت زنده‌مانی)47شکل 4-12- صحت استنباط ژنوتیپی با استفاده از روش‌های جنگل تصادفی و روش انتساب تصادفی در سطح مختلف عدم تعادل لینکاژی و درصدهای مختلف ژنوتیپ ازدست‌رفته48شکل 4-13- صحت ارزیابی ژنومی صفت تعداد همزادان در سطح مختلف عدم تعادل لینکاژی و درصدهای مختلف ژنوتیپ ازدست‌رفته استنباط شده با استفاده از روش‌های جنگل تصادفی و روش انتساب تصادفی.49شکل 4-13- صحت ارزیابی ژنومی صفت زنده‌مانی در سطح مختلف عدم تعادل لینکاژی و درصدهای مختلف ژنوتیپ ازدست‌رفته استنباط شده با استفاده از روش‌های جنگل تصادفی و روش انتساب تصادفی49
فصل اول
مقدمه و کلیات
1-1- مقدمه
هدف اصلی اصلاح نژاد، افزایش سودآوری تولیدکنندگان در راستای پاسخ به نیاز مصرف‌کنندگان و متقاضیان می‌باشد. بنابراین شناسایی جنبه‌های اقتصادی-اجتماعی سیستم تولید و تعریف اهداف اصلاحی اولین قدم در توسعه برنامه‌های اصلاح نژادی است (گُدارد، 1998). اهداف اصلاحی، صفاتی که باید بهبود داده شوند و نیز اهمیت نسبی هرکدام از این صفات را مشخص می‌کند. برای مثال در برنامه‌های اصلاحی کنونی علاوه بر تولید بیشتر، فرآورده‌های ایمن و سالم از حیوانات سالم‌تر نیز مطرح است (باچ، 2010). قدم بعدی، شناسایی و رتبه‌بندی حیوانات ازلحاظ ظرفیت ژنتیکی صفات موردنظر و معرفی مناسب‌ترین محیط و شرایط برای به فعلیت رساندن این پتانسیل است. در صورت رتبه‌بندی صحیح افراد کاندیدا و انتخاب آن‌ها به‌عنوان والدین نسل بعد، حداکثر پیشرفت ژنتیکی قابل‌انتظار خواهد بود.
انتخاب می‌تواند منجر به تغییر فراوانی آللی در جایگاه‌هایی شود که در مسیر انتخاب قرار دارند. بنابراین هرچه این غربالگری به نحو بهتری انجام شود پاسخ بیشتری قابل‌انتظار است. زیرا فراوانی آلل مفید و موثر در جمعیت بیشتر شده و میانگین عملکرد فنوتیپی صفت یا صفات را بیشتر تغییر می‌دهد. اما مهم‌ترین مسئله در اصلاح دام، شناسایی و تشخیص جایگاه‌های موثر و تعداد آلل و نوع اثرات این جایگاه‌ها و همچنین، شناسایی حیوانات حامل این آلل‌ها می‌باشد.
در روش‌های کلاسیک اصلاح دام، انتخاب برای صفات مهم اقتصادی با استفاده از اطلاعات شجره‌ای به همراه رکوردهای فنوتیپی خود فرد، آیندگان (فرزندان و نوه‌ها) و گذشتگان (والدین و سایر افراد خویشاوند نسل‌های قبل) انجام گرفته و بهترین پیش‌بینی نااریب خطی ارزش‌های اصلاحی فرد حاصل می‌شود. استفاده از معادلات مدل‌های مختلط منجر به ارزیابی‌های دقیق‌تری شد که پیشرفت‌های انکار ناپذیری را برای برخی از صفات مهم اقتصادی به همراه داشت (باچ، 2010). از محدودیت‌های این روش می‌توان به هزینه‌بر بودن فرایند رکوردبرداری، ارزیابی حیوانات جوان، ارزیابی برای صفات محدود به جنس و صفاتی که در مراحل پایانی زندگی یا حتی پس از کشتار رکوردگیری می‌شوند اشاره کرد. در این‌حالت، ارزش‌های اصلاحی پیش‌بینی شده تابعی از صحت و کیفیت شجره و اندازه رکوردهای فنوتیپی فرد و خویشاوندانش می‌باشد. (فروتنی فر و همکاران، 1391 و مِوویسِن، 2007).
رتبه‌بندی و انتخاب افراد بر اساس ارزش‌های اصلاحی برآورد شده به این مفهوم است که افراد دارای بالاترین ارزش‌های اصلاحی، دارای آلل‌های مطلوب برای آن صفت هستند. در واقع ژنوم فرد به‌عنوان جعبه سیاهی مطرح بود که محتوای داخل آن تخمین زده می‌شود. در گذشته، شکافتن این جعبه و کشف محتوای داخل آن که همان ژنوم باشد، به دلیل عدم پیشرفت تکنولوژی مقدور نبود اما برخی مطالعات استفاده از آن را در بهبود ژنتیکی صفات سودمند بیان کردند (اسمیت، 1967). در دهه 90 نیز استفاده از ماتریس روابط آللی به‌جای ماتریس روابط خویشاوندی مبتنی بر شجره، در معادلات مدل‌های مختلط ارایه شد که رتبه‌بندی صحیح‌تر افراد به‌ویژه برای افراد تنی بدون رکورد را فراهم می‌کرد (نجاتی-جوارمی و همکاران، 1997). همچنین در همین مطالعه ایده استفاده مستقیم از اطلاعات QTL در ارزیابی افراد پیشنهاد شد.
کشف و توسعه نشانگرهای مولکولی این امکان را فراهم کرد که در تعداد بسیار زیادی جایگاه بتوان ژنوم افراد را توصیف کرد. در واقع دریچه‌ای را به سوی یافتن و داشتن پیش‌بینی‌های صحیح‌تری از ارزش‌های ژنتیکی در ابتدای زندگی حیوان برای اصلاحگران گشود (دِ لوس کامپوس و همکاران، 2013b). اولین تلاش‌ها برای همراه کردن اطلاعات نشانگری در پیش‌بینی‌ها، مبتنی بر استفاده از QTL های شناسایی شده در تکنیک انتخاب به کمک نشانگر بود؛ اما نتایج استفاده از این تکنیک کمتر از حد مورد انتظار بود (دِکرز و همکاران، 2004؛ بِرناردو، 2008؛ هِیز و همکاران، 2009). پیشرفت‌های تعیین ژنوتیپ در تعداد بسیار زیادی جایگاه ژنی و تکنولوژی توالی‌یابی، امکان کشف صدها هزار نشانگر ژنتیکی را در ژنوم انسان و چندین گونه حیوانی و گیاهی فراهم کرد. پانل‌های متراکم نشانگری، توانایی غربال کردن عدم تعادل لینکاژی چند جایگاهی بین QTL و مارکرهای سراسر ژنوم را برای محققین فراهم نمود. اگر چه مطالعات اولیه توسط نجاتی-جوارمی و همکاران (1997)، ویسچِر (1998) و ویتتاکر و همکاران (2000) در زمینه استفاده از اطلاعات ژنومی در ارزیابی‌های ژنتیکی انجام شده است اما شالوده انتخاب بر اساس کل ژنوم در مقاله پیشگامانه‌ای که توسط مِوویسِن و همکاران (2001) انتشار یافت، ارایه شده است. در این روش می‌توان ارزش‌های اصلاحی ژنومی تمام افراد را با استفاده از یک مدل خطی به‌صورت تابعیت فنوتیپ‌ها از تمام نشانگرهای متراکم که کل ژنوم را پوشش می‌دهند با صحت بالا برآورد کرد. مهم‌ترین مرحله آن برآورد اثرات آللی می‌باشد، زیرا هر چه اثرات QTL به نحو صحیح‌تری برآورد شوند، ارزش‌های اصلاحی پیش‌بینی شده بیشتر معرف ظرفیت ژنتیکی حیوان بوده و رتبه‌بندی حیوانات به‌طور صحیح‌تری انجام خواهد شد و درنتیجه پیشرفت ژنتیکی و پاسخ به انتخاب بیشتری مورد انتظار خواهد بود. عوامل مختلفی می‌توانند صحت ارزش‌های اصلاحی ژنومی و ارزیابی ژنومی را تحت تاثیر قرار دهند. این عوامل شامل مدل آماری مورد استفاده به‌منظور برآورد اثرات نشانگرها، توزیع اثرات QTL، مقدار LD، نوع و تراکم مارکرها، وراثت‌پذیری، نحوه رکوردگیری و نوع رکورد، تعداد داده‌های فنوتیپی در جمعیت مرجع، فاصله زمانی (تعداد نسل) بین جمعیت مرجع و جمعیت تایید می‌باشند (زرگریان و همکاران، 1389؛ فروتنی فر و همکاران، 1391؛ ژانگ و همکاران، 2009؛ بُوومان و همکاران، 2011؛ مُسِر و همکاران، 2009؛ مویر و همکاران، 2007؛ ویلامسِن و همکاران، 2009). مدل‌های آماری مورد استفاده برحسب ویژگی‌های برآورد کنندگی خود می‌توانند نتایج متفاوتی داشته باشند و علاوه برآن کارایی مدل‌های مختلف در برازش داده‌های ژنومی به شرایط آزمایش، نوع صفت، توزیع اثرات ژنی، خصوصیات جمعیت، ساختار ژنومی و … بستگی دارد. لذا شناسایی عوامل موثر در صحت برآورد ارزش‌های اصلاحی ضروری به نظر می‌رسد.
هرچند که انتخاب ژنومی می‌تواند منجر به بهبود پیشرفت ژنتیکی در برنامه‌های اصلاح نژادی شود اما به نظر می‌رسد محدودیت کلیدی آن هزینه تعیین ژنوتیپ باشد (هِیز و همکاران، 2012). این مشکل را می‌توان از طریق استنباط ژنوتیپی برطرف کرد. در این روش، حیوانات کاندیدا با استفاده از پانل کم تراکم SNP ها (پوشش پراکنده ژنوتیپ و هزینه پایین) و حیوانات مرجع با استفاده از پانل متراکم تعیین ژنوتیپ می‌شوند. سپس، سایر SNP هایی که در پانل متراکم حضور دارند ولی در پانل کم تراکم نیستند استنباط خواهند شد. ژنوتیپ‌های استنباط شده می‌توانند به‌منظور برآورد ارزش‌های اصلاحی ژنومی با استفاده از معادلات پیش‌بینی مورد استفاده قرار گیرند (هِیز و همکاران، 2012).
از روش‌های مختلف استنباط ژنوتیپی (Genotype Imputation) می‌توان به‌منظور ترکیب پنل‌های مختلف نشانگری و نیز بازیابی ژنوتیپ‌های ازدست‌رفته، استفاده نمود. همچنین می‌توان بر اساس یک نمونه معرف حیوانات (ژنوتیپ شده در تراکم بالا) پانل ژنوتیپ را از یک آرایه کمتر به یک آرایه بیشتر بسط داد (پاوچ و همکاران، 2013). صحت استنباط ژنوتیپی بستگی به عواملی چون نسبت ژنوتیپ‌های ازدست‌رفته، تعداد افراد و خویشاوندان تعیین ژنوتیپ شده با تراکم بالا، روش استنباط و تفاوت تعداد آرایه‌های پنل های نشانگری دارد.
در بسیاری از برنامه‌های اصلاح نژادی، صفات آستانه‌ای مانند موفقیت و شکست در آبستنی، حساسیت و مقاومت به بیماری‌ها، تعداد تلقیح به ازای آبستنی، دوقلوزایی، زنده‌مانی، صفات تیپ و … از مهم‌ترین صفات اقتصادی به‌شمار می‌روند. در بسیاری از سیستم‌های ارزیابی ژنتیکی، در تشکیل شاخص انتخاب حیوانات برتر هر دو دسته صفات پیوسته (مانند وزن بدن و تولید) و صفات آستانه‌ای (مانند چند قلوزایی و زنده‌مانی) را در نظر می‌گیرند. رفتار آماری اساس ژنتیکی صفات گسسته (آستانه‌ای) چندان واضح نیست زیرا ژن‌های متعدد، اثرات متقابل ژن‌ها و اثرات متقابل ژن و محیط در بروز این صفات دخیل‌اند (گُنزالِز رِسیو و فورنی،‌2001).
2-1- اهداف پژوهش
در بسیاری از تحقیقات صورت گرفته مرتبط با ارزیابی‌های ژنومی در حیوانات اهلی، صفات پیوسته مطالعه شده است. بنابراین، پژوهش حاضر با هدف بررسی صحت برآورد ارزش‌های اصلاحی ژنومی صفات آستانه‌ای در معماری‌های مختلف آللی (توزیع‌های آماری مختلف اثرات ژنی و تعداد متفاوت QTL)، وراثت‌پذیری‌های مختلف و اندازه‌های متفاوت جمعیت مرجع با استفاده از روش‌های بیزی انجام گرفت. همچنین مقایسه صحت ارزش‌های اصلاحی ژنومی برآورد شده در حالت ژنوتیپ واقعی و استنباط شده با استفاده از دو روش جنگل تصادفی و روش انتساب تصادفی نیز از اهداف مطالعه حاضر بوده است.
فصل دوم
بررسی منابع
2-1- اهداف اصلاح نژاد
مهم‌ترین هدف در اصلاح دام، شناسایی افرادی است که دارای بالاترین ارزش اصلاحی برای صفات موردنظر اصلاحگر بوده و شرکت دادن این افراد در چرخه تولید مثلی به‌عنوان والدین نسل بعد می‌باشد. عملکرد فرد، معمولاً شامل ترکیبی از چندین مشخصه یا صفت می‌باشد که عمده آن‌ها طبیعت و ماهیت کمّی دارند. صفات کمّی معمولاً به وسیله چند و یا حتی تعداد زیادی ژن (شاید بیشتر از هزار) همراه با اثرات محیطی کنترل می‌شوند (فالکونر و مَک‌کی، 1996). صفاتی مانند نرخ رشد، تولید شیر، تولید چربی و پروتئین از این قبیل‌اند. مهم‌ترین معیار که برای تعیین شایستگی افراد کاندیدا به‌کار می‌رود برآوردهای ارزش اصلاحی افراد برای صفات مورد علاقه (موردنظر) می‌باشد. ارزش اصلاحی یک فرد به‌صورت مجموع ارزش‌های ژنتیکی افزایشی برای تمام جایگاه‌هایی که در کنترل صفت سهیم‌اند (جایگاه‌های کنترل کننده صفات کمی، Quantitative Trait Loci) تعریف می‌شود.
تا کنون، اطلاعات فنوتیپی زیادی برای صفات اقتصادی در دامپروری، جمع‌آوری شده و به‌عنوان منبع اصلی اطلاعات جهت برآورد ارزش اصلاحی کاندیداهای انتخاب مورد استفاده قرار گرفته است. برای رسیدن به این هدف، روش‌های آماری پیچیده‌ای بر اساس متدولوژی مدل‌های خطی مختلط با خاصیت بهترین پیش‌بینی نااریب خطی (BLUP) به‌کارگرفته شده است (هندرسون، 1987؛ لینچ و والش، 1998). این روش‌ها بر استفاده از اطلاعات فنوتیپی خود فرد و خویشاوندانش به‌منظور بیشینه کردن صحت برآورد ارزش‌های اصلاحی تاکید داشته‌اند. اگر صحت را به‌عنوان همبستگی بین ارزش اصلاحی واقعی و برآورد شده تعریف کنیم می‌توان آن را به‌عنوان مهم‌ترین شاخصه نرخ پیشرفت ژنتیکی که می‌تواند در یک برنامه اصلاحی در واحد زمان حاصل شود پذیرفت. عواملی چون شدت انتخاب، صحت انتخاب و فاصله نسل در پیشرفت ژنتیکی موثرند. نرخ پیشرفت ژنتیکی مورد انتظار در واحد زمان، با شدت و صحت انتخاب ارتباط مستقیم دارد اما با فاصله نسل نسبتی معکوس دارد (فالکونر و مَک‌کی، 1996).
2-2- روش‌های ارزیابی کلاسیک
در اواخر نیمه اول قرن بیستم، روش شاخص انتخاب توسط هیزل و لاش (1943) معرفی شد. این روش همبستگی بین مقادیر فنوتيپي، رابطه ژنتيکي بين افراد داراي رکورد و حيوانات مورد ارزيابي را در نظر مي‌گرفت. با استفاده از اين روش امکان ترکيب اطلاعات زيادي در يک هدف اصلاحي فراهم گردید. در شاخص‌ها، مهم‌ترين خصوصيت و ويژگي کاهش خطاي پيش‌بيني، حداکثر کردن همبستگي بين ارزش ژنتيکي برآورد شده و حقيقي بود. بنابراين، استفاده از اطلاعات ديگر حيوانات منجر به افزايش درصحت ارزیابی‌ها شد (سيلوا و همکاران، 2014).
با توسعه روش‌هاي مدل مختلط توسط هندرسون (1949) ارزيابي ژنتيکي با استفاده از برآوردهاي دقيق‌تر ارزش‌هاي اصلاحي شروع شد. ابتدا، از طريق مدل پدري که ارتباطات والد-فرزندی را در نظر مي‌گيرد و سپس از طريق مدل حيوان که تمام روابط شناخته شده در بين حيوانات در شجره را در نظر مي‌گرفت ارزيابي‌ها انجام شد. با استفاده از اين روش، برآورد همزمان اثرات ثابت (BLUE) و اثرات تصادفي (BLUP) ممکن شد. درنتیجه، ارزش‌های اصلاحی با خاصیت BLUP براي تمام حيوانات موجود در شجره به‌دست آمد. اين روش اگر چه، خصوصيات آماري مشابهي با روش شاخص انتخاب دارد اما به‌طور مستقيم برآوردهاي ارزش‌هاي اصلاحي را ارايه می‌دهد. اما در روش شاخص انتخاب ضرايب شاخص و ارزش‌هاي اصلاحي در مراحل جداگانه‌اي حاصل مي‌شوند. ارزش‌هاي اصلاحي برآورد شده با استفاده از معادلات مدل‌های مختلط به‌طور گسترده‌اي به‌عنوان ابزار انتخاب مورد استفاده قرار گرفتند (سيلوا و همکاران، 2014).
اگرچه برنامه‌هاي انتخاب بر اساس ارزش‌هاي اصلاحي برآورد شده از فنوتيپ تاکنون خيلي موفقيت آميز بوده‌اند اما این روش نیز دارای محدو دیت‌هایی است (دِکرز، 2012):
1) به‌منظور برآورد ارزش‌های اصلاحی قابل اعتماد برای کاندیداهای انتخاب، داشتن اطلاعات فنوتیپی از حیوان و یا از خویشاوندان نزدیک ضروری است. درنتیجه، علاوه بر هزينه‌هاي رکوردگيري، برخي صفات مورد علاقه اصلاحگران فقط در اواخر دوره زندگي (مانند ماندگاري) و يا فقط در يک جنس (مانند توليد شير در گاو شيري) بروز می‌یابند، و نیز صفاتی که نياز به کشتار حيوان دارند (صفات کيفيت گوشت) ارزیابی را با محدودیت مواجه مي‌کند.
2) تئوري این مدل بر اساس مدل ژنتيکي بي‌نهايت ژن موثر بر صفات کمي ارايه شده است (فالکونر و مَک‌کي، 1996). در این مدل فرض شده است که صفت به وسيله تعداد بي‌نهايت ژن غير همبسته با اثرات افزايشي و خيلي کوچک کنترل مي‌شوند. در حالیکه تعداد ژن‌ها نمی‌تواند بی‌نهایت باشد. همچنین نوترکیبی حاصل از لینکاژ نیز که خود عامل مهمی در تنوع است را در نظر نمی‌‌گیرد. هرچند ممکن است تعداد زیادی ژن با اثر کوچک بر صفت موثر باشند اما در بسیاری از صفات قسمت عمده‌ای از تنوع توسط تعداد محدودی ژن بزرگ اثر کنترل می‌شود (عبدالهی و همکاران، 1391؛ کالوس، 2010؛ دِکرز، 2012).
3- با توجه به اینکه در BLUP از ماتریس روابط خویشاوندی استفاده می‌شود و در تشکیل این ماتریس، واریانس برآوردها در نظر گرفته نشده و از میانگین رابطه خویشاوندی استفاده می‌شود، عملاً ضرایب بین افراد حاصل از یک تلاقی یکسان برآورد می‌شود. درنتیجه به دلیل در نظر نگرفتن اثر نمونه‌گیری مندلی (ترکیب تصادفی کروموزوم‌ها در مرحله گامتوژنز) احتمال انتخاب حیوانات خویشاوند و افزایش هم‌خونی بالا می‌رود. همچنین صحت اين برآوردها تا حدود زیادی تابع صحت و کيفيت شجره ميباشند (کالوس، 2010).
2-3- استفاده از منابع اطلاعاتی نشانگری
استفاده از منابع اطلاعاتی دیگر به‌منظور رفع محدوديت‌های ارزیابی کلاسیک و به‌دست آوردن ارزش‌هاي ژنتیکی زود هنگام از کانديداهاي انتخاب داراي تاريخي کهن است. نخستین تلاش‌ها، روي صفات انديکاتور (شاخص)، مقادير فيزيولوژيکي و مارکرهاي خوني صورت گرفت. يکي از موارد موفقيت آميز اوليه، استفاده از گروه‌هاي خوني به‌عنوان نشانگرهاي مولکولی براي افزایش مقاومت ژنتيکي در طيور بوده است (هانسِن و همکاران، 1967). مقدار سرم IGF-1 اندازه‌گيري شده در سنين اوليه در گاو و خوک به‌عنوان شاخص کارايي رشد نیز مثالی از مقادير فيزيولوژيک مي‌باشد (بانتِر و همکاران، 2005). به‌طور کلي، استفاده از صفات شاخص به‌وي‍ژه صفات شاخص فيزيولوژيک قابل اندازه‌گيري در خون محدود بود.
در دهه 90 میلادی استفاده از ماتریس روابط آللی (به‌جای ماتریس روابط خویشاوندی) در معادلات مدل‌های مختلط توسط نجاتي-جوارمي و همکاران (1997) مطرح شد. نتایج مطالعه آن‌ها که برای اولین بار اطلاعات ژنومی را در ارزیابی‌های حیوانات اهلی دخیل می‌داد نشان داد که ارزش‌های اصلاحی برآورد شده به مقدار حقیقی خود نزدیک‌تر شده و پاسخ به انتخاب بیشتر خواهد شد. همچنین نرخ پیشرفت ژنتیکی برای صفاتی که دارای وراثتپذیری پایین بودند، یا اینکه تحت تاثیر تعداد اندکی QTL و یا تعداد کمتر آلل در هر جایگاه بودند بیشتر بود. پر واضح است دلیل بهبود نرخ پیشرفت ژنتیکی در این روش ارزیابی، نسبت به روش استفاده از اطلاعات شجره، نشان دادن دقیق‌تر رابطه بین افراد جمعیت بود. زیرا به‌جای استفاده از متوسط رابطه خویشاوندی، حالت همسانی در موقعیت (Identical By State) و تنوع ژنی موجود را نیز در نظر داشت. هرچند که در این مطالعه اثرات QTL به‌طور مستقیم و همزمان با اثرات پلی‌ژنیک در مدل وارد نشده بود؛ اما این محققین بیان کردند درصورتی‌که بتوان اثرات QTL را در مدل وارد نمود، پیشرفت ژنتیکی تسریع خواهد شد.
در تایید سودمندی استفاده از اطلاعات ژنومی ويلانِوا و همکاران (2005) گزارش کردند حتی درصورتی‌که مدل ژنتیکی صفت موردنظر مدل بی‌نهایت ژن باشد و هیچ ژنی دارای اثر بزرگ نباشد، استفاده از ماتریس روابط خویشاوندی آللی و یا استفاده از اطلاعات نشانگری در برنامه‌های انتخاب مفید و منجر به پاسخ به انتخاب مطلوب‌تر خواهد بود.
2-4- انتخاب به کمک نشانگر
برخی خصوصیات یا صفات که تفرق همزمان با صفت داشته باشند را می‌توان به‌عنوان نشانه‌ای برای ژنوتیپ خاصی از صفت دانست. انتخاب غیرمستقیم برای صفت بر اساس آن نشانه را انتخاب به کمک نشانگر می‌گویند. نشانگرها می‌توانند مبتنی بر خواص ظاهری، پروتئین و یا DNA باشند. نشانگرهای DNA به بخشی از ژنوم اطلاق می‌گردد که با تنوع صفت خاصی مرتبط باشد (مونتالدو و مِزا-هِرِرا، 1998).
انتخاب بر اساس نشانگرها در خصوص صفاتی که از ارزیابی‌های کلاسیک چندان بهره نمی‌برند مفید خواهد بود. به‌طوری‌که، همزمان از اطلاعات فنوتيپي و نشانگرهای مولکولی در سطح ژنوم (در حالت عدم تعادل لينکاژي با QTL) استفاده مي‌کند (دِکرز، 2004). از این روش در انتخاب گاوهاي نر جوان براي ورود به مرحله آزمون نتاج در صنعت گاوشيري استفاده شده است (گئورجِس و همکاران، 1995؛ ماکينون و گئورجِس، 1998).
استفاده از اطلاعات مولکولي به‌منظور بهبود ژنتيکي در گاوهاي شيري براي اولين بار در اواخر دهه 1960 توسط (اسميت، 1967) به‌خصوص براي صفاتي که بهبودشان با استفاده از برنامه‌هاي اصلاح نژاد سنتي مشکل بود پيشنهاد شد. اما در عمل، ظهور دوران استفاده از ژنتيک مولکولي به اوايل دهه 70 برمي‌‌گردد که فرصت جديدی را در برنامه‌هاي اصلاح نژادي ایجاد کرد که بتوان از نشانگرهاي DNA براي شناسايي ژن يا مناطق ژنومي کنترل کننده صفات موردنظر استفاده کرد. اولين کاربرد مشهور اين روش، کشف اساس ژنتيکي و توسعه آزمون‌های نقايص ژنتيکي (تک جایگاهی) بود. در خصوص صفات کمّي نیز، اين پيشرفت‌ها منجر به شناسايي QTL و توسعه تست‌هاي DNA شد. اين تست‌ها به‌منظور کمک به تصميم انتخاب یا حذف افراد کاندیدا در مراحل اوليه زندگي، در تکنیک انتخاب به کمک نشانگر به‌کار گرفته شدند. به‌طوري که با ترکيب اطلاعات حاصل از نشانگرهاي ژنتيکي مرتبط با QTL و اطلاعات فنوتیپي، انتخاب انجام می‌شد (لَند و تامپسون، 1990؛ اسميت و سيمپسون، 1986). با استفاده از این روش، نتايج بسيار مفيدي در خصوص شناسايي تعداد قابل توجهي QTL، ارتباطات نشانگر- فنوتيپ و برخي جهش‌هاي علّي حاصل شد (دِکرز، 2004). اما کاربرد اين روش نيز در برنامه‌های اصلاح نژاد، به دلايلي با محدوديت همراه بود (دِکرز، 2004): 1) بيشتر مطالعات QTL در آميخته‌هاي تجاري انجام شده است در صورتي که مي‌بايست در جمعيت‌هایي از حيوانات اهلي انجام مي‌شد که براي بهبود و پيشرفت ژنتيکي استفاده مي‌شدند. 2) فقط بخش محدودي از تنوع ژنتيکي صفت به‌وسیله جایگاه‌ها و اثرات شناسايي شده توجیه مي‌شد، درحالی‌که بيشتر صفات اقتصادي به وسيله تعداد زيادي ژن کنترل مي‌شوند. 3) هزينه تعيين ژنوتيپ به روش معمولي (سنتي) برای کانديداهاي انتخاب حتي براي تعداد کمي نشانگر ژنتيکي نیز بسیار بالا بود.
2-5- چند شکلي‌هاي تک نوکلئوتيدي
تنوع و تفاوت‌هايي که به واسطه اختلاف در يک جايگاه تک نوکلئوتيدي (Single Nucleotide Polymorphisms) (به علت جايگزيني، حذف يا اضافه) در بين افراد همان گونه رخ مي‌دهند، به‌عنوان چندشکلي تک نوکلئوتيدي (SNP) شناخته مي‌شوند. جايگزيني نوکلئوتيدها عامل مهمي در ايجاد SNP در ژنوم محسوب مي‌شوند. ازلحاظ نوع جايگزيني بازها، جهش‌ها مي‌توانند ترانزيشن (Transition) يا ترانزورژن (Transversion) باشند. در جهش ترانزيشن جايگزيني بازهاي پورين يا پيريميدين پیریمیدین با يکديگر صورت مي‌گيرد. از اين رو در اين نوع جهش‌ها فقط دو شکل آللي در جايگاه مربوطه قابل مشاهده مي‌باشد. ولي در جهش‌هاي ترانزورژن جايگزيني کليه بازهاي پورين و پيريميدين با يکديگر صورت مي‌گيرد. از اينرو در اين نوع از جهش‌ها هر چهار شکل آللي در جايگاه مربوطه مي‌تواند مشاهده گردد (A↔C، A↔T، G↔C و G↔T). ازلحاظ تئوري، تبديل يک باز نوکلئوتيدي به هرکدام از بازهاي 4 گانه امکان‌پذير است. اما به علت شکل هندسي بازها، SNP هاي سه و به‌ويژه چهار آللي بسيار نادر بوده و بيشتر SNP ها دو آللي‌اند (سوبِدي، 2012). اين نشانگرها نسبت به نشانگرهاي ريزماهواره، داراي تنوع آللي کمتري هستند اما به دليل اينکه در کل ژنوم به ميزان بالا يافت مي‌شوند نشانگرهاي بسيار مناسبي براي رديابي QTL و مطالعات ارتباطي کل ژنوم می‌باشند. همين علت هم منجر به توسعه روش‌ها و تکنيک‌هاي شناسايي و کاربرد اين نشانگرها در سال‌هاي اخير شده است.
2-6- ميکرو تراشه‌های DNA
چندشکلي‌هاي تک نوکلئوتيدي را مي‌توان با استفاده از روش‌هاي متعددي تشخيص داد. اما يک فن‌آوري نسبتاً جديد در اين رابطه، استفاده از تراشه‌هاي DNA (DNA Chips) مي‌باشد. در اين فن آوري همزمان چند شکلي چندین هزار مارکر مورد بررسي قرار مي‌گيرد (ويگنال و همکاران، 2012). در حال حاضر براي بيشتر گونه‌هاي حيوانات اهلي، تراشه‌های تجاري وجود دارد که با استفاده از آن‌ها می‌توان ده‌ها هزار SNP را در طول ژنوم يک حيوان با هزينه منطقي و قابل قبول (کمتر از 150 دلار به ازاي هر نمونه) در زمان بسیار اندک تعیین ژنوتیپ کرد. اولين مورد از این تراشه‌ها در حيوانات اهلي، پانل 50 هزار جفت نوکلئوتيدي (که به اختصار گفته مي‌شود SNP 50K) گاوي بود که توسط شرکت ايلومينا طراحي شد (ماتوکومالي و همکاران، 2009). تا به امروز ده‌ها هزار گاو گوشتي و شيري، با استفاده از اين تکنولوژی تعيين ژنوتيپ شده‌‌اند. تراشه‌های 40 تا 60 هزار SNP مشابهي نیز برای ديگر گونه‌های حيوانات اهلي شامل طيور، گوسفند، خوک و اسب در دسترس است. SNP chip يا DNA chip مخصوص گوسفند در سال 2009 با عنوان Illumina Ovine SNP50 BeadChip طراحي شد که 54241 جهش تک نوکلئوتيدي با فاصله يکسان در سطح ژنوم گوسفند را پوشش مي‌دهد. اين طراحي با همکاري تعداد زيادي محقق در سراسر جهان و صرف هزينه بسيار بالا در قالب پروژه Sheep HapMap صورت گرفت (کيجاس و همکاران، 2009). مهم‌ترين استفاده از اين تراشه‌هاي DNA با تراکم بالاي SNP، در انتخاب ژنومي يا انتخاب بر مبناي کل ژنوم بوده است (مِوويسِن و همکاران، 2001؛ وَن‌رادِن و همکاران، 2009). استفاده از این تراشه‌ها، منجر به تولید تعداد بسيار زيادي داده SNP با تراکم بالا می‌شود که مي‌توانند در مطالعات ارتباطي کل ژنوم به‌منظور شناسايي نشانگرهاي ژنومي يا مناطق ژنومي مرتبط با صفت بر اساس عدم تعادل لينکاژي (LD) و انتخاب ژنومي استفاده شوند (هِيز و همکاران، 2009).
2-7- انتخاب ژنومی
انتخاب ژنومي به‌معني استفاده از اطلاعات ژنومي به‌منظور ارزيابي و انتخاب افراد کانديدا مي‌باشد. ويژگي کليدي اين روش اين است که کل ژنوم به‌وسیله نشانگرهاي متراکم پوشش داده می‌شود. به‌طوري که تمام واريانس ژنتيکي به‌وسيله اين نشانگرها توجيه شود و فرض مي‌شود که نشانگر با QTL در حالت LD باشند (گُدارد و هِيز، 2007).
اولين بار معرفي و ارايه انتخاب ژنومي به وسيله نجاتي-جوارمي و همکاران (1997) صورت گرفت و سپس به وسيله مِوويسِن و همکاران (2001) توسعه داده شد. اما کاربردي شدن آن از زمان توصيف مفاهيم و ارايه مدل‌هاي انتخاب ژنومي تا در دسترس قرار گرفتن پانل‌هاي چندهزار نشانگري گاو به تاخیر افتاد (وَن‌تِسِل و همکاران، 2008). به‌طور کلي، SNP ها فراوان‌ترين نوع چند شکلي‌هاي DNA در ژنوم هستند و هم‌اکنون اين نشانگرها بر ساير انواع نشانگرهاي مولکولي در تحقيقات ژنومي اولويت دارند. زيرا اين نشانگرها داراي نرخ جهش پایین‌تري هستند و به آساني تعيين ژنوتيپ مي‌شوند (رُموالدي و همکاران، 2012). ايده اصلي در انتخاب ژنومي، استفاده از مارکرهاي خاصي براي ردیابی QTL نيست بلکه از تعداد بسيار زيادي نشانگر که در کل ژنوم پراکنده‌اند استفاده مي‌شود. زماني که چندين هزار نشانگر در طول ژنوم تعيين ژنوتيپ مي‌شوند فرض مي‌شود که نشانگرها در کنار جهش‌هاي علّي قرار گرفته‌اند. به‌عبارتی دیگر SNP ها با QTL در حالت عدم تعادل لينکاژي هستند (دِروس و همکاران، 2008). سهم هر نشانگر در شايستگي ژنتيکي افزايشي يک حيوان نمايان مي‌شود و برخلاف فرضيات در مدل بي‌نهايت، در اينجا تفاوت بين اثرات مارکر نيز به دست مي‌آيد. هرچند در اين خصوص کل و همکاران (2009) گزارش کردند که در گاو شيري براي بيشتر صفات توليدي، مدل بي‌نهايت مي‌تواند مدل مناسبي باشد و تنها تعداد اندکی QTL در ژنوم گاو وجود دارد.
دو پيشرفت تکنولوژيکي اصلی که در محبوبيت، کاربرد و موفقيت انتخاب ژنومي دخيل بودند عبارت‌اند از: 1) کامل شدن پروژه تعيين توالي ژنوم گاو و انتشار آن، منجر به شناسايي چندين هزار نشانگر SNP و درنتیجه تسريع پيشرفت‌هاي تحقيقاتي مرتبط شد (ِالسيک و همکاران، 2009). 2) در دسترس قرار گرفتن تراشه‌هاي DNA به‌صورت تجاری و با هزینه مناسب. اين تراشه‌ها مشتمل بر هزاران نشانگر در طول ژنوم بوده و مجال برآورد ارزش‌هاي اصلاحي با صحت بالا را فراهم کرد (مِوويسِن و همکاران، 2001).
انتخاب ژنومي شامل 3 مرحله است:
1- استفاده از تراشه‌های DNA به‌منظور تعیین ژنوتيپ هر حيوان در هر نشانگر.
2- برآورد اثر هر جایگاه نشانگری بر روي صفت.
3- برآورد ارزش‌هاي اصلاحي ژنومي افراد کاندیدا و تصمیم انتخاب.
مرحله کليدي در پيش‌بيني‌هاي ژنومي، برآورد اثر آلل‌هاي SNP بر صفات مورد مطالعه مي‌باشد. برآورد اثرات در تعدادي از حيوانات که جمعيت مرجع (يا داده‌هاي آموزشي) ناميده مي‌شود انجام مي‌گيرد (مِوويسِن و همکاران، 2001). اين جمعيت به‌طورمعمول از 1000 حيوان تشکيل شده است و دارای اطلاعات ژنوتيپي فنوتيپ هستند. از طريق مطالعات ارتباطی نشانگر-فنوتيپ، اثر هر SNP برآورد خواهد شد. مرحله آخر در انتخاب ژنومي، برآورد ارزش‌های اصلاحی حيوانات جوان (کانديداهاي انتخاب) مي‌باشد که اين حيوانات ارزش‌هاي اصلاحي ژنومي‌شان با استفاده از مجموع اثرات SNP حاصل مي‌شود. فرایند انتخاب ژنومی به‌صورت شماتیک در شکل 2-1 نشان داده شده است.
سوال مهم اين است چه حيواناتي باید در جمعيت مرجع باشند؟ براي مثال، در گاو شيري ساده‌ترين و سر راست‌ترين روش استفاده از گاوهاي نر دارای ارزش اصلاحی مي‌باشد (وَن‌رادِن و همکاران، 2009). زيرا اين حيوانات داراي ارزش‌هاي اصلاحي قابل اعتمادي هستند. زمانی که به‌دست آوردن فنوتيپ‌هاي واقعي وقت‌گير و پرهزينه باشد، استفاده از ارزش‌های اصلاحی قابل اعتماد می‌تواند جایگزین مناسبی باشد. از آنجايي که حيوانات جمعيت مرجع هم بايد داراي فنوتيپ و هم ژنوتيپ باشند، تعداد افراد جمعيت مرجع باید ازلحاظ هزينه‌های تعیین ژنوتیپ و رکوردگیری بهينه شود. اگر چه تحقيقات زيادي در خصوص بهينه‌سازي جمعيت مرجع صورت نگرفته است اما از نظر تئوري، جمعيت مرجع بايد متشکل از کل دامنه ژنوتيپي و فنوتيپي نژاد یا توده باشد که منجر به برآورد دقيق و قابل اعتمادي شود. بنابراين جمعيت مرجع بايد تا حد امکان معرف مناسبي از کل جمعيت باشد.
استراتژي ديگر استفاده از حيواناتي در جمعيت مرجع است که خويشاوندي نزديکي با افراد کانديدا داشته باشند که این امر منجر به افزايش صحت ارزش‌هاي اصلاحي خواهد شد (هابيَر و همکاران، 2007). اين حالت نشان مي‌دهد که در خصوص جمعيت مرجع ويژه لاين، براي دستيابي به برآورد دقيق ارزش‌هاي اصلاحي براي هر لاين، جمعيت مرجع باید داراي تعدادي فرد از هر لاين باشد. به‌عبارتی‌دیگر، جمعیت مرجع باید از همه لاین‌ها تشکیل شده باشد. دليل احتمالي آن اين است که ترکيب افراد از خانواده‌ها و لاين‌هاي مختلف باعث مي‌شود که تمام LD هايي که در اين خانواده‌ها يا لاين‌ها پايدار هستند در معادلات پيش‌بيني استفاده شوند. البته تنها درصورتي اين امکان وجود دارد که تراکم نشانگري به‌اندازه کافي بالا باشد به‌طوري که هر QTL حداقل با يکي از نشانگرها در سطح بالایی از عدم تعادل لینکاژی در خانواده‌ها و نژادها باشد. دِروس و همکاران (2008b) نشان داد که به‌منظور پيش‌بيني دقيق ارزش‌هاي اصلاحي ژنومي براي نژاد جرسي با استفاده از معادلات پيش‌بيني بر اساس يک جمعيت مرجع گاوهاي هلشتاين، حداقل 300000 SNP مورد نياز است در حالي که تراشه‌هاي موجود (50K) براي ارزيابي‌هاي داخل نژادي (يا به عبارتي براي همان نژاد) کارآمد هستند.
همچنین می‌توان از حیوانات تجاری برای تشکیل جمعیت مرجع استفاده کرد. مزیت این حالت این است که می‌توان اطلاعات فنوتیپی صفاتی را که معمولاً در حیوانات اصلاحی رکورد برداری نمی‌شوند، به‌راحتی جمع‌آوری کرد. از این قبیل صفات می‌توان به صفات کیفیت لاشه، مصرف خوراک، پاسخ به چالش‌های بیماری و عملکرد تحت شرایط مدیریت و پرورش تجاری اشاره کرد. برای مثال در کشورهای در حال توسعه، جمعیت مرجع می‌تواند بیشتر تحت شرایط روستایی (نسبت به شرایط غیر معمول و غیر متعارف گله‌های اصلاحی) مدیریت شوند (گُدارد و هِيز، 2007).
2-8- مزایای انتخاب ژنومی
انتخاب ژنومي فاقد محدودیت‌هایی است که در کاربرد روش‌های BLUP و انتخاب به کمک نشانگر وجود داشت. در همين زمان اندک (از زمان ارايه تراشه‌هاي DNA تاکنون) انتخاب ژنومي توانسته است نرخ پيشرفت ژنتيکي در حيوانات اهلي را افزايش دهد (وِيگِل و همکاران، 2010). افزايش در صحت پيش‌بيني‌هاي ژنومي، به‌ويژه در رابطه با گاوهاي نر جوان در مرحله قبل از ورود به آزمون نتاج به خوبي مشاهده شده است (شِفِر، 2006). به علاوه، می‌تواند اطلاعات قابل اعتمادتري نيز از حيوانات ماده به‌دست آورد که مي‌تواند منجر به پيشرفت ژنتيکي بيشتري از طريق مسير انتخاب گاوهای ماده شود. مطالعات مختلفي استفاده از تراشه‌هاي DNA در جلوگيري از کاهش پيشرفت ژنتيکي و افزايش پنهاني همخوني ناشي از اشتباه در شجره را، سودمند ارزيابي کردند. نتايج اوليه انتخاب ژنومي در گاوهاي شيري در استراليا نشان داد که ارزش‌هاي اصلاحي ژنومي برآورد شده به‌طور قابل توجهي بيشتر از ارزش‌هاي اصلاحي برآورد شده به روش سنتي مي‌باشند حتي اگر تعداد افراد در جمعيت مرجع کم (در حدود 600 راس) باشد (هِيز و همکاران، 2009).
يکي ديگر از مزيت‌هاي انتخاب ژنومي نسبت به مدل‌هاي تک SNP اين است که تمام SNP ها به‌طور همزمان برازش مي‌شوند. اين ويژگي اجازه مي‌دهد که اگر زماني که چندين SNP با يک QTL در حالت عدم تعادل لينکاژي باشند از تمام اطلاعات استفاده شود. همچنين براي هر نوع ساختار جمعيتي قابل استفاده بوده و از طرف ديگر منجر به کاهش نتايج مثبت دروغين خواهد شد (دِکرز، 2012).
2-9- روش‌هاي آماري پيش‌بيني ژنومي
به‌منظور استفاده از اطلاعات ژنومی در اصلاح دام، لازم است که اثر هر جایگاه برآورد، و در نهایت جایگاه‌های دارای جهش علّی (و یا مرتبط با جهش علّی) تشخیص داده شود. با استفاده از پانل‌های خیلی متراکم SNP تعداد نشانگرها از تعداد رکوردها خیلی بیشتر خواهند بود. برازش مدل‌های رگرسیونی p زیاد (تعداد مجهولات: اثرات نشانگری) و n کم (تعداد معلومات: مشاهدات فنوتیپی) به روش‌های انتخاب متغیر و یا افت برآوردها نیاز دارد. رگرسیون ارزش‌های ژنوتیپی از مشاهدات فنوتیپی به‌صورت تقریبی از ارزش‌های ژنتیکی حقیقی است که می‌تواند تابع پیچیده‌ای از ژنوتیپ حیوان در تعداد بسیار زیادی ژن و نیز اثر متقابل پنهانی ژن‌ها با هم و نیز ژن‌ها با محیط باشد. بنابراین، مقادیر باقیمانده مدل‌های رگرسیونی کل ژنوم، یک متغیر تصادفی است که اثرات غیر ژنتیکی، به اضافه خطاهای تقریبی است که می‌تواند ناشی از LD ناقص بین نشانگرها و QTL و یا به علت نقص مدل (در نظر نگرفتن اثرات متقابل) باشد.
با در نظر گرفتن ژنوتيپ در جايگاه‌هاي مورد مطالعه به‌عنوان اثر مستقل در يک مدل رگرسيون خطي مي‌توان نوشت:
که در اين مدل، y متغير وابسته يا فنوتيپ i اُمین فرد، µ عرض از مبداء مدل يا اثر مشترک تمام افراد، xij متغیرهای مستقل (ژنوتيپ نشانگرها) بوده، βj نيز اثر jاُمین کوواريت و ei اثرات تصادفي باقيمانده مي‌باشد. فرم ماتريسي مدل فوق بدين‌صورت مي‌باشد:
که y بردار فنوتيپ‌ها، ماتريس ضرايب براي بردار ضرايب رگرسيوني و بردار ضرايب رگرسيوني و بردار اثرات باقيمانده مي‌باشد.
برآوردهاي حداقل مربعات ضرايب بدين‌صورت مي‌باشد:
که مجموع مربعات باقيمانده مي‌باشد.
ميانگين حداقل مربعات يک برآورد گر بدين‌صورت بيان مي‌شود: که در اين حالت مقدار واقعي پارامتر و مقدار برآورد شده مي‌باشد MSE را مي‌توان به دو مؤلفه تجزيه کرد:
که و به‌ترتیب مربع اريبي و واريانس برآوردگرها مي‌باشند.
مقادير مورد انتظار برآوردهاي حداقل مربعات ضرايب رگرسيون برابر است با:
در صورتي که و باشد در نتيجه برآوردهاي حداقل مربعات، برآوردهاي نااريبي از ضرايب رگرسيوني را مي‌دهد.
بخش دوم فرمول MSE، که واريانس برآوردگرها مي‌باشد بيانگر تفاوت و تنوع برآوردگرها در نمونه‌گيري‌هاي متعدد مي‌باشد. ماتريس واريانس-کواريانس برآوردهاي حداقل مربعات ضرايب رگرسيون به اين صورت مي‌باشد:
که واريانس باقيمانده مدل مي‌باشد. بنابراين MSE مربوط به j اُمین ضريب تابعيت برابر است با . که در ماتريس مذکور j اُمین عنصر قطري معکوس ماتريس ضرايب مي‌باشد. اين ماتريس به‌عنوان ماتريس C و به اين صورت تعريف مي‌شود:.
واريانس برآوردهاي حداقل مربعات تحت تاثير 4 عامل قرار می‌گیرد: 1) اندازه نمونه (n). 2) تعداد پيش‌بيني کننده‌ها (برآوردگرها). 3) درجه وابستگي بين پيش‌بيني کننده‌ها 4) واريانس باقيمانده.
زمانی که تعداد برآوردگرها از تعداد مشاهدات (متغیر وابسته) بیشتر باشد برآوردهای حداقل مربعات بی‌نظیر (unique) نخواهند بود. این حالت در رابطه با ارزیابی‌های مبتنی بر ژنوم به‌خوبی صدق می‌کند به‌طوری‌که تعداد پارامترهای برآورد شده (نشانگرهای متراکم در یک تراشه، p) در مقایسه با تعداد مشاهدات (n) خیلی بیشتر است. برای مثال در یک تراشه 60K SNP و تعداد 2000 رکورد فنوتیپی در جمعیت مرجع، تعداد اثرات نشانگری که باید برآورد شوند 30 برابر تعداد مشاهدات خواهد بود. ازاین‌رو، در حل معادلات چند مجهولی به‌علت زیاد بودن تعداد مجهولات و کمتر بودن تعداد معادلات، مشکل معکوس کردن ماتریس‌های ضرایب در روش‌های آماری مانند روش حداقل مربعات معمولی پیش می‌آید. به‌طوری‌که معکوس مستقیم این ماتریس‌ها امکان پذیر نیست. لذا به‌منظور فايق آمدن بر این مشکل دو راهکار پیشنهاد شده است:
2-9-1- انتخاب متغیر: مشکل انتخاب k برآورگر از p برآوردگر (که k<p) را می‌توان به‌عنوان مشکل مقایسات مدل‌ها تلقی کرد. به‌طوری‌که در حالت ایده‌آل، ما قصد داریم تمام مدل‌های ممکن را برازش نموده و مطابق با معیارهای انتخاب مدل (معنی داری، ضریب تبیین، آزمون نسبت درستنمایی، AIC و غیره) بهترین مدل را انتخاب کنیم. اما زمانی که p بالا می‌رود برازش تمام مدل‌ها امکان‌پذیر نیست. به‌جای آن می‌توان از الگوریتم‌های جستجو استفاده کرد. یک الگوریتم جستجوی خیلی ساده، برازش تک تک برآورگرها در یک مدل و به‌طور جداگانه است (تابعیت تک نشانگری). هرکدام از این مدل‌ها مقدار خاصی از ارتباط بین نشانگر و فنوتیپ‌ها را ارايه می‌دهد (مانند p-value). بنابراین، میتوان مدل نهایی را بر اساس k اُمین برآوردگر اول مطابق با مقدار ارتباط تشکیل داد. این روش امروزه در مطالعات ارتباطی کل ژنوم (GWAS) به‌طور متداول استفاده می‌شود.
2-9-2- افت برآورد: زمانی که تعداد مشاهدات (n) خیلی کم و تعداد برآوردگرها (p) خیلی زیاد باشد برآوردهای حداقل مربعات واریانس بالایی دارند و درنتیجه MSE نیز بالا می‌رود. در این حالت صحت پیش‌بینی مدل کاهش می‌یابد. به‌منظور مقابله با این مشکل، برآوردهای جریمه‌ای ضرایب رگرسیون طراحی شده است. ایده اصلی، کاهش MSE به‌وسیله کاهش واریانس برآوردگرها می‌باشد هرچند که برآوردهای اریبی حاصل شود. یک روش رایج استفاده از برآوردهای جریمه شده، رگرسیون ریج می‌باشد. این برآوردها در یک مدل بهینه حاصل می‌شود که در این صورت، بین نیکویی برازش مدل و پیچیدگی مدل یک تعادل برقرار می‌شود. فرم کلی مدل بهینه به این صورت می‌باشد:
که در این مدل تابع ضرر می‌باشد که عدم برازش مدل بر داده‌ها را اندازه‌گیری می‌کند، میزان پیچیدگی مدل می‌باشد و پارامتر تنظیم کننده می‌باشدکه کنترل کننده تعادل بین برازش و پیچیدگی مدل می‌باشد.
اگر برابر با مجموع مربعات خطا باشد.
و نیز برابر مجموع مربعات ضرایب رگرسیونی باشد. به‌طورمعمول، برخی از ضرایب رگرسیونی جریمه نمی‌شوند و بنابراین:
که S مجموعه ای از ضرایب را بیان می‌کند که باید جریمه شوند.
در حالتی که به سمت صفر میل کند برآوردهای مدل فوق همان برآوردهای حداقل مربعات خواهند بود. مدل فوق را می‌توان در فرم ماتریسی به این صورت نوشت:
که برابر است با مجموع مربعات خطا و برابر است با مجموع مربعات ضرایب رگرسیونی. در اینجا برابر است با: . که ماتریسی قطری است که عناصر آن برای ضرایبی که باید جریمه شوند برابر 1 بوده و سایر عناصر قطری آن برابر با صفر است.
درصورتی‌که هرکدام از این مؤلفه‌ها (لامبدا یا D) برابر صفر باشند برآوردهای حاصل از مدل فوق برابر برآوردهای حداقل مربعات خواهند بود. اضافه کردن ضریب به قطر ماتریس ضرایب باعث افت برآوردها به سوی صفر خواهد بود. این حالت موجب برانگیزش اریبی خواهد شد اما واریانس برآوردها را کاهش می‌دهد. بنابراین در حالتی که P بزرگ و n کوچک باشد، جریمه کردن موجب کاهش MSE (نسبت به برآوردهای حداقل مربعات) و درنتیجه پیش‌بینی‌های بهتر خواهد شد.
2-10- روش‌های بیزی در انتخاب ژنومی
در مدل‌های پارامتری انتخاب ژنومی، فنوتیپ‌ها به‌عنوان متغیر وابسته تابعی از نشانگرها به‌عنوان متغیرهای مستقل هستند. مدل خطی می‌تواند به این صورت باشد. که عرض از مبدأ مدل، ژنوتیپ‌های نشانگر (که معمولاً به‌صورت 0، 1 و 2 کد گذاری می‌شوند)، نیز اثرات نشانگری بوده و باقیمانده مدل می‌باشد. اصول استاندارد برای متغیرهای کمی، در نظر گرفتن فرض نرمال و مستقل بودن باقیمانده مدل می‌باشد که تابع درستنمایی آن به این صورت می‌باشد.
که تراکم چگالی نرمال برای متغیر تصادفی با مرکزیت و واریانس می‌باشد.
در پانل‌های متراکم، تعداد نشانگرها (p) به‌طور فزاینده ای از تعداد مشاهدات (n) بالاتر می‌رود و به همین دلیل روش‌های افت برآورد (جریمه‌ای) به‌طور رایج استفاده می‌شود. در روش محاسباتی بیزی، افت برآوردهای اثرات به‌وسیله انتخاب توزیع پیشین اختصاص داده شده به اثرات نشانگری کنترل می‌شود. توزیع چگالی احتمال پیشین پارامترها (در اینجا اثرات نشانگری) به‌صورت زیر است:
در این رابطه، توزیع پیشین یکنواخت بهاختصاص داده می‌شود. توزیع کای اسکوار معکوس مقیاس‌دار برای واریانس باقیمانده با درجه آزادی df و پارامتر مقیاس S می‌باشد. توزیع پیشین j اُمین نشانگر می‌باشد که برداری از پارامترهاست که نوع توزیع پیشین در نظر گرفته شده را برای تأثیرات نشانگری مشخص می‌کند. توزیع پیشین اختصاص داده شده بهمی‌باشد. همچنین پارامتری است که این نوع توزیع را مشخص می‌کند.
2-11- استنباط ژنوتيپي
استفاده از روش‌های پیش‌بینی مبتنی بر کل ژنوم مستلزم داشتن ژنوتیپ‌های متراکم از حیوانات کاندیدا و نیز حیوانات جمعیت مرجع میباشد که تعداد افراد جمعیت مرجع، ترجیحاً بیشتر از هزار راس باشد. به‌منظور استفاده از اطلاعات ژنومی در تصمیم اصلاحگر برای انتخاب و یا حذف حیوانات کاندیدا، هرساله چندین هزار حیوان باید تعیین ژنوتیپ شوند که درنتیجه، هزینه تعیین ژنوتیپ بالایی به برنامه‌های اصلاح نژادی تحمیل می‌شود. به نظر می‌رسد محدودیت کلیدی انتخاب ژنومی هزینه تعیین ژنوتیپ باشد (هِيز و همکاران، 2012). این هزینه‌ها را می‌توان به‌طور چشمگیری با استفاده از ترکیب کردن پانل‌های متراکم و کم تراکم چند شکلی تک نوکلئوتیدی کاهش داد. به‌طوری‌که بتوان ژنوتیپ حیواناتی که با استفاده از پانل‌های کم تراکم تعیین ژنوتیپ شده‌اند را با استفاده از استنباط ژنوتیپی به پانل‌های متراکم رساند (گُدارد، 2008؛ هابيَر و همکاران، 2009). استنباط ژنوتیپی به‌منظور ترکیب پنلهای مختلف نشانگری و نیز بازیابی ژنوتیپ‌های ازدست‌رفته بسیار مفید خواهد بود. همچنین این امکان را فراهم می‌سازد که بتوان بر اساس یک نمونه معرف حیوانات ژنوتیپ شده در تراکم بالا، ژنوتیپ افراد را از یک آرایه کم تراکم به یک آرایه متراکم رساند (پاوچ و همکاران، 2013). به این صورت تعداد بسیار زیادی حیوان را می‌توان با هزینه نسبتاً پایین تعیین ژنوتیپ کرد که اجازه می‌دهد شدت انتخاب را از طریق افزایش تعداد افراد مورد ارزیابی بالا برد (هوانگ و همکاران، 2012). در برخی از گونه‌های دامی استنباط پانل‌های کم تراکم و رسیدن به پانل 50K مطالعه شده است.
2-11-1- استنباط مبتني بر شجره
ساختار جمعیت در بسیاری از گونههای اهلی عمدتاً به‌صورت خانواده‌های بزرگ تنی و ناتنی است که معمولاً حیواناتی (مخصوصاً نرها) وجود دارد که دارای تعداد بسیار زیاد نتاج میباشند. این شرایط این امکان را فراهم میسازد که بتوان ژنوتیپ حیوانات تعیین ژنوتیپ نشده را از روی اطلاعات ژنومی سایر افراد خانواده آن حیوان، استنباط کرد که این روش، استنباط بر اساس شجره نامیده میشود.
2-11-2- استنباط مبتني بر ساختار جمعيت
در بسیاری از حیوانات اهلی مانند مرغ، گاو، گوسفند و اسب سطح بالایی از عدم تعادل لینکاژی گزارش شده است. وجود LD بالا بین نشانگرها میتواند به‌منظور استنباط ژنوتیپ یک جایگاه تعیین ژنوتیپ نشده بر اساس ژنوتیپ مارکرهای مجاور استفاده شود که این روش، استنباط بر اساس جمعیت خوانده میشود.



قیمت: تومان

دسته بندی : مقاله و پایان نامه

دیدگاهتان را بنویسید