پایان نامه سیستم پیشنهاد دهنده اطلاعات با استفاده از روش ترکیبی مدل غذایابی بهینه و رتبه­بندی سه­گانه روابط معنایی داده­های متصل

 پایان نامه رشته جغرافیا

دانشگاه اصفهان

دانشکده کامپیوتر

گروه کامپیوتر

 

 

 

پایان ­نامه­ی کارشناسی ارشد رشته­ی مهندسی کامپیوتر

گرایش نرم افزار

 

 

 

سیستم پیشنهاد دهنده اطلاعات با استفاده از روش ترکیبی مدل غذایابی بهینه و رتبه­بندی سه­گانه روابط معنایی داده­های متصل

 

اسفندماه 1391

 

برای رعایت حریم خصوصی نام نگارنده و استاد راهنما در سایت درج نمی شود

(در فایل دانلودی نام نویسنده و استاد راهنما موجود است)

است.

چکیده، حجم عظیم داده­های موجود در داده­های پیوندی باعث شده است که کاربر نتواند داده­های مورد نیازش را در زمان مناسب پیدا کند. برای رفع این معضل، سیستم­های بیشماری به منظور گزینش داده­ها طراحی و پیاده­سازی شده است که همچنان نتوانسته­اند دقت و کارایی مناسبی داشته باشند. سازگار کردن الگوریتم­های موجود با ورودی و شرایط داده­های پیوندی می­تواند دقت این سیستم­ها را بالا برد.

در این پایان ­نامه، سیستم­ پیشنهادگری طراحی و پیاده­سازی می­شود که با ورودی­ و مشخصات داده­های پیوندی سازگار باشند. روش پیشنهادی از دو الگوریتم به نام­های نظریه غذایابی بهینه و رتبه­بندی سه­گانه استفاده می­کند و داده­ها را از نظر تناسب با موضوع مورد علاقه کاربر رتبه­بندی می­کند. رتبه­بندی سه­گانه داده­های پیوندی را تحلیل کرده و میزان ارتباط آن داده را نسبت به یک موضوع خاص محاسبه می­کند. سپس، نظریه غذایابی بهینه نتایج حاصل از رتبه­بندی سه­گانه را گزینش کرده و پس از مرتب­سازی به کاربر ارئه می­کند. پیشنهادهای ارائه شده توسط این سیستم هم از ارزش معنایی مناسبی برخوردار است و هم اینکه با ساختار و چگونگی شیوه یافتن و دریافت اطلاعات در انسان هماهنگ است.

روش پیشنهادی با الگوریتم استاندارد رتبه­بندی سه­گانه بر روی پنح مجموعه داده­ دیبی­پدیا مقایسه شده است. ارزیابی­ها نشان می­دهد که دقت روش پیشنهادی از روش استاندارد رتبه­بندی سه­گانه بیشتر بوده است، با این وجود روش استاندارد از کارایی زمان اجرای بهتری برخوردار است.

کلیدواژه­ها: سیستم­های پیشنهادگر، داده­های پیوندی، نظریه غذایابی بهینه، رتبه­بندی سه­گانه

 

فهرست مطالب

عنوان                                                                                                                                  صفحه

فصل یکم: کلیات تحقیق

1-1 مقدمه. 1

1-2 موضوع تحقیق 2

1-3 اهداف تحقیق 4

1-4 اهمیت و ارزش تحقیق بر روی داده‌های پیوندی 5

1-5   ساختار تحقیق 5

فصل دوم: معرفی سیستم‌های پیشنهاد دهنده

2-1 مقدمه. 6

2-2 سیستم‌های پیشنهاد دهنده. 7

2-3 بررسی‌های تاریخی 7

2-4 طبقه بندی 8

2-4-1 روش‌های همبستگی 9

2-4-1-1 الگوریتم‌های مبتنی بر حافظه. 9

2-4-1-2 الگوریتم‌های مبتنی بر مدل 11

2-4-1-3 نقاط ضعف روشهای فیلتر همبستگی 12

2-4-2 روش مبنی بر محتوا 12

2-4-3 روش‌های مبتنی بر دانش 13

2-4-4 روش‌های آماری 14

2-4-5 روش‌های مبتنی بر سودمندی 15

2-4-6 روش‌های ترکیبی 16

2-5 سیستمهای پیشنهاد دهنده مبتنی بر داده‌های پیوندی 17

2-6 جمع بندی 20

فصل سوم: مروری بر داده‌های پیوندی و نظریه غذایابی

3-1 مقدمه. 24

3-2 ایده اصلی RDF 23

3-2-1 منابع 24

3-2-2 ویژگی‌ها 25

3-2-3 گزاره‌ها 25

3-2-4 نمونه یک گزاره. 26

3-3 داده پیوندی 27

3-3-1 پشته تکنولوژی داده پیوندی 28

 

 

 

عنوان                                                                                                                                   صفحه

3-3-3 پروژه داده‌های باز پیوندی 29

3-3-4 انتخاب شناسه های همسان منابع و واژه نامه‌های RDF 30

3-4 نظریه ی چرای بهینه. 31

3-5 مدل محدوده­های وصله­ای 32

3-6 نظریه مقدار مرزی کارنوف. 34

3-7 مدل رژیم غذایی بهینه. 34

3-7-1 شرح مسئله روباه. 35

3-7-2 ساده سازی مسئله روباه. 35

3-7-3 روباه آسان­گیر. 36

3-7-4 روباه سخت­گیر. 37

3-7-5 روباه حسابگر. 37

3-8 مدل ریاضی انتخاب غذای بهینه. 37

3-9 الگوریتم انتخاب رژیم بهینه. 38

3-10 اصول انتخاب رژیم غذایی بهینه. 39

3-11 جمع­بندی 40

فصل چهارم: پیاده سازی مدل ترکیبی رتبه‌بندی سه‌گانه بهینه شده و غذایابی بهینه

4-1 مقدمه. 41

4-2 مدل رتبه‌بندی سه‌گانه. 43

4-2-1 جمع آوری داده ها 44

4-2-2 ساخت تنسور معادل گراف. 45

4-2-3 پیش پردازش 45

4-2-3-1 کاهش حجم داده ها از راه حذف خصوصیات غالب. 46

4-2-3-2 وزن­دهی خصوصیات. 47

4-2-4 تحلیل پارافک 47

4-3 تحلیل روش رتبه‌بندی سه‌گانه. 49

4-3-1 مرحله پیش پردازش 49

4-3-2 عملیات حذف. 49

4-3-3 عملیات وزن دهی 51

4-4 دسته بندی خصوصیات بر اساس دامنه. 52

4-4-1 خصوصیات تعریف شده در استاندارد RDF 52

4-4-2 خصوصیات تعریف شده درسطح منبع داده. 53

4-4-3 خصوصیات تعریفی یک حوزه خاص 54

 

 

عنوان                                                                                                                                   صفحه

4-4-4 مثالی از دسته­بندی خصوصیات. 54

4-4-5 رابطه تکرار خصوصیات با اهمیت آنها در موضوع. 55

4-4-6 خصوصیات ابهام آمیز. 56

4-4-7 خصوصیات زائد. 56

4-4-8  نتیجه بررسی خصوصیات. 57

4-5 اعمال پیش پردازش بر روی اسناد RDF 57

4-5-1 امتیازدهی و حذف خصوصیات. 58

4-5-2 انباره­ی خصوصیات از پیش تعریف شده. 58

4-5-3 امتیازدهی خصوصیات. 59

4-5-4 وب به عنوان  منبع امتیازدهی خصوصیات. 59

4-5-5 امتیازدهی پویا 62

4-5-6 ارسال جستار به گوگل 62

4-5-7 آماده سازی کلیدواژه های جستجو. 62

4-5-8 رفع ابهام از جستار. 63

4-5-9 پردازش صفحات بازگشتی 63

4-5-10 تحلیل آماری صفحات وب و محاسبه امتیاز خصوصیات. 64

4-6 تحلیل پارافک 65

4-7 افزودن خصوصیات جدید به انباره خصوصیات حذفی 67

4-8 کاربرد نظریه غذایابی بهینه در سیستم 68

4-9 تغییرات مورد نیاز روش انتخاب رژیم بهینه. 68

4-9-1 کاهش شباهت و تعداد نمونه ها با پیش پردازش 69

4-9-2 استفاده از نمونه به جای نوع. 70

4-10 تعریف بهره، هزینه و سودمندی 71

4-11 تنظیم الگوریتم و کنترل خروجی­ها 72

4-12 تحلیل عملکرد الگوریتم 72

4-13 جمع­بندی 72

فصل پنجم: پیاده سازی و ارزیابی

5-1 مقایسه نتایج با پیش پردازش استاندارد. 74

5-2 پیاده سازی 75

5-3 مقایسه عملیات پیش پردازش در دو روش 75

5-4 مقایسه نتایج نهایی 77

5-5 کارایی زمان اجرا 83

 

عنوان                                                                                                                                   صفحه

5-6 مقایسه نتایج پردازش شده و بدون پردازش با نظریه انتخاب بهینه رژیم غذایی 83

5-7 بررسی بیشترین داده­های قابل ارائه. 84

5-8 جمع­بندی 85

فصل ششم: نتیجه گیری و کارهای آینده

6-1 خلاصه راهکارهای ارائه شده. 86

6-2 راهکارهایی برای ادامه پژوهش 88

منابع و ماخذ 90

 

 

فهرست شکل­ها

عنوان                                                                                                                                   صفحه

شکل 1-1: ساختار انتزاعی داده‌های پیوندی 2

شکل 1-2: یک مدل از روابط در داده‌های پیوندی 3

شکل 2-1: ماتریس شباهت کاربران در روش همبستگی 11

شکل 2-2 :تعریف پروفایل کاربر در قالب FOAF 17

شکل 2-3 : معماری سیستم پیشنهادگر بر پایه FOAF 18

شکل 2-4 یک نمونه از پیشنهاد دهی دیبیرک. 19

شکل 2-5 یک نمونه از ارائه دلایل مربوط به یک پیشنهاد در دیبیرک. 19

شکل 3-1: نمونه ای از پیوندهای RDF 24

شکل 3-2: یک گزاره متشکل از دو منبع و یک صفت سازنده یک رابطه. 25

شکل 3-3: گزاره “امید رفیعی مالک صفحه وب است”. 26

شکل 3-4: نمونه یک RDF در قالب  XML 26

شکل 3-5 : شمایی از ابر داده های باز متصل در مارچ 2009. 30

شکل 3-6: مدل جستجوی غذا در بین محدودهها توسط یک چرنده. 32

شکل 3-7: الگوریتم انتخاب رژیم غذایی بهینه. 39

شکل 4-1: مدل رتبه‌بندی سه‌گانه. 43

شکل 4-2: یک گراف ساده معنایی 44

شکل 4-3: تنسور معادل گراف معنایی شکل 4-2. 45

شکل 4-4: تجزیه تنسور T به 3 ماتریس عامل 48

شکل 4-5: یک RDF ساده  با خاصیت resource. 52

شکل 4-6: یک RDF ساده  با خاصیت type. 53

شکل 4-7: یک RDF ساده با خاصیت wordnet_type. 53

شکل 4-8: یک RDF  توصیفگر یک گروه موسیقی 54

شکل 4-9 (الف): نتایج یک گزاره غلط. 61

شکل 4-9 (ب): نتایج یک گزاره درست. 61

شکل 4-10: مراحل امتیاز دهی خصوصیات و حذف خصوصیات نامطلوب. 65

شکل 4-11: شبه کد الگوریتم CP-ALS 66

شکل 5-1: مقایسه نتایج پیش پردازش روش استاندارد با روش بهینه. 77

شکل 5-2: مقایسه تعداد خصوصیات انتخاب شده با دو روش استاندارد و بهینه. 82

شکل 5-3: تعداد پیوندهای مبهم پیشنهاد شده دو روش استاندارد و بهینه. 82

شکل 5-4: تعداد پیوندهای (منابع RDF) پیشنهاد شده دو روش استاندارد و بهینه. 83

شکل 5-5: نمونه ای از گشت و گذار بین پیوندهای RDF دادههای پیوندی 85

شکل 5-6: امتیازدهی به نتایج روش انتخاب بهینه غذا (امتیازدهی بین 1 تا 10) 85

 

فهرست جدول­ها

عنوان                                                                                                                                   صفحه

جدول 2-1: دسته بندی روش­های پیشنهاددهی 8

جدول 2-2: انواع مدل­های ترکیبی 16

جدول 4-1: 20 خاصیت مربوط به گروه­های موسیقی از dbpedia.org 50

جدول 4-2: بررسی مطلوبیت خاصیت­های مربوط به گروه­های موسیقی از جدول 4-1. 51

جدول 4-3: دسته بندی خاصیت­ها مربوط به گروه­های موسیقی از جدول 4-1. 55

جدول 4-4: برخی از خاصیت­های دسته اول و دوم در انباره ایستا 58

جدول 4-5: نتایج جستجو در گوگل برای 3 موضوع عمومی نتایج 10 صفحه اول 60

جدول 4-6: سابقه حذف خصوصیات (اطلاعات موضوع و تعداد حذف­ها فرضی هستند) 67

جدول 4-7: نمونه­ای نرمال از داده­های ورودی روش انتخاب رژیم غذایی بهینه. 69

جدول 4-8: نمونه­ای غیر طبیعی از داده­های ورودی روش انتخاب رژیم غذایی بهینه. 70

جدول 5-1: نتایج حذف خاصیت با پیش پردازش استاندارد. 75

جدول 5-2: نتایج حذف خاصیت با پیش پردازش روش ارائه شده. 76

جدول 5-3: نتایج نهایی روش رتبه‌بندی سه‌گانه استاندارد بر روی مجموعه داده بیتلز. 78

جدول 5-4: نتایج نهایی روش رتبه‌بندی سه‌گانه بهینه شده بر روی مجموعه داده بیتلز. 80

جدول 5-5: نتایج نهایی روش پیشنهادی تحقیق بر روی مجموعه داده معیار دیبی­پدیا 81

 

فصل یکم

کلیات تحقیق

 

 

 

 

1-1 مقدمه

سیستم‌های پیشنهاد دهنده یک نوع ویژه از سیستم‌های فیلتر اطلاعات است، که در آن مورد­ها را، بر این اساس که چه موردی‌ برای کاربر جذاب است، از یک مجموعه بزرگ از مورد­ها و کاربران فیلتر می­کنند. در این تحقیق روشی جهت پیشنهاددهی بر روی داده­های پیوندی با استفاده از نظریه غذایابی جانوران ارائه می­شود. ایده­ی داده‌های پیوندی برای اولین بار در سال 2006 توسط تیم برنز لی[1] به عنوان یک نظریه­ی غیر رسمی‌ارائه شد. تا به امروز زمینه­های فنی انجام تحقیقات از طریق پیاده­سازی ابزار­های مورد نیاز برای ایجاد مجموعه­های داده، اتصال آن­ها به یکدیگر و همچنین گشت و گذار ساده بین آن­ها ایجاد شده است. نظریه غذایابی چگونگی یافتن غذا توسط جانوران را تشریح می­کند و در تحقیقات بسیاری نشان داده شده است که انسان­ها نیز برای یافتن اطلاعات از این روش استفاده می­کند.

1 Tim Berners-Lee

تعداد صفحه :

قیمت :37500 تومان

بلافاصله پس از پرداخت ، لینک دانلود فایل در اختیار شما قرار می گیرد

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت  serderehi@gmail.com