داده کاوی و کاوش قوانین ارتباطی

داده کاوی و کاوش قوانین ارتباطی

وب کاوی
متن کاوی
داده کاوی
دیتا ماینینگ
کاوش قوانین ارتباطی داده کاوی
دانلود پایان نامه رشته کامپیوتر
داده کاوی و کاوش قوانین ارتباطی
دانلود پایان نامه داده کاوی
دانلود پروژه داده کاوی
دانلود پایان نامه کامپیوتر

رفتن به سایت اصلی

دانلود پایان نامه رشته کامپیوتر

داده کاوی و کاوش قوانین ارتباطی

 

چکیده:

در دو دهه قبل توانایی های فنی بشر برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات  دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند.

 

بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. این رشد انفجاری در داده‌های ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده  و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.

 

به لحاظ اینکه در چند سال اخیر مبحث داده کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرم افزار های آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.در این پایان نامه درفصل مروری بر داده کاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه داده ها را ذکر کردیم که داده کاوی یکی از مراحل آن است.در فصل 2 یکی از شیوه های داده کاوی که از سبد خرید گرفته شده  است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته بندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح می دهیم و در آخر آن دو را با هم مقایسه می کنیم . در فصل 3 مباحث وب کاوی و متن کاوی را که در بسیاری از مراجع جزء کاربردهای داده کاوی به حساب می آید شرح داده خواهد شد.

 

 

کلمات کلیدی:

وب کاوی

متن کاوی

داده کاوی

دیتا ماینینگ

کاوش قوانین ارتباطی داده کاوی

 

 

 

 

مقدمه:

امروزه با گسترش سیستم‌های پایگاهی و حجم بالای داده‌های ذخیره شده در این سیستم‌ها، نیاز به ابزاری است تا بتوان داده‌های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.با استفاده از پرسش‌های ساده در SQL و ابزارهای گوناگون گزارش‌گیری معمولی، می‌توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه‌گیری در مورد داده‌ها و روابط منطقی میان آنها بپردازند. امّا وقتی که حجم داده‌ها بالا باشد، کاربران هرچند زبر دست و با تجربه باشند نمی‌توانند الگوها مفید را در میان حجم انبوه داده‌ها تشخیص دهند و یا اگر قادر به این کار هم باشند، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است. از سوی دیگر، کاربران معمولاً فرضیه‌ای را مطرح می‌کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می‌پردازند، در حالی که امروزه نیاز به روشهایی است که اصطلاحاً به کشف دانش   بپردازند یعنی با کمترین دخالت کاربر و بصورت خودکار الگوها و رابطه‌های منطقی را بیان نمایند.

 

داده کاوی  یکی از مهمترین این روشها است که به الگوهای مفید در داده‌ها با حداقل دخالت کاربران شناخته می‌شوند واطلاعاتی را در اختیار کاربران و تحلیل گران قرار می‌دهند تا براساس آن تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.اصطلاح داده کاوی زمانی بکار برده می‌شود که با حجم بزرگی از داده‌ها، در حد مگا یا ترابایت، مواجه باشیم. در تمامی منابع داده کاوی بر این مطلب تأکید شده است. هرچه حجم داده‌ها بیشتر و روابط آنها پیچیده تر باشد دسترسی به اطلاعات نهفته در میان داده ها مشکل تر می‌شود و نقش داده کاوی بعنوان یکی از روش های کشف دانش، روشن‌تر می‌گردد.داده کاوی بطور همزمان از چندین رشته علمی بهره می‌برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه‌های عصبی، آمار، الگو، سیستم‌های مبتنی بر دانش ، حصول دانش ، بازیابی اطلاعات ، محاسبات سرعت بالا  و بازنمایی بصری داده .

 

 

 

 

فهرست مطالب

چکیده 2

فصل1: مقدمه ای بر داده کاوی   13

1-1 تعریف داده کاوی   . 15

2-1 تاریخچه داده کاوی   16

3-1 چه چیزی سبب پیدایش داده کاوی شده است؟   17

4-1 اجزای سیستم داده کاوی   . 19

5-1 جایگاه داده کاوی در میان علوم مختلف   21

6-1 قابلیتهای داده کاوی   . 22

7-1 چرا به داده کاوی نیاز داریم؟   . 23

8-1 داده کاوی چه کارهایی نمی تواند انجام دهد؟   25

9-1 کاربردهای داده کاوی   . 25

1-9-1 کاربردهای پیش بینی کننده   . 27

2-9-1 کاربردهای توصیف کننده   27

10-1 ابزارهای تجاری داده کاوی   . 28

11-1 داده کاوی و انبار داده ها   . 29

1-11-1 تعاریف انبار داده   29

2-11-1 چهار خصوصیت اصلی انبار داده   . 30

3-11-1 موارد تفاوت انبار داده و پایگاه  داده   31

12-1 داده کاوی و OLAP   . 33

1-12-1 OLAP   . 33

2-12-1 انواع OLAP   . 34

13-1 مراحل فرایند کشف دانش از پایگاه داده ها   . 34

1-13-1 انبارش داده ها   35

2-13-1 انتخاب داده ها   36

3-13-1 پاکسازی- پیش پردازش- آماده سازی   36

4-13-1 تبدیل داده ها   36

5-13-1 کاوش در داده ها (Data Mining)   . 37

6-13-1 تفسیر نتیجه   38

 

فصل 2: قوانین ارتباطی   . 39

1-2 قوانین ارتباطی   40

2-2 اصول پایه   . 41

1-2-2 شرح مشکل جدی   . 41

2-2-2 پیمایش فضای جستجو   . 43

3-2-2 مشخص کردن درجه حمایت مجموعه اقلام   . 45

3-2 الگوریتمهای عمومی   45

1-3-2 دسته بندی   45

2-3-2 BFS و شمارش رویداد ها   . 46

3-3-2 BFS و دونیم سازی TID-list   . 47

4-3-2 DFS و شمارش رویداد   47

5-3-2 DFS و دو نیم سازی TID-list   48

4-2 الگوریتم Apriori   48

1-4-2 مفاهیم کلیدی   . 48

2-4-2 پیاده سازی الگوریتم Apriori   49

3-4-2 معایب Apriori و رفع آنها   . 54

5-2 الگوریتم رشد الگوی تکرارشونده   55

1-5-2 چرا رشد الگوی تکرار سریع است؟   . 58

6-2 مقایسه دو الگوریتم Apriori و FP-growth   59

7-2 تحلیل ارتباطات   63

 

فصل 3: وب کاوی و متن کاوی   . 65

1-3 وب کاوی   . 66

1-1-3 الگوریتمهای هیتس و لاگسام   . 69

2-1-3 کاوش الگوهای پیمایش مسیر   76

2-3 متن کاوی   . 90

1-2-3 کاربردهای متن کاوی   . 92

1-1-2-3 جستجو و بازیابی   95

2-1-2-3 گروه بندی و طبقه بندی   97

3-1-2-3 خلاصه سازی   99

4-1-2-3 روابط میان مفاهیم   . 101

5-1-2-3 یافتن و تحلیل گرایشات  

6-1-2-3 برچسب زدن نحوی (pos)   .

7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک   . 107

2-2-3 فرایند متن کاوی   .

3-2-3 روشهای متن کاوی   . 110

مراجع   . 116

 

 

فهرست اشکال

1-1 مراحل فرایند کشف دانش   17

2-1 سیر تکاملی صنعت پایگاه داده   19

3-1 معماری یک نمونه سیستم داده کاوی   . 20

4-1 نرخ رشد اطلاعات   . 24

5-1 کاربرد پیش بینی کننده   27

6-1 داده ها از انبار داده ها استخراج می گردند   32

7-1 داده ها از از چند پایگاه داده  استخراج می گردند   32

1-2 شبکه‌ای برای     .

3-2 دسته بندی الگوریتمها   46

4-2 پایان الگوریتم Apriori   52

5-2 درخت الگوی تکرار   57

6-2 اندازه گیری کارکرد درجه حمایت برای پایگاه داده D1 40K   61

7-2 اندازه گیری Apriori با درجه حمایت/تراکنش   . 62

8-2 اندازه گیری FP-growth با درجه حمایت/تراکنش   62

1-3 مقداردهی اولیه الگوریتم HITS   72

2-3 مثالی از الگوهای پیمایش   . 80

3-3 فرایند متن کاوی   . 86

4-3 مثال یافتن روابط   . 88

 

 

فهرست جداول

1-2 کاوش FP-tree با ایجاد پایگاه های الگوشرطی   . 58

2-2 پارامترها   . 59

3-2 نتایج برای فاکتور درجه حمایت 5%   60

4-2 نتایج برای D1 150K با درجه حمایت   . 61

1-3 تراکنش های توصیف شده توسط مجموعه ای از URLها   . 75

2-3 نمایش URLها به عنوان بردارهایی از فعالیت گروه تراکنش   75

3-3 یک SOM مرسوم که توسط توصیف URLها تولید شده است   76

 

  • الگوهای تكامل فرآیند نوآوری تكنولوژیكی و بررسی تاثیر آن در دانشگاه ها

    الگوهای تكامل فرآیند نوآوری تكنولوژیكی و بررسی تاثیر آن در دانشگاه ها نوآوری در آموزش عالی ابعاد نوآوری دانشگاهی مدلهای نوآوری دانشگاهی تأثیر نوآوری بر فاكتورهای نظام آموزش پایان نامه نوآوری دانشگاهی دانلود پایان نامه نوآوری دانشگاهی الگوهای تكامل فرآیند…

  • مبانی نظری بررسی تاثیر یادگیری الکترونیکی بر عملکرد کارکنان

    مبانی نظری بررسی تاثیر یادگیری الکترونیکی بر عملکرد کارکنان مبانی نظری مدیریت دانش مبانی نظری یادگیری الکترونیکی فرآیندهای مدیریت دانش پیاده سازی مدیریت دانش در سازمان بازرسی استقرار مدیریت دانش در سازمان بازرسی مبانی نظری تاثیر مدیریت دانش بر یادگیری…

  • حجاب و پوشش اجتماعی مردان

    حجاب و پوشش اجتماعی مردان حجاب مردان حجاب و پوشش مردان حجاب مردان در قران حجاب مردان در اسلام حجاب مردان در چیست؟ حجاب مردان باید چگونه باشد؟ پایان نامه حجاب مردان پایان نامه پوشش اجتماعی مردان پوشش اجتماعی مردان…

  • گزارش كارآموزی رشته صنایع دستی با عنوان نحوه ساختن صنایع دستی

    گزارش كارآموزی رشته صنایع دستی با عنوان نحوه ساختن صنایع دستی نگارگری سفالینه سفال گری آبگینه و شیشه صنایع مستظفرفهانواع لعاب های سنتی ایران سفالینه های سنتی ایران طرز تهیه گل سفال گری دانلود گزارش كارآموزی رشته صنایع دستی با…

  • بررسی مقایسه ای نقوش گیاهی گچ بری های کاخ تیسفون با مساجد اصفهان

    بررسی مقایسه ای نقوش گیاهی گچ بری های کاخ تیسفون با مساجد اصفهان معماری بناهای ایران معماری بناهای مساجد نقوش گیاهی مساجد نقوش گیاهی در گچبری های کاخهای ساسانی نقوش گیاهی در گچبری مساجد نقوش گیاهی گچ بری های کاخ…

  • مبانی نظری بررسی عوامل موثر بر سلامت جسمی و روانی سالمندان

    مبانی نظری بررسی عوامل موثر بر سلامت جسمی و روانی سالمندان عوامل اجتماعي موثر برسلامت سالمندان عوامل جمعيتي موثر برسلامت سالمندان عوامل اقتصادي موثر برسلامت سالمندان عوامل موثر بر سلامت سالمندان عوامل موثر بر سلامت روان سالمندان عوامل موثر بر…

  • قوانین دادرسی ناظر بر دعوای ابطال

    قوانین دادرسی ناظر بر دعوای ابطال پایان نامه دعوای ابطال رسیدگی به دعوای ابطال ابطال رأی داوری قوانین دادرسی ناظر بر دعوای ابطال قواعد دادرسی حاکم بر دعوای ابطال آثار قواعد دادرسی حاکم بر دعوای ابطال تأثیر دعوای ابطال در…

  • چارچوب نظری و پیشینه پژوهش سلامت روانشناختی

    چارچوب نظری و پیشینه پژوهش سلامت روانشناختی مبانی نظری سلامت روانشناختی پیشینه سلامت روانشناختی دانلود مبانی نظری سلامت روانشناختی پیشینه تحقیق سلامت روانشناختی ادبیات نظری سلامت روانشناختی فصل دوم پایان نامه سلامت روانشناختی مبانی نظری و پیشینه تحقیق سلامت روانشناختی…

  • پاورپوینت چرخه پردازش معاملات و فعالیت ها در AIS

    پاورپوینت چرخه پردازش معاملات و فعالیت ها در AIS پاورپوینت چرخه پردازش معاملات و فعالیت ها در AIS پاورپوینت چرخه پردازش معاملات و فعالیت ها در سیستمهای اطلاعات حسابداری تحقیق چرخه پردازش معاملات و فعالیت ها در AIS مقاله چرخه…

  • تبیین نقش مراكز ارزیابی در ترویج فرهنگ نظارت و بازرسی

    تبیین نقش مراكز ارزیابی در ترویج فرهنگ نظارت و بازرسی نظارت مراكز ارزیابی ترویج فرهنگ نظارت و بازرسی مكانیسمهای نظارت و بازرسی تبیین نقش مراكز ارزیابی در ترویج فرهنگ نظارت و بازرسی دانلود مقالات رشته مدیریت دانلود مقالات مدیریتی دانلود…