امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره گیری از روشهایی همچون داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، امری غیرقابل اجتناب میباشد. بدلیل حجم بسیار بالای داده ها در بسیاری از کاربردها و اهمیت بیشتر داده های جدید، ذخیره سازی این داده ها امری مقرون به صرفه نیست، لذا داده هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند. مساله دیگری که امروزه در بحث داده کاوی وجود دارد، بحث توزیع شدگی ذاتی داده ها است. معمولا پایگاه هایی که این داده ها را ایجاد یا دریافت میکنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود میباشند و حاضر نیستند دانش خود را بطور رایگان در اختیار دیگران قرار دهند.
با توجه به قابلیتهای عامل و سیستمهای چندعامله و مناسب بودن آنها برای محیط های پویا و توزیع شده بنظر میرسد که بتوان از قابلیتهای آنها برای داده کاوی در محیط های پویا و محیط های توزیع شده بهره برد. اکثر کارهایی که تاکنون در زمینه بهره گیری از عامل و سیستمهای چندعامله انجام شده است خصوصیتهایی همانند خودآغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، یادگیری، قابلیت استدلال، هدفگرایی و قابلیتهای اجتماعی عاملها مورد بررسی قرار نگرفته است. در این تحقیق ما قصد داریم تا ضمن بررسی کارهای موجود در زمینه کاربرد عامل و سیستمهای چندعامله در داده کاوی، بحث طبقه بندی جریان داده ها را در یک محیط پویا مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهیم داد. در فاز اول خصوصیتهای یک عامل تنها مورد بررسی قرار خواهد گرفت و در فاز دوم قابلیتهای اجتماعی عاملها مانند مذاکره، دستیابی به توافق و ... برای داده کاوی در یک محیط پویا و توزیع شده رقابتی مورد استفاده قرار خواهد گرفت. بطور کلی دستاوردهای اصلی این تحقیق عبارتند از 1) ارائه یک رویکرد مبتنی بر عامل برای مساله طبقه بندی جریان داده های دارای تغییر مفهوم و پویا با استفاده از قابلیتهای هدفگرایی، هوشمندی، یادگیری و استدلال 2) ارائه یک رویکرد مبتنی بر سیستمهای چندعامله برای طبقهبندی جریان دادههای توزیعشده در یک محیط رقابتی با استفاده از قابلیتهای اجتماعی عاملها و دستیابی به توافق. نتایج حاصل از آزمایشات انجام شده در این پایان نامه نشان دهنده برتری استفاده از عاملها و سیستمهای چندعامله برای بحث طبقه بندی و داده کاوی در محیطهای پویا و توزیع شده میباشد.
فهرست مطالب
1. فصل اول - معرفی و آشنایی با مفاهیم اولیه. 1
1-1- مقدمهای بر داده کاوی.. 2
1-1-1- خوشه بندی.. 3
1-1-2- کشف قواعد وابستگی.. 4
1-1-3- طبقه بندی.. 4
1-1-3-1- طبقه بندی مبتنی بر قواعد. 5
1-2- داده کاوی توزیع شده. 7
1-3- عاملها و سیستمهای چندعامله. 8
1-3-1- عامل. 8
1-3-1-1- مقایسه عامل با شی.. 9
1-3-1-2- معماری عاملها11
1-3-1-3- معماری BDI. 12
1-3-2- سیستمهای چندعامله. 14
1-3-2-1- مذاکره. 17
1-4- بهره گیری از عامل برای داده کاوی.. 19
1-4-1- سیستمهای چندعامله، بستری برای داده کاوی توزیع شده. 19
1-5- جمع بندی.. 22
2. فصل دوم - داده کاوی پویا23
2-1- مقدمه ای بر داده کاوی پویا24
2-2- جریان داده. 25
2-3- طبقه بندی جریان داده. 26
2-3-1- موضوعات پژوهشی.. 27
2-4- جمع بندی.. 31
3. فصل سوم - مروری بر کارهای انجام شده. 33
3-1- مقدمه. 34
3-2- داده کاوی توزیع شده ایستا. 35
3-2-1- روشهای غیرمتمرکز. 36
3-2-2- روشهای مبتنی بر توزیع ذاتی داده ها37
3-3- کارهای مهم انجام شده در زمینه داده کاوی با استفاده از عامل. 38
3-4- کارهای انجام شده در زمینه طبقه بندی جریان دادهها41
3-4-1- روشهای طبقه بندی Ensemble-based. 41
3-4-2- درختهای تصمیم بسیار سریع. 43
3-4-3- طبقه بندی On-Demand. 46
3-4-4- OLIN.. 48
3-4-5- الگوریتمهای LWClass. 49
3-4-6- الگوریتم ANNCAD.. 51
3-4-7- الگوریتم SCALLOP. 51
3-4-8- طبقه بندی جریان داده ها با استفاده از یک روش Rule-based. 53
3-5- جمع بندی.. 54
4. فصل چهارم - تعریف مساله. 55
4-1- مقدمه. 56
4-2- تعریف مساله برای فاز اول. 56
4-2-1- جریان داده. 57
4-2-2- مفهوم یا مدل موجود در جریان داده. 57
4-2-3- مساله طبقه بندی جریان داده های دارای تغییر مفهوم. 57
4-3- تعریف مساله برای فاز دوم. 59
5. فصل پنجم - رویکردهای پیشنهادی.. 62
5-1- مقدمه. 63
5-2- رویکرد پیشنهادی برای فاز اول پروژه. 63
5-2-1- عامل و ویژگیهای آن در این مساله. 64
5-2-2- عملکرد کلی عامل. 65
5-2-3- معماری عامل. 66
5-2-3-1- حسگرها 67
5-2-3-2- پایگاه دانش عامل. 68
5-2-3-3- تابع ارزیابی محیط.. 70
5-2-3-3-1- نحوه تشخیص اطلاعات و نگهداری الگوهای recur در جریان داده. 70
5-2-3-3-2- نحوه استخراج الگوهای recur70
5-2-3-3-3- نحوه بروزرسانی اطلاعات مربوط به الگوهای recur73
5-2-3-3-4- نحوه محاسبه وقوع احتمال وقوع یک الگوی خاص.... 74
5-2-3-4- تابع سودمندی.. 75
5-2-3-5- بخش تصمیم گیری Planning. 79
5-2-3-5-1- بخش تصمیم گیری.. 79
5-2-3-5-2- Planning. 83
5-2-3-6- بخش Action. 86
5-3- رویکرد پیشنهادی برای فاز دوم مساله. 87
5-3-1- عاملهای مشتری.. 88
5-3-2- عامل صفحه زرد. 90
5-3-3- عاملهای داده کاو. 91
5-3-3-1- معماری عاملهای داده کاو. 92
5-3-3-1-1- تابع BRF. 94
5-3-3-1-2- تابع Generate Options. 95
5-3-3-1-3- تابع فیلتر. 95
5-3-3-1-4- بخش Actions. 96
5-3-3-1-5- Plan های عامل. 97
5-3-3-1-5- 1- Plan مربوط به طبقه بندی.. 97
5-3-3-1-5-2- Plan مربوط به تطبیق طبقه بندی98
5-3-3-1-5-3- Plan مربوط به خرید و فروش قواعد با استفاده از مذاکره. 101
5-4- جمع بندی.. 111
6. فصل ششم - آزمایشات و نتایج.. 113
6-1- مقدمه. 114
6-2- محیط عملیاتی.. 114
6-3- مجموعه داده های مورد استفاده. 116
6-3-1- مجموعه داده های استاندارد. 116
6-3-2- مجموعه داده های واقعی.. 117
6-4- معیارهای ارزیابی و روشهای مورد استفاده برای مقایسه. 117
6-5- آزمایشات انجام شده. 118
6-5-1- آزمایشات مربوط به فاز اول. 119
6-5-2- آزمایشات مربوط به فاز دوم. 128
6-6- جمع بندی.. 130
7. فصل هفتم- جمع بندی و نتیجه گیری.. 132
فهرست مراجع. 136
فهرست اشکال
شکل1-1- معماری BDI در عامل. 15
فهرست جدولها
جدول1-1- ویژگیهای یک عامل 11
پاورپوینت بررسی داده کاوی (Data Mining)
مقدمه
از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شد. همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها و آمارشناسان با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافته اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند و امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است. حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن انبارهای عظیمی از داده ها شده است به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است .
چنان که در عصر حاضر گفته می شود « اطلاعات طلاست»
سابقه داده کاوی
داده کاوی و کشف دانش در پایگاه داده ها از جمله موضوع هایی هستند که همزمان با ایجاد و استفاده از پایگاه داده ها در اوایل دهه 80 برای جستجوی دانش در داده ها شکل گرفت.
شاید بتوان لوول (1983) را اولین شخصی دانست که گزارشی در مورد داده کاوی تحت عنوان « شبیه سازی فعالیت داده کاوی » ارائه نمود. همزمان با او پژوهشگران و متخصصان علوم رایانه، آمار، هوش مصنوعی، یادگیری ماشین و . . . نیز به پژوهش در این زمینه و زمینه های مرتبط با آن پرداخته اند.
فهرست مطالب
مقدمه
سابقه داده کاوی
بخش اول – مفهوم داده کاوی
1-1 – فرآیند داده کاوی
1-2 – ابزارهای داده کاوی
1-2-1 – هم پیوندی
1-2-2 – طبقه بندی
1-2-3 – الگوهای ترتیبی
1-2-4 – خوشه بندی
1-3 – کاربردهای داده کاوی
1-3-1 – کاربردهای تجاری
1-3-2 – کاربردهای علمی
1-3-3 – کاربردهای امنیتی
بخش دوم – داده کاوی توزیع شده
بخش سوم – عامل ها ، سِستمهای چند عامله و داده کاوی توزیع شده
3-1 – عامل
3-2 – سیستمهای چند عامله
بخش چهارم – پروسه ی کشف دانش از پایگاه داده
4-1 – ویژگی های KDD
4-1-1 – استخراج داده ها
4-1-2 – آماده کردن داده ها
4-1-3 – مهندسی داده ها
4-1-4 – مهندسی الگوریتم و تعیین استراتژی های کاوش
4-1-5- اجرای الگوریتم کاوش و ارزیابی نتایج
داده کاوی
توجه :
شما می توانید با خرید این محصول فایل " قلق های پایان نامه نویسی (از عنوان تا دفاع)" را به عنوان هدیه دریافت نمایید.
بسیاری از فروشگاهها پس از گذشت یک ربع قرن از آغاز فعالیت، هنوز مشتری وفادار خود را دارند. این وفاداری تصادفی نیست. اداره کنندگان این فروشگاهها به سلایق و نیازهای مشتریان خویش واقف شده اند و توان مالی خرید آنها را می شناسند. وقتی کسی از آنها راهنمایی بخواهد پاسخ آنها براساس دانش اندوخته شان در مورد ذائقه و بودجه آن مشتری و همچنین دانش شان در باره محصولات خودشان خواهد بود.
افرادی که به این فروشگاه رفت و آمد دارند در مورد کالاهای آن فروشگاه چیزهای زیادی می دانند. هر چند این دانش یکی از دلایل آنها برای ایجاد خرید از آنجاست و به همین دلیل به فروشگاه های دیگر نمی روند ولی داشتن اطلاعات خودمانی و صمیمانه در باره هر شخص آنها را مشتری دائمی آنجا می کند و به یک مغازه مشابه دیگر در آنطرف خیابان و روبروی همین فروشگاه نمی روند و برخوردار بودن این فروشگاه از اطلاعات خودمانی و صمیمانه در باره هر شخص آنها را مشتری دائمی آنجام می کند . یک مغازه مشابه دیگر می تواند در آنطرف خیابان و روبروی همین مغازه باز شود ولی ماهها و حتی سالها طول می کشد تا آنها به این سطح از دانش در باره مشتریانشان دست یابند.
طبیعتاً تجارتهای کوچکی که مدیریت خوبی دارند می توانند به نحوه ایجاد رابطه با مشتریانشان پی ببرند. آنها با گذشت زمان در باره مشتریانشان به چیزهای بیشتر و بیشتری پی خواهند برد و از آن دانش برای خدمت بهتر به مشتریان استفاده خواهند نمود و نتیجه کار، مشتریان وفادار و خرسند و تجارتهای سودآور خواهد بود.
شرکتهای بزرگ با صدها هزار یا میلیونها نفر مشتری از مزیت برقراری روابط شخصی حقیقی با تک تک مشتریانشان بی بهره اند. این موسسات عظیم باید به وسایل دیگری برای برقراری رابطه با مشتریانشان تکیه نمایند. آنها باید یاد بگیرند که از آنچه که به وفور دارند یعنی داده هایی که از طریق تعامل با تک تک مشتریان به دست آمده است نهایت بهره را ببرند. این کتاب در مورد تکنیکهای تحلیلی بحث میکند که برای تبدیل داده های مشتریان به دانش در باره مشتریان استفاده میشود.
عناوین :
مدیریت روابط تحلیلی با مشتریان
نقش سیستمهای پردازش تعاملات
نقش ذخیره سازی داده ها
نقش داده کاوی
نقش استراتژی مدیریت روابط با مشتری
داده کاوی چیست؟
دسته بندی
تخمین
پیش بینی
دسته بندی شباهت یا قوانین وابستگی
خوشه بندی
نمایه سازی
چرا حالا؟
داده ای که ایجاد شده است
داده ای که ذخیره شده است
توان محاسباتی قابل دسترسی است
علاقه به مدیریت روابط با مشتریان فراوان است
همه تجارتها، خدمات هستند
اطلاعات یک محصول است
محصولات نرم افزاری داده کاوی تجاری موجودند
امروزه چگونه از داده کاوی استفاده می شود؟
یک سوپر مارکت واسطه اطلاعات می شود
تجارت بر اساس توصیه
فروش متقابل و همزمان
شرکت ها از داده کاوی برای توسعه توانایی فروش
حفظ مشتریان خوب و غربال کردن مشتریان بد
تحول اساسی در یک صنعت
گستره کاربرد دانش داده کاوی
مطالب آموخته شده در این فصل
روشهای داده کاوی
چرا باید روشی داشت؟
یادگیری چیزهایی که درست نیستند
ممکن است الگوها نشان دهنده هیچ قاعده ضمنی نباشند
مجموعه مدل ممکن است نشانگر جامعه مرتبط نباشد
ممکن است داده ها دارای سطح جزئیات نادرستی باشد
یادگیری چیزهایی که درست هستند اما مفید نیستند
یادگیری چیزهایی که از قبل معلوم بوده اند
یادگیری چیزهایی که قابل استفاده نیستند
آزمون فرضیه
تولید فرضیات
آزمودن فرضیات
مدل هاف نمایه سازی و پیش بینی
نمایه سازی
پیش بینی
مراحل داده کاوی
مرحله اول : تبدیل مسئله کسب و کار و تجارت به یک مسئله داده کاوی
مسئله داده کاوی چگونه مسئله ای است؟
چگونه از نتایج استفاده خواهد شد؟
چگونه نتایج بیان خواهد شد؟
نقش کاربران تجاری و فن آوری اطلاعات
خطردرک نادرست مسئله کسب و کار و تجارت: یک حکایت هشدار دهنده
مرحله دوم: انتخاب داده های مناسب
چه چیزی موجود است ؟
چقدر داده کافی است ؟
چه مقدار از اطلاعات پیشین مورد نیاز است؟
تعداد مناسب متغیرها
داده ها باید حاوی چه چیز باشند؟
مرحله سوم : شناخت داده ها
بررسی توزیعها
مقایسه ارقام با توصیفات
اعتبار بخشی به فرضیات
سئوالات زیادی بپرسید
مرحله چهارم : تهیه یک مجموعه مدل
جمع آوری بخشهای مشتریان
تهیه یک نمونه متعادل
در نظر گرفتن چارچوبهای زمانی چند گانه
تقسیم بندی مجموعه مدل
مرحله پنجم: رفع مشکلات داده ها
- متغیرهای عددی با توزیع و مشاهدات پرت نادرست
مقادیر گمشده
ارقام با معانی که در طول زمان تغییر می کنند
کد گذاری غیر ثابت داده ها
مرحله ششم: تبدیل داده ها برای استخراج اطلاعات
کشف روندها
تبدیل شماره ها به نسبتها
مرحله هفتم : تهیه مدلها
مرحله هشتم : ارزیابی مدلها
- ارزیابی مدلهای توصیفی
- ارزیابی مدلهای هدایت شده
- ارزیابی دسته بندی کننده ها و پیشگوها
- ارزیابی تخیمن زننده ها
مقایسه مدلها با استفاده از صعود
مشکلات صعود
مرحله نهم : پیاده سازی مدلها
مرحله دهم : ارزیابی نتایج
مرحله یازدهم: شروع دوباره
مطالب آموخته شده در این فصل
کاربرد داده کاوی در بازاریابی و مدیریت ارتباط با مشتری
مشتری با لقوه
شناسایی مشتریان بالقوه خوب
انتخاب کانال ارتباطی
انتخاب پیامهای درست
چه کسی با مشخصات مطابقت دارد؟
اندازه گیری تطابق گروههای خوانندگان
داده کاوی برای بهبود اعمال بازاریابی مستقیم
مدل سازی پاسخ
بهینه کردن پاسخ با بودجه ای ثابت
بهینه سازی سوددهی اعمال بازاریابی
چگونه مدل بر سوددهی اثر می گذارد؟
یافتن افرادی که بیشتر از دیگران تحت تأثیر پیام قرار گرفته اند
تجزیه و تحلیل پاسخای متفاوت
استفاده از مشتریان فعلی جهت شناخت مشتریان بالقوه
مشتریان را پیش از این که تبدیل به مشتری شوند دنبال کنید
اطلاعات مشتریان جدید را جمع آوری کنید
متغیرهای زمان جذب مشتری می تواند نتایج آینده را پیش بینی نماید
داده کاوی برای مدیریت ارتباط با مشتری
مطابقت فعالیتها با مشتریان
بخش بندی مشتریان
یافتن قسمتهای رفتاری
اتصال قسمتهای تحقیقات در بازار با داده های رفتاری
کاهش مواجه با خطرات اعتباری
پیش بینی کسی که در پرداخت بدهی خود کوتاهی خواهد کرد
تعیین ارزش مشتری
یافتن زمان مناسب برای یک پیشنهاد
فروش چند بعدی و فروش صعودی و توصیه ها
توصیه ها
حفظ و از دست دادن مشتری
تشخیص از دست دادن مشتری
چرا از دست دادن مشتری مهم است
انواع مختلف از دست دادن مشتری
انواع مختلف مدل های از دست دادن مشتری
پیش بینی و تعیین مشتریانی که سیستم را ترک می کنند
پیش بینی این که مشتریان تا چه مدت باقی خواهند ماند
مطالب آموخته شده در این فصل
نگاهی بر داده کاوی و کشف قوانین وابستگی
چکیده:
با افزایش سیستمهای کامپیوتر و گسترش تکنولوژی اطلاعات , بحث اصلی در علم کامپیوتر از چگونگی جمع آوری اطلاعات به نحوه استفاده از اطلاعات منتقل شده است . سیستمهای داده کاوی ,این امکان را به کاربر می دهند که بتواند انبوه داده های جمع آوری شده را تفسیر کنند و دانش نهفته در آن را استخراج نمایند .
داده کاوی به هر نوع کشف دانش و یا الگوی پنهان در پایگاه داده ها اطلاق می شود . امروزه داده کاوی به عنوان یکی از مهمترین مسائل هوش مصنوعی و پایگاه داده ، محققان بسیاری را به خود جذب کرده است . در این تحقیق ابتدا نگاه کلی بر داده کاوی ، استراتژیهای داده کاوی و... داریم ، سپس مسأله کشف قوانین وابستگی در پایگاه داده را به تفضیل بررسی کردیم و نگاهی به الگوریتمهای موجود برای آن داشتیم . سپس مسأله کشف قوانین وابستگی در پایگاه داده های پویا را مورد بحث قرار دادیم و الگوریتم های ارائه شده مربوطه را مطرح کردیم .
مقدمه :
هدف از این اراِئه و تحقیق بررسی روشهای مطرح داده کاوی است .داده کاوی هر نوع استخراج دانش و یا الگواز داده های موجود در پایگاه داده است که این دانشها و الگوها ضمنی و مستتر در داده ها هستند ,از داده کاوی می توان جهت امور رده بندی (Classification ) و تخمین (Estimation) ,پیش بینی (Prediction) و خوشه بندی (Clustering)استفاده کرد .داده کاوی دارای محاسن فراوانی است . از مهمترین آن محاسن کشف کردن دانش نهفته در سیستم است که به شناخت بهتر سیستم کمک می کند .به عنوان مثال می توان به استفاده ترکیبی از روش خوشه بندی جهت تخصیص بودجه به دسته های مختلف از کتب اشاره کرد .
سیستمهای داده کاوی تقریبا از اوایل دهه 1990 مورد توجه قرار گرفتند . علت این امر نیز آن بود که تا آن زمان سازمانها بیشتر در پی ایجاد سیستمهای عملیاتی کامپیوتری بودند که به وسیله آنها بتوانند داده های موجود در سازمان خود را سازماندهی کنند . پس از ایجاد این سیستمها ,روزانه حجم زیادی از اطلاعات جمع آوری میشد که تفسیر کردن آنها از عهده انسان خارج بود . به همین دلیل , نیاز به تکنیکی بود که از میان انبوه داده معنی استخراج کند و داده کاوی به همین منظور ایجاد و رشد یافت .
بنابر این هدف اصلی از داده کاوی ,کشف دانش نهفته در محیط مورد بررسی است که این دانش می تواند شکلهای گوناگونی داسته باشد . دانش استخراج شده می تواند به فرم الگوهای موجود در داده ها باشد که کشف این الگوها منجر به شناخت بهتر سیستم نیز می شود . الگوهای استخراجی عموما بیانگر روابط بین ویژگیهای سیستم هستند بعنوان مثال در سیستم تجاری یک الگو می تواند بیانگر رابطه بین نوع کالا و میزان تقاضای آن باشد .
در این تحقیق داده کاوی مورد بحث قرار می گیرد . علل استفاده از داده کاوی و منابعی که داده کاوی بر روی آنها اعمال می شود ,علاوه بر این خلاصه ای از روشهای رایج داده کاوی ارائه شده است . تکنیکهای داده کاوی و قوانین وابستگی و الگوریتمهای موجود (Apriori , Aprior TID, Partition, Eclat ,Max Eclat , Vector ) و الگوریتم با ساختار Trie وfp grow و الگوریتمهای کاهشی مورد بررسی قرار می گیرند و در هر مورد مثالها , موارد کاربرد ,تکنیکها و نقاط قوت و ضعف مورد بررسی قرار گرفته اند .
مقدمه ای بر داده کاوی (درس پایگاه داده های پیشرفته 2)
در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند.
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده و دیگر مخازن بزرگ اطلاعات، ذخیره شده است.
داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات، محاسبات سرعت بالا و بازنمایی بصری داده . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد.
فهرست:
1 مقدمه ای بر دادهکاوی... 3
1-1 چه چیزی سبب پیدایش داده کاوی شده است؟. 4
1-2 مراحل کشف دانش.... 6
1-3 جایگاه داده کاوی در میان علوم مختلف... 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12
1-5 داده کاوی و انبار داده ها 13
1-6 داده کاوی و OLAP. 14
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15
2- توصیف داده ها در داده کاوی... 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها 15
2-2 خوشه بندی 16
2-3 تحلیل لینک... 16
3- مدل های پیش بینی داده ها 17
3-1 Classification. 17
3-2 Regression. 17
3-3 Time series. 18
4 مدل ها و الگوریتم های داده کاوی... 18
4-1 شبکه های عصبی 18
4-2 Decision trees. 22
4-3 Multivariate Adaptive Regression Splines(MARS). 24
4-4 Rule induction. 25
4-5 K-nearest neibour and memory-based reansoning(MBR). 26
4-6 رگرسیون منطقی... 27
4-7 تحلیل تفکیکی 27
4-8 مدل افزودنی کلی (GAM). 28
4-9 Boosting. 28
5 سلسله مراتب انتخابها 29
امروزه با گسترش روزافزن اینترنت و درنتیجه سیستمهای کامپیوتری مبتنی بر شبکه و نقش مهم آنها در ارتباطات و انتقال اطلاعات، تامین امنیت این شبکههای کامپیوتری، به عنوان یک ضرورت و چالش اساسی برای مدیران امنیتی شبکهها مطرح بوده است. سیستم-های تشخیص نفوذ، یکی از زمینههای مهم ...
فهرست چکیده................................................................................................................................8 تکنیکهای داده کاوی و متدلوژیهای ان مقدمه 9 عناصر داده کاوی 15 پردازش تحلیلی پیوسته: 16 قوانین وابستگی: 17 شبکه های عصبی : 17 الگوریتم ژنتیکی: 17 نرم افزار 18 کاربردهای داده کاوی 18 داده کاوی و کاربرد آن ...
پروژه پیاده سازی و بررسی روش های متن کاوی پژوهش کامل در حوزه متن کاوی و داده کاوی میباشد و در 2 فصل تنظیم شده است.این پروژه به بررسی روشهای انتخاب ویژگی و روشهاوالگوریتم های فرا اکتشافی پرداخته است.شما میتوانید فهرست مطالب پروژه را در ادامه مشاهده ...
داده کاوی در تشخیص بیماریهای قلبی مقدمه چکیده نتیجه گیری منابع 19 اسلاید ...
فهرست چکیده 4 مقدمه 6 فصل اول ndash; مفاهیم داده کاوی 9 مدیریت ذخیره سازی و دستیابی اطلاعات 9 ساختار بانک اطلاعاتی سازمان: 10 داده کاوی (Data Mining): 11 مفاهیم پایه در داده کاوی 13 تعریف داده کاوی 14 مراحل فرایند کشف دانش از پایگاه داده ها 16 الگوریتم های داده کاوی 22 آماده سازی داده برای مدل ...