از مهم ترین تکنیک های عملی داده کاوی که کاربرد زیادی در علوم مختلف دارد به خوشه بندی تفکیکی می توان اشاره کرد که با توجه به روش های گوناگونی مانند: k-میانگین، k-میانه و …قابل پیاده سازی است. با توجه به بار محاسباتی زیاد این روش ها، برای کلان داده ها از روش هایی با بار محاسباتی کمتر (مانند الگوریتم CLARA) آشنا شده و از آن استفاده می کنیم. در این راستا بسته های مختلفی در نرم افزار R گنجانده شده است که قابلیت انجام این گونه محاسبات را دارد و به محققین در تحلیل خوشه بندی تفکیکی کمک شایان می کند. هدف از این فرادرس، خوشه بندی معرفی شده و خوشه بندی تفکیکی و روش های مختلف آن که براساس مثال، اجرا می شود.
فهرست سرفصل ها و رئوس مطالب مطرح شده در این مجموعه آموزشی، در ادامه آمده است:
- درس یکم: مبانی خوشه بندی
- انواع داده ها و شیوه اندازه گیری فاصله برای داده های کمی و کیفی
- آشنایی با مفهوم خوشه بندی و معرفی روش های آن
- معرفی خوشه بندی k-means و خصوصیات آن
- تحلیل کارایی خوشه بندی k-means
- درس دوم: خوشه بندی تفکیکی در R
- آشنایی با محیط R و RStudio
- استفاده از بسته های STAT ,Cluster و همچنین Factoextra برای خوشه بندی و نمایش خوشه ها
- خوشه بندی k-means
- تعیین تعداد خوشه های مناسب برای داده ها به روش ساده
- خوشه بندی PAM) Partitioning around Medoids)
- تعیین تعداد خوشه های مناسب برای داده ها
- نمایش تصویری خوشه بندی تفکیکی
- درس سوم: خوشه بندی کلان داده ها
- معرفی الگوریتم CLARA
- اجرای خوشه بندی تفکیکی به کمک الگوریتم CLARA
- تعیین تعداد خوشه های مناسب برای داده ها
- نمایش تصویری خوشه بندی تفکیکی
مفید برای رشته های
- آمار
- مهندسی صنایع
m.eslami46@gmail.com :
سلام
من این آموزش را در طرح افطاری به صورت رایگان دریافت کردم. خوشه بندی از مفاهیم و کاربرد های مهم در زمنیه ی هوش است. و زبان R پس از پایتون یکی از زبان های توصیه شده برای بچه های علاقمند به این حوزه است. در این آموزش مدرس هم مفاهیم را از روی اسلاید توضیح می دهد و هم در محیط برنامه نویسی RStudio به صورت پروژه محور مثل حل می کند و بخش های مختلف محیط RStudio را هم در صورت نیاز توضیح می دهد.
موفق باشید