هزینه آموزش
۱۷,۰۰۰ تومان

آموزش تخمین خطای طبقه بندی یا Classifier Error Estimation

آموزش تخمین خطای طبقه بندی یا Classifier Error Estimation

تعداد دانشجو
۱,۰۴۱ نفر
مدت زمان
۱ ساعت و ۴۹ دقیقه
هزینه آموزش
۱۷,۰۰۰ تومان
محتوای این آموزش
۱۰ بازخورد (مشاهده نظرات)
آموزش تخمین خطای طبقه بندی یا Classifier Error Estimation

تخمین خطای کلاسیفایر (Classifier Error Estimation) اگر مهم ترین بخش طراحی یک کلاسیفایر (Classifier - طبقه بندی کننده) نباشد، قطعا یکی از مهم ترین قسمت های این فرایند است. به عنوان مثال فرایند انتخاب ویژگی (Feature Selection) بدون داشتن یک تخمین گر خطا (Error Estimator) مناسب یک روند عبث خواهد بود. به خاطر همین اهمیت بسیار بالا، در این فرادرس ما به موضوع تخمین خطای کلاسیفایر می پردازیم و در طی آن روش هایی همانند: تخمین گر Resubstitution، تخمین گر Cross-Validation، تخمین گر Leave-One-Out، تخمین گر Bootstrap را مورد بررسی قرار داده و نقاط ضعف و قوت هر یک را بیان می کنیم.

آموزش تخمین خطای طبقه بندی یا Classifier Error Estimation

تعداد دانشجو
۱,۰۴۱ نفر
مدت زمان
۱ ساعت و ۴۹ دقیقه
هزینه آموزش
۱۷,۰۰۰ تومان
محتوای این آموزش
۱۰ بازخورد (مشاهده نظرات)
مدرس
دکتر اسماعیل آتشپز گرگری

دکتری تخصصی مهندسی برق

دکتر اسماعیل آتشپز گرگری دانش آموخته دکتری مهندسی برق از دانشگاه Texas A&M است. ایشان سابقه همکاری با مراکز طراز اول بیوانفورماتیک، پردازش سیگنال های ژنومیک و کار در لبه علم و تکنولوژی این حوزه را دارند. ایشان در حال حاضر به عنوان عضو هیات علمی در دانشگاه National در ایالات متحده آمریکا به تدریس و پژوهش مشغول هستند.

توضیحات تکمیلی

مقدمه - هدف و اهمیت تخمین خطا

تخمین خطای کلاسیفایر (Classifier Error Estimation) اگر مهم ترین بخش طراحی یک کلاسیفایر (Classifier - طبقه بندی کننده) نباشد، قطعا یکی از مهم ترین قسمت های این فرایند است. یک طبقه بندی کننده بدون داشتن تخمین درست از خطای آن، همانند داشتن یک فرد با ادعای مهارت بالا در پزشکی است در حالی که صلاحیت او توسط هیچ منبع ارزش گذاری و ارزیابی علمی مورد تایید قرار نگرفته است. چنین فردی حتی اگر در واقع، پزشک حاذقی باشد،‌ در عمل فردی نخواهد بود که افراد عادی، تصمیم در مورد سلامت خود را به تشخیص و عمل او بسپارند. در یک مثال دیگر، داشتن فرایند طبقه بندی بدون توجه به ظرافت های تخمین خطا، همانند به پیش بردن فرایند رانندگی یک اتومبیل با چشمان بسته (و در شرایط بدتر با ذهن به هم ریخته) است. تشخیص تصادفی (یک طبقه بندی کننده طراحی نشده و صرفا تصادفی) «با احتمال زیاد» اشتباه خواهد بود. اما تشخیص اشتباه (یک طبقه بندی کننده طراحی شده برای داشتن خطای بالا) «قطعا» اشتباه خواهد بود.

تخمین خطای طبقه بندی کننده در تمام مراحل و مسائل مرتبط با طبقه بندی، نقش حیاتی بازی می کند. به عنوان مثال فرایند انتخاب ویژگی (Feature Selection) بدون داشتن یک تخمین گر خطا (Error Estimator) مناسب یک روند عبث خواهد بود.

عدم پرداخت مناسب و شایسته به تخمین خطا در مقالات علمی

در عین چنین اهمیتی،‌ متاسفانه در بسیاری از مقالات حوزه پزشکی و بیوانفورماتیک که دارای به ظاهر جذاب ترین الگوریتم ها و فلوچارت های مرتبط با یافتن ویژگی و رسیدن به بایومارکر (نشانگر زیستی - Biomarker) هستند،‌ معمولا از روی مهم ترین بخش مسیر کاری خود که همانا بلوک تخمین خطا است، بدون توجه کافی، عبور می شود. از این جهت است که در عین صرف میلیون ها دلار در تحقیقات مرتبط با سلامت، ما بهبود در مناسب در این مسیر را شاهد نبوده ایم و هنوز موفق ترین بایومارکرهای مرتبط با سلامت دارای Specificity پایین می باشند. این پایین بودن Specificity در ادامه باعث ایجاد میلیون ها دلار اتلاف هزینه در بخش سلامت می شود.

نداشتن تخمین درست از خطا تنها عامل در شکست فرایندهای مختلف مرتبط با طبقه بندی نیستند، اما بی شک یکی از مهم ترین عوامل به شمار می رود و به خاطر همین اهمیت بسیار بالا، در این فرادرس ما به موضوع تخمین خطای کلاسیفایر می پردازیم.

ساختار ارائه موضوع در این فرادرس

در این فرادرس، در ابتدای بحث، به خود موضوع تخمین خطا و اهمیت آن اشاره می شود. در ادامه می بینیم که بایاس و واریانس یک تخمین گر خطا چگونه نمایشی کمی و خلاصه شده از کیفیت آن را به ما می دهد و این که چگونه این دو فاکتور به صورت یکجا و واحد خود را در RMS مرتبط با یک تخمین گر نشان می دهند. در ادامه به مفهوم فاکتورهای تصادفی درونی (Internal Random Factors) و تفاوت تخمین گر Randomized و Non-Randomized اشاره خواهد شد و این که چگونه تخمین گرها در یکی از این دو دسته قرار می گیرند. پرداختن به تخمین گر Holdout و ویژگی های آن موضوع ادامه بحث است.

همان طور که می دانیم تخمین گر Holdout در زمان هایی که داده کافی وجود داشته باشد، انتخاب مناسب و کارایی هستند. اما مشکل این تخمین گر زمانی خود را نشان می دهد که ما با کمبود در داده مواجه هستیم. به عبارت دیگر مساله طبقه بندی ما یک مساله با تعداد داده کم (Small Sample Problem)‌ است (موضوع بسیاری از مسائل حوزه سلامت). این جا است که نیاز به روش هایی که استفاده بهینه تری از داده ها دارند، ایجاد و مطرح می شود و این نقطه شروع بحث روی روش های دیگر تخمین خطا همانند تخمین گر Resubstitution، تخمین گر Cross-Validation، تخمین گر Leave-One-Out، تخمین گر Bootstrap خواهد بود. در ادامه تک تک این روش های مورد بررسی قرار گرفته و نقاط ضعف و قوت هر یک بیان می شود. نتیجه گیری و خلاصه سازی بحث، آخرین قسمت از این فرادرس را تشکیل می دهد.

توجه: در این فرادرس به مباحث تئوری مرتبط با هر روش تخمین خطای کلاسیفایر پرداخته شده و به نحوه پیاده سازی و کدنویسی هر یک از آن ها اشاره می شود. اما کدنویسی و پیاده سازی در قالب نوشتن کد هر یک از روش ها جزو اهداف آموزشی این فرادرس نمی باشد.

فهرست سرفصل ها و رئوس مطالب مطرح شده در این مجموعه آموزشی، در ادامه آمده است:
  • مقدمه
    • اهمیت مساله تخمین خطا
  • مفاهیم و تعاریف اولیه
    • تعریف تخمین خطا
    • واریانس و بایاس در تخمین
    • RMS
    • فاکتورهای تصادفی درونی
    • تخمین گر Randomized و Non-Randomized
    • تعادل میان بایاس، واریانس و پیچیدگی محاسباتی
  • تخمین گر Holdout
    • اشاره به مزایا و معایب
  • تخمین گر Resubstitution
  • تخمین گر Cross-Validation
  • تخمین گر Leave-One-Out
  • تخمین گر Bootstrap
    • اصول Bootstrap Resampling
    • تعریف تخمین خطای بوت استرپ
    • معایب و مزایا
  • خلاصه و نتیجه گیری
مشاهده بیشتر مشاهده کمتر

آنچه در این آموزش خواهید دید:

آموزش ویدئویی مورد تائید فرادرس
فایل PDF یادداشت‌ های ارائه مدرس



پیش نمایش‌ها

۱. آموزش تخمین خطای طبقه بندی یا Classifier Error Estimation

توجه: اگر به خاطر سرعت اینترنت، کیفیت نمایش پایین‌تر از کیفیت HD ویدئو اصلی باشد؛ می‌توانید ویدئو را دانلود و مشاهده کنید (دانلود پیش‌نمایش - حجم: ۸۰ مگابایت -- (کلیک کنید +))

راهنمای سفارش آموزش‌ها

آیا می دانید که تهیه یک آموزش از فرادرس و شروع یادگیری چقدر ساده است؟

(راهنمایی بیشتر +)

در مورد این آموزش یا نحوه تهیه آن سوالی دارید؟
  • با شماره تلفن واحد مخاطبین ۵۷۹۱۶۰۰۰ (پیش شماره ۰۲۱) تماس بگیرید. - تمام ساعات اداری
  • با ما مکاتبه ایمیلی داشته باشید (این لینک). - میانگین زمان پاسخ دهی: ۳۰ دقیقه


اطلاعات تکمیلی

نام آموزش آموزش تخمین خطای طبقه بندی یا Classifier Error Estimation
ناشر فرادرس
شناسه اثر ۸–۱۲۴۵۲–۰۴۹۶۲۷ (ثبت شده در مرکز رسانه‌های دیجیتال وزارت ارشاد)
کد آموزش FVML9403
مدت زمان ۱ ساعت و ۴۹ دقیقه
زبان فارسی
نوع آموزش آموزش ویدئویی (لینک دانلود)
حجم دانلود ۲۱۴ مگابایت (کیفیت ویدئو HD‌ با فشرده سازی انحصاری فرادرس)


نظرات

تا کنون ۱,۰۴۱ نفر از این آموزش استفاده کرده اند و ۱۰ نظر ثبت شده است.
شکوفه
شکوفه

تدریس بسیار عالی مفید بود. باتشکر

سارینه
سارینه

اینکه همه مطالب و خطاها به صورت مقایسه ای بیان شده است، خیلی عالی است. آموزش جامع بود. متشکرم.

پويا شريعت
پويا شريعت

لطفا در کنار فیلم آموزشی جزوه را نیز ارائه دهید. آموزش خوبی بود. موفق باشید.

روابط عمومی
روابط عمومی

با سلام مخاطب گرامی؛

فایل pdf یادداشت های مدرس در حین آموزش، در پوشه notes ضمیمه آموزش می باشد.
پس از دانلود و اکسترکت کردن فایل آموزش، این پوشه را بیابید.

موفق و پیروز باشید.

نغمه کریمی یان
نغمه کریمی یان

نحوه تدریس بسیار عالی بود.

امید
امید

برای یاد آوری و جمع بندی دانسته ها عالی بود و حاوی نکات جدیدی بود. اگر اموزش ها پروژه محور باشن و کاربردی مفید تر خواهند بود.

جواد میرنظری
جواد میرنظری

سلام. اگه امکانی فراهم کنید با اساتید در ارتباط باشیم عالی میشود.

ناهید خیل فرهنگ
ناهید خیل فرهنگ

برای انجام پروژه ام برای بسیار مفید واقع شد. می توانست بخش پیشرفته تر هم داشته باشد.

علیرضا
علیرضا

با سلام و عرض ادب.
این آموزش فوق العاده بود، من خیلی توی مسئله ی bias - variance tradeoff گیج بودم که الان کاملا ابهاماتم برطرف شد. فقط یه خواهشی که داشتم ای کاش آقای دکتر لطف می کردن در مورد جایگاه روش های regularization و انواع اون هم توضیحاتی میدادن(L1 و L2) و اینکه تاثیر استفاده از اون ها در تخمین گرهای خطا به چه شکل هست.
با تشکر و تقدیم احترام.

روابط عمومی فرادرس
روابط عمومی فرادرس

سلام.

تشکر از بیان نظرتان.

این موضوع به مدرس این فرادرس منتقل می شود.

امیدواریم که در آینده موضوع پیشنهادی شما نیز بتواند به سرفصل های فرادرس اضافه گردد.

موفق باشید
روابط عمومی فرادرس


برچسب‌ها:
Bias | Biomarker | Bootstrap Error Estimator | Classifier | Cross-Validation | Cross-Validation Error Estimator | Error Estimation | Error Estimator | Feature Selection | Hold-out Error Estimator | Holdout | Holdout Error Estimator | Internal Random Factors | Leave-One-Out Error Estimator | Non-Randomized Error Estimator | Pattern Recognition | Randomized Error Estimator | Resubstitution | Resubstitution Error Estimator | RMS | Root-Mean-Square | Small Sample Problem | supervised learning | variance | اصول Bootstrap Resampling | انتخاب ویژگی | بازشناسی الگو | بایاس، واریانس و پیچیدگی محاسباتی تخمین گر | بایومارکر | بیومارکر | تخمین خطا | تخمین گر Bootstrap | تخمین گر Cross-Validation | تخمین گر Holdout | تخمین گر Leave-One-Out | تخمین گر Non-Randomized | تخمین گر Randomized | تخمین گر Resubstitution | تعداد داده کم | تعریف تخمین خطا | تعریف تخمین خطای بوت استرپ | طبقه بندی | فاکتورهای تصادفی درونی | کلاس بند | کلاسبند | کلاسبندی | کلاسیفایر | کلسیفایر | نشانگر زیستی | وارایانس و بایاس در تخمین خطا | یادگیری با ناظر
مشاهده بیشتر مشاهده کمتر
فهرست جلسات ۱ جلسه ویدئویی ×