Python for Data Mining


عنوان دوره طول دوره زمان برگزاری تاریخ شروع دوره شهریه استاد نوع برگزاری وضعیت ثبت نام ثبت نام فیلم جلسه اول
Python for Data Mining 12 جلسه 36 ساعت سه شنبه از ساعت 17:30 الی 20:30
سه شنبه ۱۰ مهر ۱۴۰۳ 3,700,000 تومان دکتر حمیدرضا حداد حضوری و آنلاین -

سرفصل‌ها و محتوای آموزشی دوره داده‌کاوی با پایتون



پیش‌نیاز دوره: آشنایی با زبان برنامه‌نویسی پایتون، کتابخانه‌های تخصصی تحلیل داده در پایتون


مشاهده رزومه استاد دوره : دکتر حمیدرضا حداد

طول دوره: 36 ساعت

 

سرفصل دوره:

مقدمه‌ای گذرا بر مفاهیم برنامه‌نویسی پایتون (3 ساعت)

حلقه‌های شرطی و منطقی

انواع داده‌ساختار

دسترسی و مدیریت فایل

ساخت تابع

Numpy

MatplotLib

Pandas

 

پاکسازی و پیش‌پردازش داده‌ها در پایتون (6 ساعت)

استانداردسازی

نرمالسازی

سناریوهای مختلف در مواجهه با داده‌های بدون مقدار

روش‌های گوناگون انتخاب ویژگی

روش بازگشتی

روش تعیین ارزش برای هر ویژگی

استفاده از مدل‌های یادگیری ماشین

مبتنی بر رگرسیون

تغییر ساختار و ماهیت داده

استفاده از Encoding

تغییر توزیع داده‌ها به کمک ترانسفرمرها

مهندسی معیارها و ساخت ویژگی‌های جدید

خودکارسازی فرآیند پاکسازی با Pipeline

رویکرد کاهش ابعاد و تبیین تفاوت آن با انتخاب ویژگی

LDA

PCA

SVD


مدلسازی (6 ساعت)

الگوریتمهای دسته‌بندی

الگوریتم‌های رگرسیون

الگوریتم‌های کشف الگو

APriori

Fp-frowth  

روش‌های یادگیری جمعی

Bagging  

Boosting 

Voting     

Stacking 

XGBoost

LightGBM 

CatBoost

خوشه‌بندی

K-Means

DBSCAN

 

روش‌های نمونه‌گیری (1 ساعت)

Train Test Split

KFold cross validation

Leave One Out

Shuffle Train Test

معیارهای گوناگون ارزیابی عملکرد مدل‌ها (2 ساعت)

معیارهای مسائل دسته‌بندی

معیارهای مسائل رگرسیون

 

مفهوم Spot Checking (9 ساعت)

پیادهسازی مسائل داده‌کاوی با پروژه‌های کاربردی:

پرسپترون چند لایه

لجستیک رگرسیون

LDA

روش نزدیکترین همسایگی

Naive bayes

درخت تصمیم‌گیری

بردارهای ماشین پشتیبان

رگرسیون خطی

رگرسیون Ridge

رگرسیون لاسو

خودکارسازی مدل طراحی شده به کمک مفهوم Pipeline ( 3 ساعت)


تنظیم پارامتر و نقش آن در بهبود عملکرد مدل داده‌کاوی (2 ساعت)


ذخیره و لود مدل ساخته شده ( 1 ساعت)


مقدمه‌ای بر تحلیل سری‌های زمانی بر اساس کاربرد واقعی آن در داده‌های مالی (3 ساعت)