عنوان دوره | طول دوره | زمان برگزاری | تاریخ شروع دوره | شهریه | استاد | نوع برگزاری | وضعیت ثبت نام | ثبت نام | فیلم جلسه اول | |
---|---|---|---|---|---|---|---|---|---|---|
Python for Data Mining | 12 جلسه 36 ساعت |
سه شنبه
از
ساعت 17:30
الی 20:30
|
سه شنبه ۱۶ بهمن ۱۴۰۳ | 3,700,000 تومان | دکتر حمیدرضا حداد | آنلاین | دانلود |
سرفصلها و محتوای آموزشی دوره دادهکاوی با پایتون
پیشنیاز دوره: آشنایی با زبان برنامهنویسی پایتون، کتابخانههای تخصصی تحلیل داده در پایتون
مشاهده رزومه استاد دوره : دکتر حمیدرضا حداد
طول
دوره: 36 ساعت
سرفصل دوره:
مقدمهای گذرا بر مفاهیم
برنامهنویسی پایتون (3 ساعت)
حلقههای
شرطی و منطقی
انواع
دادهساختار
دسترسی
و مدیریت فایل
ساخت تابع
Numpy
MatplotLib
Pandas
پاکسازی و پیشپردازش دادهها
در پایتون (6 ساعت)
استانداردسازی
نرمالسازی
سناریوهای
مختلف در مواجهه با دادههای بدون مقدار
روشهای
گوناگون انتخاب ویژگی
روش
بازگشتی
روش
تعیین ارزش برای هر ویژگی
استفاده
از مدلهای یادگیری ماشین
مبتنی بر رگرسیون
تغییر ساختار و ماهیت داده
استفاده از Encoding
تغییر توزیع دادهها به کمک
ترانسفرمرها
مهندسی
معیارها و ساخت ویژگیهای جدید
خودکارسازی
فرآیند پاکسازی با Pipeline
رویکرد کاهش ابعاد و تبیین تفاوت آن با انتخاب ویژگی
LDA
PCA
SVD
مدلسازی
(6 ساعت)
الگوریتمهای دستهبندی
الگوریتمهای رگرسیون
الگوریتمهای کشف الگو
APriori
Fp-frowth
روشهای یادگیری جمعی
Bagging
Boosting
Voting
Stacking
XGBoost
LightGBM
CatBoost
خوشهبندی
K-Means
DBSCAN
روشهای
نمونهگیری (1 ساعت)
Train Test Split
KFold cross validation
Leave One Out
Shuffle Train Test
معیارهای
گوناگون ارزیابی عملکرد مدلها (2 ساعت)
معیارهای
مسائل دستهبندی
معیارهای
مسائل رگرسیون
مفهوم
Spot Checking (9 ساعت)
پیادهسازی
مسائل دادهکاوی با پروژههای کاربردی:
پرسپترون چند لایه
لجستیک رگرسیون
LDA
روش نزدیکترین همسایگی
Naive bayes
درخت تصمیمگیری
بردارهای ماشین پشتیبان
رگرسیون خطی
رگرسیون Ridge
رگرسیون لاسو
خودکارسازی مدل طراحی شده به کمک مفهوم Pipeline ( 3 ساعت)
تنظیم پارامتر و نقش آن در بهبود عملکرد مدل دادهکاوی (2 ساعت)
ذخیره و لود مدل ساخته شده ( 1 ساعت)
مقدمهای بر تحلیل سریهای زمانی بر اساس کاربرد واقعی آن در دادههای مالی (3 ساعت)