دوره آموزش داده کاوی با زبان برنامه نویسی R


عنوان دوره طول دوره زمان برگزاری تاریخ شروع دوره شهریه استاد وضعیت ثبت نام ثبت نام
دوره آموزش داده کاوی با زبان برنامه نویسی R 11 جلسه 44 ساعت پنج شنبه از ساعت 14:00 الی 18:00
پنج شنبه ۲۳ آبان ۱۳۹۸ 1,180,000 تومان ساره هرمزان

سرفصل و محتوای دوره داده کاوی با زبان برنامه نویسی 


مدت دوره: 44 ساعت

پیشنیاز دوره: ندارد

معرفی دوره:

علوم داده مبحثی به نسبت جدید در علوم کامپیوتر است که از آن به عنوان جذاب ترین شغل در فن آوری اطلاعات در قرن بیست و یکم یاد می شود. متخصصان این حوزه را این گونه تعریف می کنند: کسانی که می دانند چگونه می توان از انبوه اطلاعات ساخت یافته یا بدون ساختار، پاسخ سوالهای کسب وکار را پیدا کرد. در واقع علوم داده رشته نو ظهوری است که به جمع آوری، آماده سازی، تحلیل، بصری سازی، مدیریت و نگهداشت اطلاعات در حجم بالا می پردازد. متخصص علم داده، دانشی کاربردی از تکنیک ها و ابزارهای این رشته به علاوه درک کاملی از تئوری های آن دارد که او را قادر می سازد تشخیص دهد که چه چیزی از نظر علمی ممکن است.

مشاهده رزومه استاد

    مخاطبین دوره: مهندسان و دانشمندان و تمام علاقه مندان به حوزه علوم داده و داده کاوی


سرفصل های دوره:

   مقدمه ای بر برنامه نویسی در R

            - نصب R و پکیج های مرتبط
       - انواع داده ها
       - انواع عملگرها
       - ساختار های کنترلی
        توابع در R 

 مبانی و مفاهیم داده کاوی

           - مقدمه ای بر داده کاوی (Introduction to Data Mining)
      - پاکسازی و پیش پردازش داده ها(Data Cleansing and Preprocessing)
      - مدلسازی (Modeling)

                   الگوریتم های رده بندی (Classification Algorithms)

                   الگوریتم های رگرسیون (Regression Algorithms)

                   الگوریتم های خوشه بندی (Clustering Algorithms)

                   الگوریتم های کشف الگوهای مکرر و قواعد انجمن    (Frequent Pattern & Association Rules Mining Algorithms)

                   روش های یادگیری جمعی (Ensemble Learning)

         - آشنایی با روش های مختلف ارزیابی مدل ها (Evaluation Methods)


پیاده سازی مراحل داده کاوی در R

          - پیش پردازش داده ها (Data Preprocessing)
     - رده بندی و رگرسیون (Classification and Regression)

                       درخت تصمیم (Decision Tree) 

                       بیز ساده (Naïve Bayes) 

                       شبکه عصبی پرسپترون چند لایه(Multi Layers Perceptron)

                       ماشین بردار پشتیبان (Support Vector Machine)

                       نزدیک ترین همسایگی (K-Nearest Neighbors)

                       رگرسیون خطی (Linear Regression)

                       رگرسیون لجستیک (Logistic Regression)

                       روش های یادگیری تجمعی (Ensemble Learning)


         - خوشه بندی (Clustering)

                    الگوریتم K-means

                    الگوریتم  DBSCAN


        - کشف الگوهای مکرر و قواعد انجمنی (Frequent Patterns Discovery & Association Rules Mining)

                   الگوریتم Apriori

                   الگوریتم Fp-growth


       - روش های ارزیابی مدل ها (Evaluation)

                   ارزیابی مدل های رده بندی

                   ارزیابی مدل های رگرسیون

                   ارزیابی مدل های خوشه بندی

                   ارزیابی الگوهای پر تکرار و قواعد انجمنی