سرفصل و محتوای دوره آموزش متن کاوی (Text Mining) و وب کاوی (Web Mining)
طول مدت دوره : 12 ساعت
پیشنیاز دوره: دوره آموزش علم داده با پایتون یا آشنایی با مفاهیم یادگیری ماشین و روش های ارزیابی.
مخاطبین دوره: مهندسان و دانشمندان علوم داده
سرفصل دوره:
وب کاوی (Web Mining)
جمع آوری اطلاعات از وب Web Scrapping
استفاده از APIهای شبکه های
اجتماعی برای جمع آوری اطلاعات تلگرام، توییتر و ...
متن کاوی (Text Mining)
مبانی و مفاهیم متن کاوی
پیش
پردازش و نرمال سازی متن (Text Normalization)
مقدمه ای بر عبارات منظم (Regular Expression)
رده بندی و خوشه بندی متن با
استفاده از الگوریتم های یادگیری ماشین (Text Clustering and Classification)
نمایش
برداری کلمات و تعبیه سازی کلمات (Vector Representation of Words – Word Embedding)
یادگیری عمیق در پردازش زبان طبیعی (Deep Learning in NLP)
تحلیل احساسات (Sentiment Analysis)
تشخیص موجودیت نامدار (Named Entity Recognition)
مدلسازی موضوعی ( Topic Modeling)
متن کاوی فارسی
استفاده از مدلهای زبانی مثل bert