دوره آموزش Advanced Big Data Analytics


عنوان دوره طول دوره زمان برگزاری تاریخ شروع دوره شهریه استاد نوع برگزاری وضعیت ثبت نام ثبت نام فیلم جلسه اول
Advanced Big Data Analytics 15 جلسه 45 ساعت دوشنبه از ساعت 17:30 الی 20:30
چهارشنبه از ساعت 17:30 الی 20:30
دوشنبه 02 تیر 1404 11,250,000 تومان مهندس حسن احمدخانی آنلاین دانلود

سرفصل و محتوای دوره ی مباحث پیشرفته در تحلیل کلان داده با معماری مدرن

Advance big data analytics with modern architecture - from batch to streaming

 

 

معرفی و هدف دوره :

دوره آموزشی مباحث پیشرفته در تحلیل داده های کلان که با تمرکز بر پردازش جریان داده طراحی شده، ابزار ها و تکنیک های پردازش جریان داده بررسی خواهند شد.

هدف این دوره آموزشی بررسی مباحث پیشرفته در حوزه دیتا و big data جهت احراز نیازمندی های مشاغل

-          Data Engineer

-           Data Scientist

-           Analytics Engineer

 می باشد.

Course content at a glance:

Kafka and streaming advances – 6 hours

Java SE basics for Flink readiness – 12 hours

Real-time stream processing with Apache Flink – 15 hours

Data transformation with data build tool(dbt) – 3 hours

      Machine learning and advance analytics with Spark ML – 6 hours

Data governance and quality in practice – 3 hours

                                   

 

مشاهده رزومه مدرس

طول دوره : 45 ساعت

پیش نیاز دوره : 

-          دوره آموزشی Applied Big Data Fundamentals یا دو سال سابقه کاری در زمینه بیگ دیتا

-          آشنایی با یک زبان برنامه نویسی

Course content, details:

1.    Kafka and streaming advances – 6 hours

Real-time data pipeline development with kafka connect

Stream processing with ksqlDB

ksqlDB features, limitations and best practices

Transactional producers

Kafka tired storage

Dead letter queues and exception handling

2.    Java SE basics for Flink readiness– 12 hours

Java history and why Java for streaming

Introduction to Java & Setup

Development environment setup

Building the project

Maven overview

Core Syntax & Data Types

Control Flow & Methods

Classes & Objects

Inheritance & Polymorphism

Encapsulation & Packages

Exception Handling

Debugging & Logging

Java Collections Framework

Generics

Java I/O Basics

Multithreading & Concurrency

Lambdas, functional interfaces

Streams API

Networking Basics

Serialization

Annotations & Reflection

3.    Real-time stream processing with Apache Flink – 15 hours

Stream processing with industry gold standards

Apache Flink overview

DataStream API

Table and SQL API

Flink SQL

Data sources and sinks

Flink kafka source and sink

Flink Clickhouse sink

Flink MongoDB sink

Flink ScyllaDB sink

Flink Iceberg sink

Stateless operations

Stateful operations

Checkpointing and exactly-once delivery

Handling of time

State recovery

4.    Data transformation with data build tool(dbt) – 3 hours

dbt essentials and features

dbt resources and project structure

Building transformation DAGs

dbt Spark adapter

dbt Trino adapter

dbt Flink adapter

5.    Machine learning and advance analytics with Spark ML – 6 hours

Machine learning and ML in distributed manner

ML algorithms in Spark ML

Spark ML pipelines

Case studies and examples for clustering, classification and recommendation

Deep learning with Spark

RAG and LLM essentials

Vector DB

Spark NLP and LLM

Model deployment

6.    Data governance and quality in practice – 3 hours

Data quality management essentials

Data completeness, accuracy, consistency, validity, uniqueness in practice

Why data governance matters

DAMA DMBOK and data governance knowledge areas

GDPR and CCPA in practice