وبینار معرفی فناوری های نوین برای مهندسی داده و علوم داده
موضوع این وبینار در مورد چیست؟
در دنیای امروز، حجم دادهها با سرعت بسیار زیادی در حال افزایش است و این امر به معنای اهمیت طراحی، توسعه و مدیریت سیستمهای جمعآوری، ذخیره، پردازش و تحلیل دادهها است. با استفاده از مهندسی داده، میتوان دادههای ذخیره شده در سیستمهای مختلف را جمعآوری و تحلیل کرد. با توجه به حجم بزرگ دادهها، برخی از الگوریتمها و روشهای پردازشی در مقیاس بزرگ بسیار سخت و پیچیده هستند، از این رو، استفاده از فناوریهای مهندسی داده یک پیشنیاز اساسی برای ایجاد امکان به کار گیری روش های هوش مصنوعی و یادگیری ماشین است. به عنوان مثال، در صنعت حمل و نقل، دادههای جمعآوری شده در مورد ترافیک که به صورت پیوسته و آنلاین تولید میشوند که نشان دهنده شرایط جاده هستند نیاز به جمع آوری و پردازش و تحلیل دارند تا بتوان از آن ها برای بهینهسازی مسیر و زمان سفر استفاده کرد. همچنین، در زمینه پزشکی، دادههای جمعآوری شده در مورد بیماریها و شیوع آنها میتواند به عنوان اطلاعات مفید برای پیشگیری و مدیریت بیماریها استفاده شود. که به دلیل حجم گسترده داده ها که به صورت پیوسته تولید میشوند جمع آوری و پردازش آن ها پیچیدگی بالایی دارد.
مدرسین دوره
مباحث وبینار
1. معرفی مهندسی داده وفناوری های نوین در زمینه مهندسی داده
2. معرفی ابزار های مهندسی داده مانند Apache Hadoop, Apache Spark, Apache Kafka, Apache Cassandra
3. معرفی Datawarehouse و Datalake و تفاوت آن ها با دیتا بیس ها
4. معرفی پایپ لاین (Pipeline) داده ومفاهیم ETL و ELT و MLOps
5. معرفی ابزار های مهندسی داده در بستر ابری (Cloud-native)
6. تکنیک های پردازش بی درنگ داده ها (Real-time-data-processing)
7. معرفی مفاهیم اساسی پردازش و علوم داده شامل مدل های Descriptive , Predictive , Prescriptive
8. نحوه طراحی پایپلاین داده با توجه به مشخصات و نیاز های اپلیکیشن و ارائه چند مثال مختلف