PySpark Eğitimi

Apache Spark Scala programlama dilinde yazılmıştır. Spark ile Python'u desteklemek için Apache Spark topluluğu PySpark adlı bir araç yayınladı. PySpark'ı kullanarak Python programlama dilinde RDD'lerle de çalışabilirsiniz. Py4j adlı bir kütüphane sayesinde bunu başarabilmektedirler. Bu, Veriye Dayalı Belgelerin temellerini kapsayan ve çeşitli bileşenleri ve alt bileşenleri ile nasıl başa çıkılacağını açıklayan bir giriş eğitimidir.

seyirci

Bu eğitim, programlama dili ve gerçek zamanlı işleme çerçevesinde kariyer yapmak isteyen profesyoneller için hazırlanmıştır. Bu öğretici, çeşitli modülleri ve alt modülleri ile birlikte okuyucuları PySpark'a başlama konusunda rahat hale getirmeyi amaçlamaktadır.

Ön şartlar

Bu derste verilen çeşitli kavramlara geçmeden önce, okuyucuların bir programlama dilinin ve çerçevesinin ne olduğunu zaten bildikleri varsayılmaktadır. Buna ek olarak, okuyucuların Apache Spark, Apache Hadoop, Scala Programlama Dili, Hadoop Dağıtılmış Dosya Sistemi (HDFS) ve Python hakkında sağlam bir bilgiye sahip olması çok yararlı olacaktır.