curso Hadoop, Spark, Pyspark

Contáctanos

Programación

Programación

+ Módulos

TEMA 1: Hadoop.

– 1.Introducción y conceptos básicos del ecosistema Hadoop

– 2. Integración de Hadoop en un Entorno de Trabajo

– 3. Herramientas del ecosistema Hadoop

– 4. Administración en casos reales Big Data

– 5.Cloudera y herramientas del ecosistema Hadoop

– 6. Principales componentes de una plataforma Big Data

– 7. Arquitectura batch y streaming. Arquitectura Lambda

– 8. Herramientas del ecosistema Hadoop: Hive, Impala

– 9. Ejercicios prácticos uso Hive y Impala.

TEMA 2: Apache spark.

– 1. Instalación, ejecuciones de aplicaciones y configuración de Apache Spark

– 2. Implementación de algoritmos de map-reduce en Spark

– 3. Apache Spark SQL

– 4. Cluster y HDFS

TEMA 3: Pyspark.

1. Introducción a PySpark: Pandafy: Creación de bases de datos

2. Big Data con Spark: SparkContext. RDDs: Ejecución en paralelo, datos externos, partición de los datos, creación de ficheros, reducebykey, sortbykey, countingbykeys. PySpark SQL & Dataframes

Contáctanos

Executive Program in esports Management