bd_gdc
Big Data Aplicado
UT02: Almacenamiento distribuido. HDFS
PR0201: Instalación de Hadoop en modo pseudo-distribuido
PR0202: Uso del cliente HDFS
PR0203: Uso de cliente HDFS(2)
UT04: Procesamiento distribuido con MapReduce
PR0401: Contando palabras
PR0402: Datos del clima
PR0403: Análisis de logs con MapReduce
UT05: Procesamiento distribuido con Spark
PR0501: Carga de ficheros CSV en PySpark
PR0502: Manipulación básica de dataframes
PR0503: Limpieza de datos sobre dataset de cultivos
PR0504A: Limpieza de datos sobre dataset de lugares famosos
PR0504B: Limpieza de datos sobre dataset alojamientos turísticos
UT06: Almacenamiento distribuido con s3
PR0601: Capa bronce en Amazon AWS
PR0602: AWS Lambda