Aparche Spark streaming con Python y PySpark
This post was published 6 years ago. Download links are most likely obsolete. If that's the case, try asking the uploader to re-upload.
Created by Mirror Class, Tao W. | Video: 1280x720 | Audio: AAC 48KHz 2ch | Duration: 03:23 H/M | Lec: 53 | 7.94 GB | Language: Spanish | Sub: Spanish
Agrega Spark Streaming a tu proyectos de Machine Learning y Data Science
What you'll learn
Resumen general de la arquitectura de Apache Spark.
Se capaz de trabajar con la abstracción principal de Apache Spark, RDDs o conjuntos de datos distribuidos y resilientes, para procesar y analizar grandes conjuntos de datos.
Desarrollar aplicaciones Apache Spark 2.0, utilizando transformaciones y acciones en RDD y Spark SQL.
Escalar aplicaciones Spark a un clúster Hadoop YARN a través del servicio Elastic MapReduce de Amazon.
Analizar datos estructurados y semiestructurados utilizando conjuntos de datos (Datasets) y Dataframes, y entender a detalle el funcionamiento de Spark SQL.
Compartir información a través de diferentes nodos en un clúster de Apache Spark, mediante variables de difusión y acumuladores.
Técnicas avanzadas para optimizar y mejorar, trabajos de Apache Spark mediante el particionado, almacenamiento en caché y la persistencia de RDDs.
Buenas prácticas de trabajo con Apache Spark
Requirements
Una computadora con sistema operativo Windows, OSX o Linux
Tener conocimientos previos de programación con Python
Description
De qué trata este curso:
Este curso cubre todos los aspectos fundamentales de Apache Spark streaming con Python, y te enseña todo lo que necesitas saber sobre el desarrollo de aplicaciones Apache Spark.
Al final de este curso, obtendrás un conocimiento profundo sobre Apache Spark streaming, así como habilidades generales de manejo y análisis de big data para ayudar a tu empresa o proyecto a adaptar Apache Spark para la construcción de un pipeline de procesamiento de big data y aplicaciones de análisis de datos.
Este curso sera absolutamente critico para cualquiera que quiera dominar Data Science hoy en día.
¿Qué aprenderás en estas clases?
En particular, aprenderás:
Sobre la arquitectura de Apache Spark.
Como desarrollar aplicaciones Apache Spark streaming con PySpark usando transformaciones RDD, acciones y Spark SQL.
Serás capaz de trabajar con la abstracción principal de Apache Spark, RDDs o conjuntos de datos distribuidos y resilientes (RDD) para procesar y analizar grandes conjuntos de datos.
Técnicas avanzadas para optimizar y mejorar los trabajos Apache Spark al usar particiones, almacenamiento en cache y persistencia de RDDs.
Escalar aplicaciones Spark Streaming para banda ancha y velocidad de procesamiento.
Analizar datos estructurados y semiestructurados utilizando conjuntos de datos (Datasets) y Dataframes, y entender a detalle el funcionamiento de Spark SQL.
Como integrar Spark Streaming con herramientas de computo de clusters tales como Apache Kafka.
Conectar tu Spark Stream con una fuente de datos tal como Amazon Web Services (AWS).
Técnicas avanzadas para optimizar y mejorar, trabajos de Apache Spark mediante el particionado, almacenamiento en caché y la persistencia de RDDs.
Sobre buenas prácticas de trabajo con Apache Spark.
Repaso del ecosistema Big Data
Who this course is for?
Cualquier persona que quiera entender completamente cómo funciona Apache Spark, y cómo se usa Apache Spark en la industria.
Ingenieros de software que deseen desarrollar aplicaciones con Apache Spark 2.0 utilizando Spark Core y Spark SQL.
Científicos de datos o ingenieros de datos que quieran avanzar en su carrera mejorando sus habilidades de procesamiento de Big Data.
Homepage
Screenshots
**If you want to buy or renew premium account , Please buy from below links and support me**
=> visit DazX blog for Udemy courses: DazX Blog
=> visit Creativelive blog for more creativelive courses: Creativelive
=> visit TGC blog for more Greatcourses: Thegreatcourses
Quick check before we show the links
Helps us keep automated scrapers from hammering the filehosts.


