Big Data esencial - Python

Python para Data Science y Big Data esencial

LinkedIn es una red social que nace con el objetivo de poner en contacto a empresas y profesionales que buscan sinergias laborales y nuevas oportunidades de negocio, mediante una red de relaciones comerciales denominadas “conexiones”.

Esta red cuenta con una gran comunidad social, muy útil para las empresas, negocios que buscan nuevo talento humano, y por supuesto, para las personas que se encuentran en búsqueda de un empleo. Todo esto gracias a la introducción de fichas personales de cada persona a modo de currículum vitae, donde se comparte la formación y experiencia laboral.

Python para Data Science y Big Data esencial

Detalles del curso

Python está viviendo una segunda juventud como lenguaje de programación, ajustado codo con codo a una de las grandes necesidades de ésta década: el trabajo con grandes volúmenes de datos. En este curso, vas a aprender en primer lugar los fundamentos de Python para Data Science y visualización de datos, para posteriormente aplicarlos en el análisis de grandes volúmenes de datos usando el entorno Spark, una de las herramientas más populares del sector Big Data. El contenido del curso es práctico. Vamos a sentar las bases para que aprendas a desarrollar tu proyecto de datos, de principio a fin.

Contenido

Bienvenida

Python para data science y big data esencial

1. Introducción a Python para data science y big data

Evaluación de las necesidades de big data

Instalar Jupyter Notebook

Instalar PySpark

Evaluar la eficiencia del código

2. Gestión de datos en Python

Introducción al Pandas

Filtrar datos en Python

Transformaciones de la base de datos

Groupby: obtener información esencial

Tratar datos duplicados y perdidos

Introducción a la librería Numpy

3. Gestión de datos avanzada

Correlaciones. Entender las relaciones entre las variables

Test de la Chi-Cuadrado

Análisis de datos extremos

Principios de las bases de datos relacionales

Transformar un dataframe en una base de datos relacional

Joins. Trabajar con bases de datos relacionales

Paralelizar loops en Python

4. Visualización de datos en Matplotlib

Introducción al Matplotlib

Modificar elementos del gráfico en Matplotlib

Etiquetas y leyendas en Matplotlib

Gráficos para series temporales en Matplotlib

Histogramas y box plots en Matplotlib

Nubes de puntos y mapas de calor en Matplotlib

Introducción al Plotly. Visualización interactiva

Gráficos avanzados con Plotly

Visualización de Mapas con Plotly

5. Machine Learning esencial: Clustering

Necesidades de Machine Learning: clustering y modelización

Preparar los datos para Machine Learning

K-Means, el algoritmo de clustering

El algoritmo hierarchical clustering

6. Machine Learning esencial. Modelización

Regresión lineal

Regresión logística

Naives Bayes Classifier

Árboles de clasificación y regresión

Random forest

Support vector machine

K-Nearest Neighbours

7. Trabajar con PySpark

Introducción a PySpark

Sintaxis en PySpark. Qué necesitamos saber

Qué son los RDD (Resilient Distributed Databases)

Funciones lambda

Dataframes en PySpark

Transformaciones básicas en PySpark

Acciones básicas en PySpark

Operaciones numéricas con RDD

8. PySpark avanzado

Joins en PySpark

Acumuladores. Cómo detectar patrones en nuestros datos

Cómo construir funciones map

Cómo construir funciones reduce

Ejemplos básicos de MapReduce en PySpark

9. Desafío y solución: MapReduce

Desafío: MapReduce aplicado con PySpark

Resolución de los ejercicios de MapReduce

Obtén un certificado que puedes compartir

Comparte lo que has aprendido y destaca como profesional en el sector deseado con un certificado que muestra los conocimientos obtenidos en el curso.

LEARNING - Certificado de finalización

Añádelo a tu perfil de LinkedIn en la sección «Licencias y certificaciones»

Descárgalo o imprímelo como PDF para compartirlo con otras personas

Compártelo como imagen para mostrar tus aptitudes



Nuestra tarea es centralizar la mayor cantidad de cursos ,capacitaciones, tutoriales, videos para que te sea mas fácil de buscar a la hora de querer capacitarte.
Generalmente, incorporamos los que son gratis pero si encontramos algunos interesantes que son pagos los agregamos para que tu capacitación sea mas redituable y profesional.
Sigue capacitándote para llegar a ser un mejor profesional o simplemente por logros personales, anímate, no abandones y adelante !!!.
Mucha Suerte !!! el equipo de: