Curso de Responsable Experto Data

¡Inscríbete Gratis!

SKU: FPTO/2023/4310/001-1 Categorías: Cursos Trabajadores/as, Desempleadas/os de Castilla La Mancha, Formación Colegio Mayol

Detalles del curso

Descripción
Información adicional
Temario

Objetivo General:

Dominar el dato para entenderlo, transformarlo y capturar su máximo potencial con inteligencia artificial para optimizar procesos y simplificar el desarrollo de los proyectos y, comenzar con la creación de modelos de machine learning.

Información adicional

Modalidad	Teleformación
Duracion	240h.
Situación Laboral	Desempleados, Trabajadores
Sector	Cualquier sector
Ámbito	Castilla La Mancha
Inicio	Matricula Abierta

Temario

Módulo 1 Introducción: la importancia del dato 6 horas
1. Concienciación en relación a cómo la ciencia del dato afecta a todos los sectores y puede ser el aliado perfecto para el mundo de los negocios.
2. Conocimiento de los diferentes modelos de negocio basado en datos:
Nuevos modelos de negocio en torno al dato.
Tipología de datos y cómo se obtienen.
Maneras de rentabilizar el dato.
Data Business Model Canvas.
3. Adquisición de conocimientos sobre los avances en Big Data & Inteligencia Artificial (IA).
Estado actual.
Posible evolución futura.
4. Dominio de Conceptos básicos:
Qué es Big Data.
Qué es Machine Learning.
Qué es Deep Learning.
5. Concienciación sobre el poder de los datos en las organizaciones tanto para mejorar la toma de decisiones como para crear modelos de negocio basado en datos.
6. Visión trasversal sobre cómo Data Science se aplica en las diferentes áreas de la organización para impulsar las capacidades

Módulo 2 Nociones iniciales de python, data engineering y estadística 24 horas
1. Desarrollo de los fundamentos de Big Data.
Qué es el Big Data.
Perfiles técnicos: Data Analyst, Engineer, Arquitect, QA…
El proceso de construir un proyecto de Big Data.
Arquitecturas de Big Data.
Las claves del éxito del big data.
2. Identificación de los fundamentos de Machine Learning.
Introducción al Machine Learning: Datos, algoritmos, modelos, producción…
Aproximación a los algoritmos: clasificación, predicción y clustering.
Creación de modelos de Machine Learning.
Las claves del aprendizaje automático.
La productivización de modelos.
3. Análisis de los fundamentos de IA: Visión, NPL…
Introducción al Deep Learning y sus aplicaciones.
Tipos de redes neuronales y su entrenamiento.
Funcionamiento y retos del Data Science aplicado al Computer Vision y al NPL.
4. Conocimientos avanzados de Python Crash Course.
Uso de pycharm como entorno de trabajo.
Uso de notebooks.
Conocimiento de la sintaxis del lenguaje: bucles, variables.
Librerías.
Funciones.
Programación orientada a objetos en Python.
5. Aproximación a la arquitectura de la información y al SQL.
Qué es la arquitectura de datos.
Modelo relacional tradicional.
Modelo estrella.
Modelo copo de nieve.
Bases de la normalización de datos.
Definiciones esenciales: base de datos, tablespace, tabla, vista, vista materializada, clave
6. Identificación del Crash course de python para data engineers: SQL y dataframes.
Consulta de datos.
Cruce de tablas.
Inserción y borrado.
Dataframes:
7. Diferenciación entre ETL/ELT y preproceso de datos.
ELT o ETL.
Pipelines de datos.
¿Cómo estructurar los distintos pasos del workflow de datos?
Automatización de procesos.
8. Aplicación del proceso del análisis exploratorio.
Arranque de un proceso exploratorio.
Los objetivos de un análisis exploratorio.
Uso del proceso exploratorio para validación de hipótesis.
Naturaleza iterativa del proceso.
9. Utilización de herramientas de visualización exploratoria y librerías.
Análisis descriptivo gráfico.
Análisis descriptivo basado en estadísticos.
10. Realización de análisis univariante y multivariante.
Análisis multivariante.
Análisis univariante.
11. Conocimiento de la Estadística descriptiva.
Media, mediana, momentos, etc.
Desviación, varianza.
Sesgos y medidas de homogeneidad de la información.
12. Aproximación breve al algebra lineal.
Operaciones matriz-escalar.
Operaciones matriz-matriz.
Propiedades de las matrices: no conmutativa, asociativa, distributiva, matriz identidad.
Trasposición e inversa de una matriz.
13. Análisis de correlación de variables: fundamentos de estadística y probabilidad.
Ingeniería de características: descarte y selección de características.
Cómo analizar la correlación entre variables.
Efecto de las correlaciones.
Eliminación de la correlación.
14. Deducción estadística y contraste de hipótesis.
Definición de una distribución una variable aleatoria.
Definición de una función de probabilidad.

Módulo 3 Conocimiento avanzado de machine learning & artificial intelligence 100 horas
1. Aproximación a la modelización.
Introducción a la modelización.
Tipos de modelos.
2. Identificación de los Modelos de regresión.
Modelos de regresión simple.
Modelos de regresión múltiple.
Modelos de regresión generalizado.
3. Clasificación de los distintos modelos de Árboles: .
Modelos de inferencia de árboles de decisión y regresión:
4. Conocimientos de Algoritmos alternativos de clasificación.
5. Conocimientos de Eager y Lazy classifiers
6. Utilización de Clustering.
Introducción a los modelos no supervisados.
Análisis clúster.
7. Aproximación al método científico:
Evaluación de modelos.
8. Evaluación y optimización de modelos:
Control de outliers y análisis de residuos.
Modelos no supervisados.
Modelos supervisados.
9. Creación de Ingeniería de variables:
Principios de la ingeniería de variables en la creación de variables.
La dimensionalidad.
Técnicas: PCA y SVD.
10. Ensamblado de modelos:
Definición de model ensembles.
Modelos débiles y modelos fuertes.
Creación de pipelines para crear modelos ensamblados.
11. Gestión del ciclo de vida de los modelos.
12. Interpretabilidad.
13. Aproximación a modelos heurísticos de optimización.
14. Conocimiento de los algoritmos genéticos.
Principios de optimización basado en heurísticos.
Gradiente descendente.
Modelos basados en comportamientos animales.
El algoritmo genético.
Aplicaciones de los algoritmos genéticos.
Cromosoma y función de fitness.
Resolución de un problema usando algoritmos genéticos.
15. Utilización de series temporales y forecasting.
Bases sobre componentes de las series temporales: tendencia, ciclo y estacionalidad.
Series estacionarias y no estacionarias.
Análisis de anomalías.
Suavizado exponencial.
Modelos autoregresivos.
Modelos univariantes y multivariantes.
Modelos arima.
Modelos con parametrización automática.
16. Gestión de proyectos de Data Science.

Módulo 4 Aplicaciones del deep learning 36 horas
1. Aproximación a redes neuronales artificiales (ANN).
¿Qué es una red neuronal artificial?
Tipos de redes: profundas y superficiales (shallow).
Técnica del gradiente descendiente.
2. Conocimiento de los campos de aplicación de ANN.
Visión por computador.
Análisis y síntesis del lenguaje.
Análisis de secuencias.
GAN y deepfake.
3. Aproximación al Shallow & Deep neural networks. Introducción CNN.
Perceptrón simple.
Topologías de redes neuronales.
MNIST.
Regularización: L1, L2, dropout y otros.
Creación de una CNN con keras.
4. Comprensión del diseño de redes neuronales artificiales (ANN), redes convolucionales (CNN) y redes recurrentes (RNN).

Módulo 5 Entornos big data & cloud 14 horas
1. Conocimientos de Big Data y de los principios de arquitecturas de computación distribuidas y
2. Utilización de Dataframes y Data pipelines en Spark.
Operaciones sobre dataframes (SQL o pyspark).
Creación de data pipelines con spark.
Transformación de dataframes.
3. Creación de modelos de Machine Learning en Spark.
Entrenamiento de modelos e integración en pipelines.
Aplicación de la inferencia de modelos en Spark.
4. Despliegue de pipelines de modelos con Spark.
5. Desarrollo de modelos con proveedores de Cloud Machine Learning.

Módulo 6 Visualización de los datos 30 horas

1. Comprensión de las claves del storytelling a través de los datos.
La ciencia de la visualización de datos y el storytelling: su valor en el mundo profesional.
2. Uso del storytelling con datos.
Principios de la comunicación visual de los datos.
Uso de los distintos controles visuales.
3. Comprensión de los conceptos Business Intelligence y Data Visualization.
Entender el proceso para trabajar en la herramienta de visualización en un contexto de Business Intelligence.
Fuentes de datos, tratamiento y preparación de datos, modelaje de datos (relaciones), análisis exploratorio y específicos, visualización y reporting.
4. Profundización en la herramienta PowerBI para poder conectar datos, prepararlos, modelarlos, explorarlos y visualizarlos.
Entorno de PowerBI: organización y componentes.
Importación de datos.
Visualizaciones básicas realizando agrupaciones y aplicando filtros.
– Trabajar y preparar los datos: columnas calculadas, medidas, fórmulas con DAX, tablas calculadas…
Trabajar con tablas matrices para aumentar la granularidad de los informes. – Filtrar los datos de manera dinámica con la segmentación de datos.
5. Aproximación a la herramienta Tableau..
Módulo 7 Habilidades y competencias de gestión, personales y sociales, para el
entorno digital 30 horas
1. Impulso de habilidades digitales:
Liderazgo participativo.
Gestión del cambio.
Inteligencia emocional.
Storytelling.
Creación de marca personal.
Comunicación y negociación en entornos digitales.
2. Comprensión de las competencias necesarias para el nuevo entorno digital:
La influencia digital.
La colaboración en el entorno.
La integración de la diversidad.
La gestión emocional.
La agilidad en toma de decisiones.
La anticipación en contextos digitales.
La flexibilidad para la transformación.
La asunción de incertidumbre y riesgos.
La elaboración, gestión y difusión de contenidos.
3. Conocimiento de las herramientas imprescindibles para:
El trabajo colaborativo.
El trabajo en remoto.
La gestión de proyectos.
Automatización de flujos de trabajo.
4. Práctica en las claves del trabajo en equipo y de la productividad en remoto.
5. Fomento del liderazgo participativo y la gestión del cambio.
6. Dominio de la comunicación y la negociación en entornos digitales.
7. Práctica del modelo de competencias para el entorno digital.
8. Elaboración y gestión de la marca personal desde la importancia del storytelling.
9. Capacidad de síntesis para observar los datos y extraer su información útil y relevante.
10. Capacidad crítica para ser capaz de cuestionar los datos y así desarrollar conclusiones en base a los mismos.
11. Conocimientos en informática, matemáticas y estadística: estos perfiles deben poder analizar bases de datos, construir modelos y realizar previsiones estadísticas, etc.
12. Facilidad para la comunicación para explicar los resultados del trabajo a gerentes y directores, generalmente sin formación técnica, de la empresa u organización.