Ciencia de Datos

«Data Science» representa un dominio transversal que integra y pone en valor tecnologías de ingeniería de datos, aprendizaje automático, computación avanzada, visualización, estadística, almacenes de datos, minería de datos, procesamiento del lenguaje natural y computación de alto rendimiento. Una materia de «Data Science» debe sacar partido a las tecnologías arriba mencionadas, desde un punto de vista instrumental-metodológico y no como fin en sí mismas, con el objetivo de extraer conocimiento a partir de datos y crear productos basados en este conocimiento.

Objetivos:

El alumno al terminar el curso será capaz de:

  • Reconocer el valor de los datos en las organizaciones y las posibilidades de negocio que plantea su explotación para el desarrollo de productos basados en datos.
  • Determinar qué tecnologías son necesarias para poder gestionar eficientemente datos en distintos entornos, tamaños y formatos, para facilitar su comprensión y análisis.
  • Estimar la complejidad y recursos necesarios para analizar un proyecto de análisis de datos y establecer las medidas de costes y de éxito.

Temario:

  1. EL VALOR DE LOS DATOS. Productos y compañías basados en datos. Oportunidades de datos. Los usuarios/clientes como productores de datos. El papel del data scientist. Ejemplos y casos de estudio para el resto del curso.
  2. INTEGRACIÓN Y MANIPULACIÓN DE DATOS: tipos de fuentes y repositorios de datos: relacional, almacenes de datos, no-SQL, no estructurados,… Recuperación e integración de datos. Calidad de datos: gestión de la incerteza y de datos inconsistentes. Privacidad, propiedad y seguridad de los datos. Big Data: problemática y tipos de soluciones (map-reduce y otras).
  3. ANÁLISIS DE DATOS. El Proceso D2K (Data to Knowledge). Visualización y comprensión de datos. Visión instrumental de las herramientas de análisis, uso e integración con las fuentes de datos. Analizando datos planos. Tipos de tareas predictivas y descriptivas. Analizando textos, web, imágenes y vídeos. Extracción de conocimiento a partir de estructuras complejas. Integración con herramientas de lenguaje natural. Evaluación del conocimiento adquirido y combinación con el conocimiento anterior.
  4. EXPLOTACIÓN DEL CONOCIMIENTO. Conversión de los patrones descubiertos en nuevos productos o mejoras en el entorno. Asistentes, prescriptores y recomendadores. Integración en toma de decisiones, dashboards, monitorización, estimación de éxito y de riesgos.