Este curso de data science con Python te permitirá adentrarte en el mundo de los patrones, desde una mirada intuitiva, con guías paso a paso tanto en la teoría como en la práctica utilizando el lenguaje Python.
Es un curso práctico, orientado a que puedas desarrollarte como Data Scientist Jr.
Tendrás a Atenea tu IA que te guiará en tu aprendizaje en todo momento y también contarás con soporte de nuestro instructores a través de nuestra comunidad.
#Machine Learning #Python #Estadística #Data Science
“Ciencia de Datos 360” aborda todos los temas y herramientas necesarias para la manipulación de datos desde el enfoque de Machine Learning: Desde la creación de un modelo sin ningún tipo de preparación de datos, hasta un modelo optimizado con hyper-tunning y preparación de datos "inteligente".
Este curso te permitirá:
✔ ️ Identificar el tipo de modelo según el problema planteado.
✔ ️ Comprender los modelos Machine Learning más usados en la industria.
✔ ️ Hacer una preparación de datos orientada a mejorar la precisión.
✔ ️ Realizar análisis exploratorio e identificar los problemas silenciosos que puedan surgir.
✔ ️ Conocer el detrás de escena de los modelos Machine Learning.
El curso no sigue un camino clásico, ya que en el transcurrir se va introduciendo complejidades paso a paso, hasta llegar al nivel de dificultad que se observa en la práctica.
Esta es la versión orientada al lenguaje de programación Python, aunque también está disponible la versión para R.
Al completar el curso tendrás un certificado de finalización para publicar en Linkedin. Además con Atenea podrás validar lo que aprendiste, haciendo evaluaciones a medida que avances con las lecciones. Tendrás soporte de nuestros instructores en todo momento a través de nuestra comunidad en Discord.
Todo lo que necesitas saber antes de comenzar.
¿De qué hablamos cuando hablamos de ‘Ciencia de Datos’?
Primer acercamiento a tus datos para comprender cómo está compuesto el dataset.
Entiende cómo se relacionan las variables de tu dataset.
Muchas veces los datos llegan “sucios”. Aprende a tratarlos para poder aprovecharlos al máximo y evitar llegar a conclusiones erróneas.
Ahora, con tus datos listos, comienza por el modelo de ML Árbol de decisión.
Aprende a aplicar el modelo de ML de Clasificación, entiende cómo optimizarlo y cómo se relaciona con los conceptos estadísticos de regresión y cálculo de error
Introduce un nivel de complejidad mayor con el modelo de Clasificación multiclase. Comprende los conceptos de outlier y undersampling
Entiende qué es y cómo aplicar el modelo de ML Clustering
Aprende cómo hacer para reducir complejidad y quitar dimensiones
Te adelantamos qué y cómo seguir aprendiendo Ciencia de Datos
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Venenatis nec nisi ornare.
Se pide que se tenga nociones básicas de R ó Python, tal como la manipulación de archivos, crear agrupaciones simples, aplicar funciones, etc.
Este curso es con Python. R y Python tienen sus similitudes y diferencias. Ambos sirven para ambientes laborales y también para investigación.
La parte práctica, los videos están explicados de manera genérica y cuando se necesita hacer una referencia al código se aclara para ambos lenguajes.
Si, tener nociones básicas y haber practicado, sobre todo los temas que se ven en 'Intro a Python’. Si no sabes nada de Python, empieza por nuestro curso.
✔ ️Médicos, como ataque al corazón, diabetes y el coronavirus (Kaggle). ✔ ️ Encuestas/demográficos: Estimar el nivel de ingreso. ✔ Campaña de marketing para vender un producto. ✔ ️Datos de canciones de Spotify. El objetivo de ver distintos datos es que el estudiante pueda generalizar y ver lo común a todos los proyectos.
minepy, matplotlib, seaborn, pandas_profiling, pandas, numpy, sklearn, qgrid y ... funPyModeling! Nota: no todas con el mismo nivel de profundidad, de algunas usaremos una o dos funciones necesarias para ese momento, así van a ir armando tu propio toolset.
El curso tiene un anexo con nociones básicas de estadística, y todos los temas se presentan de manera didáctica, empezando por la intuición, ejemplos funcionales, práctica en código y en algunos casos, las ecuaciones.
Totalmente! Todo está pensado de forma incremental hasta terminar en lo que pudieras llegar a enfrentarse en un trabajo. Te llega un set de datos de cero y tienes que crear un modelo predictivo estable. Los ejemplos son templates para que uses con tus datos. Los scripts se presentan de manera generalizada. Por ejemplo, en reemplazo de nulos no se muestra cómo reemplazar una sola variable, sino una lista de ellas (trabajar con listas de variables es el escenario más común).
Son videos grabados. Modalidad online asincrónica: Lo haces a tu ritmo.
Si! A través de nuestra comunidad.
Podrás acceder al curso mientras tu membresía esté activa.
La duración es variable de acuerdo a la experticia y dedicación del alumno/a. El total neto de horas es de ~ 10 hs. La suma de estos valores no es ni siquiera la cota mínima. La experiencia indica que hay que ver cada video entre 2 y 3 veces para comprender bien el tema. Y luego dedicarle una cantidad de horas prudencial a probar aplicar lo aprendido a nuevos sets de datos. Una de las mejores maneras de aprender es usar datos propios o tener un objetivo concreto. Ejemplo: El video de curva ROC dura 8 min, pero asimilar el concepto y tomar decisiones con estos valores puede llevar al menos 3 proyectos. Dadas estas consideraciones la asimilación de todos los conceptos puede llevar aproximadamente 3 meses.
Todas las slides usadas en los videos teóricos y todos los scripts usados en el laboratorio.
Sí.
No hay problema, escríbenos aquí indicando tus preguntas.