00: Fundamentos de datos
Una breve introducción a las herramientas para hacer ciencia de datos.
Como el nombre lo dice: son los fundamentos. No vamos a hacer nada 👏 NADA 👏 de machine learning, pero vamos a ver las herramientas que ayudan a entender y a implementarlo.
El curso tiene un enfoque netamente orientado a las ciencias de la computación con muchísimo énfasis en programación; hablaré un poco de matemáticas, pero nada demasiado teórico puesto que tampoco me considero un experto.
¿Por qué? 🤔🤔
Quiero hacer algo diferente a solo los tutoriales que uno ve por aquí y por allá y hablar sobre los fundamentos que hay detrás de las herramientas que usamos. Este curso está inspirado en la asignatura del mismo nombre que tomé en la Universidad de Glasgow (COMPSCI4073).
Prerequisitos
- ¡Programación! - Python 🐍: Idealmente tienes conocimiento sobre programación, el lenguaje es relativamente sencillo de aprender y en general no vamos a usar características oscuras del lenguaje (las bibliotecas que vamos a usar lo hacen por nosotros)
- Matemáticas: Como ya lo mencioné, el curso está orientado primordialmente a resolver problemas desde un enfoque computacional, haré mi mejor esfuerzo por explicar los temas de álgebra lineal, y el poco cálculo y probabilidad que veamos, si tú tienes conocimiento sobre estas tres áreas, la cosa te será más fácil. Además de que compartiré recursos adicionales que te pueden resultar de utilidad).
Herramientas principales ⚙
- Python 3.8
- Jupyter Lab
Opcional: Docker. Si tienes problemas instalando las dependencias pondré una imagen de Docker lista para ser usada, junto con instrucciones sobre cómo usarla.
Formato 📃
- Todo se verá en forma de notebooks, cada semana pondré el (probablemente en viernes por la tarde) antes de la "clase"; para enterarte ve la sección de contacto.
- Sesiones sabatinas en vivo de ~1.5 horas, todos los sábados 10 AM tiempo del Centro de México (la primera siendo el día 6 de marzo de 2021) en las cuales voy a explicar los temas
- Muy a mi pesar, no podré tomar tantas preguntas directamente sobre lo que estamos viendo, pero seguir discutiendo en el Discord (si hay posibilidad puedo organizar un directo para resolver preguntas que me hayan llegado previamente).
- Las grabaciones quedan en YouTube
- No hay tarea (no tengo tiempo de revisarla 😂)
Temario 🗂
- Jupyter Lab
- Cómputo vectorizado
- Visualización de datos
- Álgebra Lineal
- Optimización numérica
- Probabilidad
- Procesamiento de señales (???)
Sesiones 🏫
- 01: Jupyter Lab (Sábado 13 de marzo 2021)
- 02: Cómputo vectorizado (Sábado 20 de marzo de 2021)
Libros 📚
En este curso vamos a hablar de muchos temas y por tanto no hay un solo libro que te pueda decir "este, este tiene todo", sin embargo, si tienes ganas locas de leer algo para complementar tu aprendizaje, te recomiendo estos:
- Elegant SciPy: The Art of Scientific Python: México · España · US
- High Performance Python: Practical Performant Programming for Humans: México · España · US
Contacto ☎
- Mi cuenta de Twitter: @io_exception
- Mi canal de YouTube: That C# guy
- El discord para preguntas y la comunidad: https://tcsg.dev/discord
- Playlist en YouTube sobre el curso: Fundamentos de datos en YouTube
- Repositorio de las notebooks: thatcsharpguy/df
¿Costo? 🤑
¡Totalmente gratis! pero habiendo dicho esto, si quieres puedes suscribirte como miembro a mi canal de YouTube acá youtube.com/thatcsharpguy/join (mil gracias a los miembros actuales) o aventarme dinero al sombrero acá: https://www.buymeacoffee.com/thatcsharpguy o acá https://creadores.fans/thatcsharpguy 😎
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.