Si ya sos Estudiante de Humai

Dejanos tu Email y te enviaremos las credenciales para acceder a las clases.

Si aún no sos Estudiante de Humai

Suscribite como Estudiante de Humai para poder anotarte a los cursos.

Automatización Web
para Extracción de Datos

Web Scraping


En este curso nos proponemos:

    Otorgar las mejores herramientas para la extracción de datos de la web con Python, para lograr la automatización de procesos manuales y incorporar las fuentes de datos más importantes para el armado de datasets para análisis y Machine Learning.

    Conocerás las librerías fundamentales de Python para interactuar con la web y como requests o Selenium.

    Aprenderás a disponer de las APIs que los sitios más populares de uso masivo disponen para que consultes sus datos.

    Verás como conseguir, almacenar y procesar datos de la web, complementando tus herramientas disponibles para responder preguntas analíticas y de negocios, o desarrollar apps utilizando información actualizada en tiempo real.

Este curso requiere conocimientos básicos de Python, por esto antes de empezar les pedimos que completen esta autoevaluación. Para prepararse pueden revisar el material de nuestro curso anterior en nuestro repo de github.

LogoHumai

Fecha de inicio:

2021

Duración:

3 semanas

Valor de inscripción a Estudiante: ARS$ 2000
Por tiempo limitado

Si te interesa este curso pero te resultan una traba los costos o los horarios, ¡escribinos admin@ihum.ai y trataremos de resolverlo!

¡ Inscribite !




Temas del curso:

  1. APIS, URL y HTTP
    Protocolos básicos de la comunicación de información en internet
  2. Scraping de código HTML: Scraping de páginas estáticas
    • HTML
    • requests
    • Expresiones regulares
    • BeautifulSoup
  3. Scraping de APIs ocultas
    • Chrome DevTools
    • Inspección de paquetes en la red
    • cURL
    • Detección de APIs Ocultas
  4. Scraping por automatización
    Técnicas más avanzadas para páginas estáticas
    • Selenium
    • XPath
  • Examen
    Desarrollarás un caso real de extracción de datos de la web para asentar y evaluar lo aprendido.
LogoHumai

Los Docentes:

Agustín Benassi Desarrollador Python y Especialista en Datos

Ex Director de Datos Públicos de la Nación. Licenciado en Economía (UBA). Fue responsable de la implementación de diversos proyectos de la infraestructura de datos pública y formó parte del diseño de la política de datos abiertos. Actualmente es consultor en estos temas.

Mathias Gatti
Mentor y Desarrollador Freelance

Licenciado en Cs. de la computación de la UBA, tesis en neurociencia. Especializado en Data Science. Construye maquinas que aprenden a hacer música a partir de canciones que scrapea de internet.