20/06/2025 –, Sala Quentão
Conforme um projeto de raspagem de dados se torna mais complexo, é necessário conhecer e aplicar funcionalidades mais avançadas disponíveis no Scrapy. Vamos ver algumas delas e como podem ser usadas.
Scrapy é o framework mais conhecido no ecossistema Python para raspagem de dados, fornecendo as ferramentas básicas para projetos pequenos ou grandes. Porém, conforme o seu projeto cresce, ou as técnicas de desenvolvimento de páginas na Internet mudam, começa a ser necessário o uso de funcionalidades do framework mais avançadas, além de bibliotecas auxiliares.
Nesta palestra serão apresentadas algumas dessas funcionalidades como middlewares, pipelines, exportadores de dados, monitoramento e uso de navegadores headless (como playwright) integrando isso no Scrapy.
Apesar de focado no Scrapy, os conceitos apresentados podem ser replicados em outras ferramentas e arquiteturas de projetos de raspagem de dados.
- Python básico (saber usar e definir funções, classes e métodos, estruturas de dados como listas, dicionários e tuplas, manipulação de strings, controles de fluxo e loops - if/for/while)
- Um conhecimento básico de Scrapy pode ser útil, mas não é 100% obrigatório, já que será feito uma passagem rápida sobre os conceitos básicos do framework
Ao final da palestra, as pessoas participantes terão conhecimento de funcionalidades do Scrapy que não são tão conhecidas da maioria das pessoas, podendo aplicá-las imediatamente em seus projetos, mesmo que não utilizem o Scrapy, já que os conceitos são gerais e podem ser aplicados/adaptados e outras bibliotecas e arquiteturas de projetos de raspagem de dados.
Escolha uma ou mais áreas em que essa proposta se encaixa –Automações (RPA - Robotic Process Automation), Ciência e Análise de Dados, Machine Learning e Inteligência Artificial
Desenvolvedor Python a 12+ anos. Ativo na comunidade organizando e participando de vários eventos. Fundador do Laboratório Hacker de Campinas, cervejeiro caseiro e marceneiro nas horas vagas.