youtool: dados do YouTube fáceis p/ combater a desinformação
19/10, 10:30–11:00 (America/Sao_Paulo), [CCBR] Salão do Paço

youtool é uma biblioteca e CLI que facilita o acesso a dados de vídeos do YouTube, incluindo transcrições. Mostraremos com usamos youtool + LLMs + postgres para investigar quem financia desinformação.


youtool é uma biblioteca Python e interface de linha de comando que facilita o acesso a dados do YouTube, como informações sobre vídeos e dados que não estão na API, como baixar as transcrições geradas automaticamente e saber quem doou no superchat.
Apresentaremos como usar as principais funcionalidades da biblioteca e também mostraremos como a utilizamos em diversos projetos de combate à desinformação, onde juntamente com jornalistas investigativos buscamos os financiadores desse tipo de conteúdo.
Para finalizar, mostraremos como utilizamos grandes modelos de linguagem (LLM) e a indexação por texto completo no postgres (full-text search) para facilitar que as equipes de reportagem pudessem acessar mais facilmente esses dados durante as investigações.

Álvaro Justen (@turicas) é programador, professor e empreendedor. Trabalha com Python desde 2005. Criou o Brasil.IO e a PythoniCafé, empresa que gera impacto social com software livre e dados abertos.

Pythonista e entusiasta na área de dados e DevOps. Coorganizadora do PyLadies Florianópolis e membro do PyLadies Global. Combino tecnologia e justiça para promover impacto positivo.