22/10/2025 –, Impacta - Sala 208
A ideia é ensinar como a pessoa pode criar um modelo preditivo simples, mesmo sem ter muita noção de modelagem. Partiríamos do básico até um modelo de árvore de decisão, sem entrar na matemática.
Ensinarei o básico de análise de dados: importar bibliotecas, importar arquivo csv, como entender a estrutura do dataset e fazer alguns gráficos simples (histograma, gráfico de dispersão, etc).
Na sequência, explicaria o que é um modelo de Machine Learning e uma árvore de decisão. Não entraria no assunto de entropia ou gini, somente mostraria a estrutura e a lógica por trás do algoritmo (mais ou menos igual eu fiz neste post: https://estatsite.com.br/2016/06/11/1970/).
Treinaríamos um modelo, algo mais comum, como previsão de churn ou inadimplência, e eu explicaria a quem se interessasse um pouco mais da carreira em data science.
ideal seria a pessoa conhecer pelo menos o Jupyter Notebook ou o Google Colab, além de saber como carregar uma biblioteca. Acredito que até mesmo essa questão poderíamos passar brevemente no início do tutorial, principalmente se a duração for maior. Fora isso, não vejo mais nada. Não vou falar da estatística envolvida, não quero entrar em detalhes de feature engineering ou feature selection, nada disso acho necessário para entender o que é um modelo e como rodá-lo. Acredito que essas questões devem ficar para casa para aqueles que se sentirem motivados após entenderem como o mercado usa machine learning.
¿Qué pueden esperar aprender los participantes en tu actividad?:Os participantes do meu tutorial aprenderão a realizar uma análise de dados simples, criar visualizações informativas e entender a lógica por trás das árvores de decisão. Eles também compreenderão como o mercado utiliza dados para gerar valor e antecipar eventos, aplicando técnicas de Machine Learning para resolver problemas práticos, como previsão de churn ou inadimplência. Vão entender questões que todos gestores cobram, entender custo x benefício e olharem para soluções dos problemas (algo que devo discutir após terminamos o modelo).
Elige una o más áreas en las que esta propuesta encaja.:Ciência e Análise de Dados
Graduado em matemática (USP), pós-graduado em finanças (FIA) e mestre em economia (FGV). Atuo na área de dados há pouco mais de uma década, além de produzir conteúdo pela Universidade dos Dados.