22/10/2025 –, Impacta - Sala 201
Um tutorial prático que combina duas ferramentas poderosas para profissionais que desejam aplicar engenharia de ML com foco em produção, escalabilidade e boas práticas de modelagem.
A Engenharia de Machine Learning envolve mais do que apenas treinar modelos em larga escala: exige pipelines organizados, eficientes e reproduzíveis, que permitam levar modelos desde o ambiente experimental até a produção. Neste tutorial prático, você aprenderá como combinar duas ferramentas poderosas—Kedro e MLflow—para criar pipelines robustos e eficientes, de ponta a ponta.
Com o Kedro, estruturaremos projetos de dados de forma modular, passando pela ingestão e tratamento inicial até as etapas de modelagem, validação e seleção dos melhores modelos. Em paralelo, utilizaremos o MLflow para garantir o rastreamento detalhado dos experimentos, permitindo o registro automático de parâmetros, métricas e versões dos modelos criados.
Ao longo da atividade, os participantes construirão passo a passo um pipeline baseado em um caso prático real, aplicando conceitos essenciais de engenharia de ML em um ambiente guiado e colaborativo. Ao final, terão uma base sólida para começar a utilizar essas ferramentas em suas próprias rotinas profissionais, facilitando a criação de projetos que sigam as boas práticas de ML.
Ciência e Análise de Dados, Machine Learning e Inteligência Artificial, DevOps e Automação de Infraestrutura
Quais conhecimentos prévios são necessários para que seja possível acompanhar bem a sua atividade? –Para um bom aproveitamento deste tutorial prático, é recomendado que os participantes tenham nível intermediário em Python, especialmente familiaridade com bibliotecas comuns para ciência de dados, como Pandas e Scikit-learn. Também é desejável conhecimento básico em conceitos gerais de aprendizado de máquina, incluindo pré-processamento de dados, construção e avaliação de modelos simples. Não é exigida experiência prévia com Kedro ou MLflow, pois ambas ferramentas serão introduzidas gradativamente durante a atividade. Pessoas que tenham noções gerais sobre pipelines de dados ou interesse em iniciar na área de engenharia de ML e MLOps poderão aproveitar melhor o conteúdo.
O que as pessoas que participarem podem esperar aprender na sua atividade? –Aprenderão a estruturar pipelines modulares usando Kedro, realizando ingestão, pré-processamento e modelagem básica de dados. Aprenderão a integrar o Kedro com o MLflow para rastrear automaticamente parâmetros e métricas dos experimentos, registrar modelos treinados, realizar versionamento e comparar resultados de forma visual. Aprenderão também boas práticas iniciais para validação e organização dos pipelines, além de noções introdutórias sobre escalabilidade e preparação básica de projetos para ambientes produtivos. Ao final, terão conhecimento preliminares para se aprofundarem no uso de Kedro e MLflow de forma prática em suas próprias rotinas profissionais, compreendendo os fundamentos essenciais dessas ferramentas.
Lead Machine Learning Enginner na NTT Data e Doutor em Sociologia Computacional pela UFSCar. Gosto de transformar boas conversas (e café!) em soluções escaláveis de ML com Python e PySpark.
Líder da equipe de AI & Data Intelligence Engineering na Creditas. 6 anos de experiência em MLOps, com foco na construção de arquitetura e pipelines de machine learning, utilizando Python para soluçõe