Computação distribuída em Python com Dask
06/06/2026 , Favaro Auditório

Vamos conhecer Dask. O framework para computação distribuída entre várias máquinas escrito em Python.


O que acontece quando o tamanho do seu dataset é maior que a memória da maior máquina disponível?
O que acontece quando o tempo de CPU necessário para uma atividade é estimado em vários meses, ou até anos?
Nesses momentos convém distribuir a carga computacional entre várias máquinas e/ou vários processadores. Mas nem sempre essa é uma tarefa simples.
Nesses momentos ter um framework pode facilitar bastante a vida das pessoas.
Nesta palestra vamos apresentar o Dask, um framework para computação distribuída feito inteiramente em Python.
E teremos código rodando ao vivo!


Quais conhecimentos prévios são necessários para que seja possível acompanhar bem a sua atividade?:

Conhecimento intermediário de Python e Estrutura de Dados e Algoritmos
Conhecimento básico de Pandas e Redes de Computadores
...
...
...
(preciso completar 150 caracteres)
...
...

O que as pessoas que participarem podem esperar aprender na sua atividade?:

Conhecimento de Dask e suas ferramentas.
Tradeoffs entre multiprocessing, Dask e Spark
Como montar seu proprio cluster para estudos pessoais.
Onde encontrar material para aprofundar sobre o assunto e conseguir trabalhar com o Dask num ambiente profissional.

Escolha uma ou mais áreas em que essa proposta se encaixa: Ciência e Análise de Dados, Machine Learning e Inteligência Artificial, Arquitetura de software, Computação Científica

Hacker, aficionado por jogos de tabuleiro, karateca, músico e cozinheiro amador.
Também sou desenvolvedor de software nas horas vagas, em Python sempre que possível.