![](https://www.path.com.br/wp-content/uploads/2024/07/Peca-Nova-10.png)
O que você vai aprender?
Nessa dica você irá aprender a utilizar ferramenta de Imputation e suas possibilidades de configuração.
INTRODUÇÃO
Um dos processos mais comuns de preparação de dados é a limpeza de valores, removendo números nulos e complementando-os com 0.
Em algumas situações precisamos criar uma base de dados mais específica, substituindo um certo valor por outro a partir de um cálculo. Dentro do Alteryx podemos utilizar várias ferramentas para calcular e substituir os dados, ou podemos utilizar a ferramenta de Imputation que executa esta tarefa de forma única.
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem1.png)
Para essa demonstração, utilizaremos a seguinte base de dados:
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem2.png)
PASSO 1: SELECIONANDO AS COLUNAS
Assim como na ferramenta de Data Cleansing, o primeiro passo é selecionar as colunas que serão tratadas pela ferramenta, mas dessa vez, apenas colunas do tipo numérico poderão ser selecionadas.
Configuração imputation:
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem3.png)
PASSO 2: DEFINIR O VALOR QUE SERÁ SUBSTITUIDO E QUAL SERÁ SEU SUBSTITUTO
Em um segundo momento definimos o tratamento a ser feito, podendo substituir valores NULOS ou um valor específico determinado
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem4.png)
E em sequência informamos em sua configuração, quem será o substituto, podendo ser esse cálculo, como por exemplo uma média, mediana ou moda das linhas preenchidas na coluna.
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem5.png)
PASSO 3: CONFIGURAR A SAÍDA DOS DADOS
O último passo é determinar se a tratativa configurada anteriormente irá substituir os dados da coluna original, ou criar uma coluna com os dados ajustados.
Nesta etapa temos 2 checkbox que podem ser marcadas simultaneamente se necessário:
- Include imputed value indicator field
Irá criar colunas com o formato booleano, indicando com 1 as linhas que sofreram imputation e 0 as linhas que não foram alteradas.
- Output imputed value as separate field
Irá criar colunas com os dados alterados pela ferramenta imputation, gerando assim uma coluna nova e mantendo os dados originais também
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem8.png)
Seguindo estes passos temos a seguinte configuração final da ferramenta:
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem6.png)
E abaixo, o resultado:
![](https://www.path.com.br/wp-content/uploads/2021/12/Dica-Alteryx68-Imagem7.png)