PATH Tips/Best Practices- Usando a ferramenta Fuzzy Match para padronizar inputs

Posted on Posted in dicas alteryx

Nesta dica você irá aprender como utilizar a ferramenta “Fuzzy Match” para encontrar campos com inputs parecidos e substituí-los por um campo em comum.

Neste caso temos uma de transações comerciais realizadas por diferentes empresas do grupo. Podemos observar que muitos campos “Company” possuem entradas parecidas, podendo ser inferido que são o mesmo campo com formas de digitar diferentes. Queremos padronizar os campos para que essas entradas de digitação diferentes sejam padronizadas.

Primeiro, conectamos a base em uma ferramenta “Fuzy Match”, utilizamos o “Purge Mode” e configuramos conforme a imagem abaixo:

Obs: Dependendo da base, o campo de “Threshold” deverá ser utilizado para testes para que o algoritmo consiga encontrar mais campos com digitação parecida

Podemos encontrar o seguinte resultado:

 

 

Conectamos a saída dessa ferramenta em um fluxo com as configurações mostradas abaixo:

 

A tabela de resultado desse fluxo, deverá ser usado na entrada “R” de uma ferramenta “Find and Replace” junto com a base inicial na entrada “F” para padronização do resultado final.

 

Pronto!  Agora você já sabe como utilizar a ferramenta “Fuzzy Match” para encontrar campos com inputs parecidos e substituí-los por um campo em comum.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Comment moderation is enabled. Your comment may take some time to appear.