Del curso: Análise de Dados Parte 1: Conceitos Básicos
Limpeza de dados usando macros do Excel
Em uma empresa, talvez você veja gente usando métodos mais antigos de limpeza de dados, como macros do Excel. Pode ser que o arquivo não tenha sido alterado há algum tempo ou não tenham sido adotadas ferramentas como Power Query. É importante saber que quando você herda um arquivo, herda os conhecimentos e o estilo da pessoa responsável pelo arquivo. No entanto, as macros são uma ótima forma de identificar o que precisa ser limpo e também uma excelente oportunidade para melhoria de processos. Ok. Vou mostrar como gravar algumas macros e analisar o conteúdo delas. Certo. Estou no arquivo Pesquisa de Tendências de Despesas. Toda vez que baixo esses dados, vejo o mesmo tipo de informação, com estrutura exatamente igual. A única diferença é que sempre há novos dados. Ok. Estou com a guia Desenvolvedor ativada na faixa de opções. Caso a sua não esteja disponível, personalize a faixa de opções para ativá-la. Vou escolher Gravar Macro. Esta será a primeira etapa: copiar a planilha. Vou clicar com o botão direito na planilha, escolher Mover ou Copiar, Criar uma cópia, mover para o final e clicar em OK. Vou voltar para a planilha e parar a gravação. Quero manter uma cópia desta planilha para poder consultá-la e testar minhas macros depois. Agora estou pronto para começar o processo de limpeza. Primeiro, vou excluir as colunas que não preciso. Vou começar gravando uma macro. Será a segunda etapa. Vou chamá-la de ExcluirColunas. Não preciso do código do entrevistador nos meus relatórios. Também não preciso da data de término. Vou selecionar do endereço IP até os dados personalizados, na coluna G, clicar com o botão direito e excluir. Ok, ótimo. É exatamente o que preciso. Vou parar a gravação e gravar a próxima etapa. A terceira etapa será ajustar o tamanho dos dados. Vou selecionar tudo, clicar duas vezes no cabeçalho das colunas e, com isso, ajustar o tamanho das colunas de dados. Vou clicar de volta em A1 e parar a gravação. Ok. Toda vez que baixo esses dados, a linha dois traz mais informações sobre os cabeçalhos. Então, preciso cuidar disso na limpeza. Certo. Vou clicar em Gravar Macro. Este é a quarta etapa, limpar cabeçalhos. Vou clicar em OK, copiar isto, autodescrever, e colar em E1. Vou excluir a linha dois porque não preciso mais dela. Agora vou cuidar destes cabeçalhos e chamá-los de Idade, Gênero e Escolaridade. Perfeito. Vou voltar para A1 e parar a gravação. Agora, estou pronto para testar minha macro, mas, ao mesmo tempo, quero gravar a execução das etapas. Então, vou excluir minha planilha e renomear esta de volta para Planilha, pois é isso que será procurado – uma planilha com esse nome. Vou gravar minha macro e chamá-la de ExecutarTudo. Vou clicar em OK, escolher Macros e executar a primeira etapa. Observe que tenho Planilha (2) abaixo. Vou clicar em Macros novamente e executar a segunda etapa. Percebeu que minhas colunas foram excluídas? Vou escolher Macros e rodar a terceira etapa. O tamanho das colunas foi ajustado. Perfeito. Vou escolher Macros pela última vez e limpar os cabeçalhos. Vou selecionar Executar. Maravilha. Então, posso parar a gravação. De agora em diante, se eu quiser realizar essas etapas, basta executar a macro ExecutarTudo. Vou mostrar isso. Certo. Vou alterar o nome da planilha de volta para Planilha. Repetindo, é porque quando faço dela na ferramenta de pesquisa, esse é o nome dela. Vou escolher Macros selecionar ExecutarTudo e Executar. Num piscar de olhos, tenho dados limpos. Dá para ver por que as empresas utilizam macros. Porém, com o advento do Power Query, essas opções ficaram bem mais simples. Vou mostrar como você pode analisar uma macro para identificar as etapas de limpeza realizadas. Vou abrir o Visual Basic, expandir os Módulos e escolher Modulo1. Quando clico duas vezes no módulo, ele mostra todas as colunas, planilhas e informações que alterei. É bem mais fácil interpretar isso quando você mesmo tiver realizado as etapas, mas observe que ele indica o que foi selecionado, se foi copiado, colado e onde. Dá para saber os nomes que foram alterados. É ótimo ter o a essas informações, porque você pode utilizá-las depois ou, se precisar fazer modificações na macro, basta incluí-las no código. Depois de 20 anos usando o Excel e lidando com dados, sei que você vai encontrar arquivos com macros. O simples fato de saber inspecionar o código permite compreender quais rotinas de limpeza foram realizadas e como ampliá-las ou substituí-las.
Contenido
-
-
-
-
-
-
-
-
O papel do ETL nos dados1 min 59 s
-
Limpeza de dados usando macros do Excel6 min 1 s
-
Limpeza de dados com o Power Query6 min 21 s
-
Como trabalhar com dados reutilizáveis4 min 37 s
-
Modelagem de dados com consultas7 min 13 s
-
Modelagem de dados no Power Query8 min 21 s
-
Desafio: renomear cabeçalhos no Power Query47 s
-
Solução: renomear cabeçalhos no Power Query4 min 7 s
-
-
-