Del curso: Análise de Dados Parte 1: Conceitos Básicos
Como trabalhar com dados reutilizáveis
Existem alguns conjuntos de dados que considero padrão e reutilizáveis, como tabelas de datas. Uma tabela de datas é uma das situações mais comuns que encontramos com dados reutilizáveis. Ela permite colocar suas datas e realizar cálculos comuns que talvez você se veja refazendo toda vez que trabalha com datas. Vamos criar nossa própria tabela de datas personalizada usando o Excel. Assim, você pode usá-la sempre que tiver cálculos relacionados a datas. Ok, já abri o arquivo Datas e quero criar alguns cálculos com datas. Este arquivo vai de 1/1/2019 a 31/12/2025. Então, vou usar =VALOR para converter isso em um número de série. Assim, quando precisar do número de série, poderei usá-lo. Vou continuar e calcular o dia da semana. Vou digitar =DIA.DA.SEMANA. Agora está pedindo o número de série, mas posso selecionar A2 ou B2 e ainda vai dar certo. Vou dar dois cliques para preencher automaticamente até embaixo. Por padrão, o primeiro dia da semana é domingo. Posso mudar isso se precisar para os meus relatórios. Ok, nome do dia da semana, como segunda-feira ou terça-feira. Sei que posso formatar a data para conseguir isso, mas quero os dados reais, não apenas uma data para trabalhar. Ok, então vou digitar =TEXTO, apontar para a data, digitar ponto e vírgula e quatro Ds. Isso vai retornar o nome completo, terça-feira, quarta-feira, por extenso. Se eu quisesse a abreviação, colocaria apenas três Ds. Ok, vou continuar e apertar Enter. Veja que sábado corresponde a 7. Domingo corresponde a 1. Cada empresa pode lidar com isso de forma diferente. Muito bem, quero extrair apenas o número do mês. Vou digitar =MÊS, pegar esta data ou o número de série, qualquer um vai dar certo, e preencher automaticamente. Certo, quero obter o nome do mês. Às vezes, temos mais flexibilidade com a versão em texto do nome, em vez de ficar formatando uma data para que tenha uma determinada aparência. Muito bem. Vou digitar =TEXTO, escolher a data e novamente tenho uma decisão a tomar. Se eu quiser a abreviação de três letras, termino com três Ms. Se eu quiser completo, por extenso, digito quatro. Ok, vamos continuar e obter o ano. O final do mês pode ser útil caso esteja fazendo o faturamento, mas receba pedidos durante o período. Só depende das regras da sua empresa. Vamos seguir adiante e incluir isto aqui. Se existe algo que estou sempre tentando calcular, convém incluir aqui. Então, vou digitar =FIMMÊS. A data de início está aqui, e quero o fim deste mês em particular. Portanto, vou colocar zero aqui e fechar isto. O valor retornado é o último dia do mês para qualquer dia. Portanto, no dia 9, o resultado continua sendo 31. Agora finalizei minha tabela de datas. Só preciso salvá-la e, depois, posso importá-la em qualquer conjunto de dados em que eu precise trabalhar com esses códigos de datas em particular, ou posso vinculá-la diretamente para o que for preciso no Power BI ou Power Query. Vou seguir em frente e salvar isso. Existem outros conjuntos de dados reutilizáveis muito úteis, como CEPs com latitude e longitude. Eles podem ser usados para mapear dados. O site geonames.org é um mais conhecidos para obter dados de CEPs de todo o mundo de forma gratuita. Você pode usar suas novas habilidades com dados para extrair e limpar exatamente o que precisa em seus projetos. Pode criar conjuntos de dados ou encontrar conjuntos de dados incríveis que atendam às suas necessidades. Basta pensar nos dados que você usa com regularidade e criar um processo para manter esses conjuntos de dados reutilizáveis visando economizar tempo.
Contenido
-
-
-
-
-
-
-
-
O papel do ETL nos dados1 min 59 s
-
Limpeza de dados usando macros do Excel6 min 1 s
-
Limpeza de dados com o Power Query6 min 21 s
-
Como trabalhar com dados reutilizáveis4 min 37 s
-
Modelagem de dados com consultas7 min 13 s
-
Modelagem de dados no Power Query8 min 21 s
-
Desafio: renomear cabeçalhos no Power Query47 s
-
Solução: renomear cabeçalhos no Power Query4 min 7 s
-
-
-