Del curso: Análise de Dados Parte 1: Conceitos Básicos
Modelagem de dados com consultas
Existem muitas maneiras de modelar dados. Quando temos o ao back-end de um banco de dados, é provável que usemos consultas para modelar os dados. Utilizamos junções para criar os conjuntos de dados necessários. Vamos dar uma olhada nos dados modelados com um banco de dados para consultas. Os dados da nossa pesquisa foram capturados neste banco de dados, e as pessoas responderam em datas diferentes. Podemos ver que a data de início é em dias diferentes. Portanto, tenho 24/7, 25/7. Posso rolar e examinar as 262 respostas. Temos que analisar as respostas por data. Também precisamos ver qual dia da semana ou até qual mês foi mais comum. Por exemplo: qual foi o dia mais comum, segunda-feira ou domingo? Vamos trazer nossos dados sobre datas. Seleciono Dados Externos > Nova Fonte de Dados > Do Arquivo > Excel. Vou usar meu conjunto de datas reutilizável. Para isso, vou procurar e escolher Datas. Não preciso vincular ou acrescentar uma cópia. Vou só importar os dados de origem e clicar em OK. Estas são as informações do arquivo. Vou escolher Avançar. “A primeira linha contém títulos de coluna.” Vou escolher Avançar, Avançar de novo, não preciso de uma chave primária, Avançar e Concluir. Não preciso salvar as etapas de importação. Vou escolher Fechar. Agora tenho a Pesquisa de Dados de Despesas e minha tabela CodigosDatas. Isso me permite trazer esses pontos de dados sem ter que ficar criando esses cálculos com frequência. Ok, vamos fazer uma consulta. Vou escolher Criar e Design da Consulta. Certo, vamos começar analisando o dia mais comum. Vou escolher Criar e selecionar Design da Consulta. Vou incluir CodigosDatas e Dados de Despesas. Vou escolher a data oficial e juntar com a data de início. Uma junção interna funciona bem aqui, porque só quero ver as informações sobre a data do entrevistado. Ok, vou fechar a janela Adicionar Tabelas. Quero incluir o nome do dia da semana e então todos os dados da pesquisa. Vou verificar a contagem de registros. Tenho 262, então deveria indicar 262 resultados. Vou executar isso. Ótimo, estou vendo todos os nomes dos dias da semana e não preciso fazer nenhum outro cálculo para conseguir essa informação. Estou trabalhando com os dados puros, não com uma data formatada, o que está bom dependendo do que estou tentando fazer. Gosto de ter esses dados. Certo, vamos chamar esta de DiaMaisComumNaPesquisa. Maravilha. O próximo objetivo é identificar se as pessoas respondem à pesquisa todos os dias do período da pesquisa. Lembrando que a pesquisa foi feita de 24/7 a 30/8 de 2020. Como a tabela de datas contém cinco anos de datas, primeiro quero filtrar esses dados com uma consulta. Vou clicar em Criar, escolher Design da Consulta, adicionar CodigosDatas e fechar isto. Para incluir todas as informações, vou segurar a tecla Shift, clicar no último campo e arrastar para baixo. No campo de critérios da consulta – vou arrastar um pouco para cima – vou especificar “entre 24/7/2020 e 30/8/2020”, pois esse é o período da pesquisa. Como estou usando o Access, ele colocou as datas entre cerquilhas. Muito bem, vou escolher Executar. Agora vejo os 38 dias em que houve atividade na pesquisa. Vamos salvar essa consulta como PeriodoPesquisa e clicar em OK. Bem, vou fechar isto, fechar DiaMaisComum e os 262 resultados. Lembrando, meu objetivo é identificar em quais dias não houve resposta à pesquisa e em quais houve. Para fazer isso, preciso trabalhar com a consulta e os tipos de junção. Vou escolher Criar > Design da Consulta. Vou incluir os dados de despesas e o período da pesquisa, pegar a data oficial e juntar com a data de início. Vou incluir a data oficial, o nome do dia da semana, o nome do mês, o ano e até o dia da semana. Em seguida, vou colocar tudo que está na Pesquisa de Dados de Despesas clicando duas vezes neste asterisco. Agora quero alterar o tipo de junção, pois desejo ver cada registro do período da pesquisa. Isso significa que todas as datas entre 24/7 e 30/8 devem aparecer nos resultados, independentemente de terem registro na Pesquisa de Despesas. Vou clicar com o botão direito nas propriedades da junção, pedir para incluir todos os registros do período da pesquisa, clicar em OK e executar a consulta. Vamos ver se conseguimos identificar um dia em que não houve resposta à pesquisa. Vamos lá. Perto do final do período da pesquisa, vejo que nos dias 8/8 e 9/8 não houve respostas. O mesmo ocorre nos dias 11 e 12. Porém, existe uma questão que me deixa um pouco perplexa: há 281 resultados. Sei que tinha 282, então preciso investigar isso. Vou abrir a Pesquisa de Despesas e classificar as datas. Vamos do mais antigo para o mais recente e depois do mais recente para o mais antigo. Ah, tenho uma data fora do período da pesquisa. Ela foi excluída automaticamente com base na minha consulta. Investigação encerrada, está tudo bem. Vamos salvar isso, chamar de TodosOsDiasDaPesquisa e clicar em OK. Essa é apenas uma maneira fácil de realizar a tarefa. É uma técnica valiosa quando é preciso representar dados que não são capturados no processo. Utilizamos dados, consultas e junções em prol de nossas necessidades.
Contenido
-
-
-
-
-
-
-
-
O papel do ETL nos dados1 min 59 s
-
Limpeza de dados usando macros do Excel6 min 1 s
-
Limpeza de dados com o Power Query6 min 21 s
-
Como trabalhar com dados reutilizáveis4 min 37 s
-
Modelagem de dados com consultas7 min 13 s
-
Modelagem de dados no Power Query8 min 21 s
-
Desafio: renomear cabeçalhos no Power Query47 s
-
Solução: renomear cabeçalhos no Power Query4 min 7 s
-
-
-