Del curso: Análise de Dados Parte 1: Conceitos Básicos
Introdução a junções
Um dos conceitos mais difíceis para novos analistas é como combinar dados de várias tabelas. Não existe uma solução única aplicável a todas as situações. Se estiver trabalhando com conjuntos de dados que já foram combinados para você, ótimo. Porém, ao receber o a várias tabelas no back-end, provavelmente vai precisar combiná-las, e isso costuma ser feito por meio de consultas. Outra questão a ter em mente é que programas que trabalham com vários conjuntos de dados geralmente oferecem uma forma de combiná-los. No Excel, são os PROCVs. Já nos bancos de dados, são as consultas. Cada conjunto de dados precisa de uma maneira de relacionar os dados, algo em comum nos dois conjuntos. No melhor dos casos, é um campo de chaves que atribui uma identificação única às informações, para que você possa usá-lo ao combiná-las. Vale ressaltar que, nas consultas, existem diferentes tipos de junções – internas, externas e cruzadas. O tipo de junção determina o resultado, então é importante compreendê-la. Quanto mais prática ou experiência você adquirir, mais natural se tornará atribuir junções com base nos resultados desejados. Muitas pessoas combinam dados no Excel. Elas não percebem que estão criando junções. Estão usando PROCVs para formar uma junção baseada em um campo de chaves, extraindo um campo por vez. Vamos falar dos diferentes tipos de junção. Uma junção cruzada ocorre quando incluímos tabelas em uma janela de consulta e não as unimos com um campo de chaves. Isso liga cada registro de uma tabela a um registro da outra. Poderia ser vantajoso se houvesse a intenção de fazer isso, mas a maioria das pessoas simplesmente se esquece de incluir a junção. Quando temos duas tabelas que têm uma junção em um campo, a junção-padrão é a interna. Isso significa que, se houver um registro correspondente em cada tabela, ele será exibido nos resultados. Um exemplo seria se quiséssemos ver uma lista de vendas e os produtos que foram encomendados. Nesse caso, seria adequado usar uma junção interna. Em seguida, temos as junções externas esquerda e direita. A definição de esquerda ou direita varia conforme o sistema. No começo, é mais importante entender o que faz uma junção esquerda ou direita, nem tanto qual é qual. As junções externas esquerda ou direita retornam todos os registros de uma tabela e os registros correspondentes da outra tabela. Isso significa que podemos ver todos os registros de um lado, independentemente dos valores correspondentes do outro lado. Portanto, se o objetivo é mostrar uma lista de produtos e se foram feitos pedidos, essa é a junção indicada. Quando você receber dados para trabalhar e o ao back-end, vai adquirir muita experiência prática trabalhando com junções. Todo programa de dados disponibiliza uma forma de combinar esses dados e, muitas vezes, apresenta informações na tela que ajudam a compreender qual será o resultado do conjunto de dados.
Contenido
-
-
-
-
-
Interpretação de dados já existentes3 min 32 s
-
Como encontrar dados já existentes3 min 19 s
-
Limpeza de dados2 min 6 s
-
Uma visão dos dados e do fluxo de trabalho5 min 48 s
-
Introdução a junções3 min 6 s
-
Como trabalhar com junções e validação6 min 44 s
-
Desafio: produtos não classificados44 s
-
Solução: produtos não classificados2 min 35 s
-
-
-
-
-
-