Del curso: Análise de Dados Parte 1: Conceitos Básicos
Como lidar com dados não disponíveis
No início da minha carreira com dados, descobri que uma quantidade considerável deles era coletada nos chamados sistemas de origem. Esses sistemas que usamos nas organizações foram criados para capturar dados importantes para elas, desde informações do RH sobre funcionários e informações contábeis até dados de vendas. Comecei a perceber uma tendência na maioria das organizações que eu auxiliava: nem sempre os dados de que precisávamos para gerar um relatório ou monitorar um processo existiam naturalmente em seus sistemas. Podíamos ver um cálculo na tela, mas não estava armazenado nos dados. Além disso, as empresas crescem e mudam, e as informações de que precisam hoje talvez não fossem necessárias quando os sistemas foram criados. Ou às vezes essas informações são valiosas apenas para tomada de decisões, e não são importantes para o sistema em si. O impacto para você, como analista, é que nem todos os dados necessários para medição ou tomada de decisões estão disponíveis. É por isso que entender as funções e saber usá-las para lidar com os dados não disponíveis pode ser um diferencial, ajudando você a criar conjuntos de dados mais proveitosos. Toda pessoa que trabalha com dados precisa entender funções matemáticas básicas, como adição, subtração, multiplicação e divisão. Suponha que você tenha o preço e a quantidade pedida, mas não o total do cliente. Você poderia multiplicar o preço pela quantidade para conseguir essa informação para o relatório. Você também precisa conhecer funções de agregação, como soma, contagem e médias. O sistema gera registros, e talvez você precise contabilizar o que foi pedido, apresentar uma média ou até mesmo o total do pedido. Além dessas fórmulas e funções básicas, entender como combinar campos também pode tornar os dados mais elucidativos para exibição. Essas funções são chamadas de CONCAT ou concatenação e são fundamentais para todos os analistas. Uma das funções de criação de dados mais importantes é a função lógica SE ou IF. A função SE mais básica é um teste lógico: o que acontece se for verdadeiro ou falso. Um exemplo disso seria um desconto ao cliente. A empresa decide que qualquer comprador que fizer um pedido acima de US$ 500 vai ganhar um vale-presente de U$ 50. Escrevemos um teste lógico que diz: o valor do pedido é maior ou igual a 500? Se for, a pessoa ganha US$ 50. Caso contrário, não ganha nada. Não existe um padrão quanto ao tipo ou volume de dados que é preciso criar usando fórmulas ou funções. Somente seus dados e projeto podem determinar o que você precisa criar para alcançar o objetivo. Além disso, a quantidade e os tipos de transformações a serem feitas dependem do que você encontrar nos dados. Não sei se existem muitos conjuntos de dados nos quais eu não trabalhe com datas. Você pode dedicar tempo suficiente para aprender sobre funções envolvendo dados e datas. Saiba também que os tipos de dados afetam questões como datas. Portanto, sabendo se o valor está armazenado no formato errado para o cálculo que deseja realizar, talvez você precise conhecer algumas funções de conversão para transformá-lo no tipo de dado correto. Quero mostrar uma maneira fácil de começar a aprender sobre diferentes funções, e vou usar o Excel como exemplo. Ok, estou no Excel e digo isto para cada software que já abri e quando estou ensinando um novo software para as pessoas: reserve um momento para clicar nas diferentes guias. Apenas leia as guias da esquerda para a direita e veja todas as opções. e o mouse sobre cada opção na faixa e observe o que o programa diz. Agora vamos ar a guia Fórmulas. Observe as diferentes categorias de funções. Estamos vendo a Biblioteca de Funções. Vemos opções como Inserir Função, que ajuda a começar, opções de AutoSoma – Soma, Média, Contar Números, Máx e Mín. Mais uma vez, funções de agregação, superimportantes. Vemos também Usadas Recentemente. Se tivermos usado uma vez, podemos usar de novo. Ao ar o mouse sobre elas, vemos detalhes de cada uma. A Biblioteca de Funções também é dividida em categorias como Lógica, Texto, Data e Hora, Pesquisa e Referência, Matemática e Trigonometria e Mais Funções. O Excel tem uma das bibliotecas de cálculo mais completas do mundo. Vamos dar uma olhada nesta função lógica. Vou escolher Lógica e selecionar SE. Imediatamente, isso abre a paleta de funções, que me permite trabalhar em cada informação e apresenta detalhes de cada parte. Ao clicar em Teste_lógico, ele me diz se o valor é verdadeiro ou falso. É mostrado o Valor_se_verdadeiro com algumas informações e o Valor_se_falso. Também posso clicar em Ajuda sobre esta função. Quando vejo exemplos práticos, acho mais fácil aplicá-los ao meu próprio trabalho. Aproveite a paleta ou construtor de funções em qualquer ferramenta que você use, pois pode servir de orientação e ainda ajudar a dominar a sintaxe. Os dados determinam os tipos de fórmulas e funções que você vai usar. Não nascemos sabendo criar funções SE e concatenações, mas você vai aprender a sintaxe e também quando aplicá-las.