Del curso: Linguagem de Programação R para Ciência de Dados: Formação Básica
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 25.000 cursos impartidos por expertos del sector.
Feature engineering no R, trabalhando com datas, textos e fatores
Del curso: Linguagem de Programação R para Ciência de Dados: Formação Básica
Feature engineering no R, trabalhando com datas, textos e fatores
Aqui, em termos ferramentais, temos novamente o contexto em que saber o que fazer é a parte mais desafiadora. Ainda assim, construir features podem ter suas dificuldades, particularmente, se estivermos trabalhando com dados menos usuais, como textos, datas e fatores. E nisso o "R" consegue nos ajudar. Temos três pacotes importantes na "tidyverse": o stringr, o lubridate e o forcats. O stringr nos ajuda a trabalhar com variáveis de texto, nos ajudando a detectar a presença de padrões, fazer contagens, substituições ou mesmo alterações simples. Deixei aqui um exemplo do que é possível ser feito utilizando o stringdetect. Assim como para a string de contagem. Mas o que eu queria comentar mesmo era a Cheat Sheet. Nela, podemos ter uma visão geral de tudo que o stringr oferece, detectar padrões, fazer subgrupos, alterar tamanhos. Na segunda página, existe ainda algumas dicas em relação a regex. Continuando por aqui temos o pacote lubridate. Assim como stringr é focado em strings, o…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
-
-
-
-
Pré-processamento (dataprep), o que é?1 min 51 s
-
(Bloqueado)
Pré processamento de dados no R2 min 55 s
-
(Bloqueado)
Tratando dados faltantes e imputação de dados (missing)4 min 19 s
-
(Bloqueado)
Feature engineering, o que é?3 min 2 s
-
(Bloqueado)
Feature engineering no R, trabalhando com datas, textos e fatores4 min 10 s
-
(Bloqueado)
Considerações finais37 s
-
-
-
-