Fundamentos de Análise Exploratória de Dados
O que é? Onde mora? O que come essa tal de EDA?
Inscreva-se na lista e receba noticias, tutoriais e mais
O que é? Onde mora? O que come essa tal de EDA?
EDA - Exploratory Data Analysis
Dados podem ser uma coleção de objetos, números, palavras, eventos, fatos, medidas ou mesmo apenas uma descrição de coisas do mundo real. Tais dados são coletados e armazenados devido a eventos ou processos que ocorrem em diversas disciplinas como biologia, economia, engenharia e marketing.
O processamento desses dados produz informação. Essa informação analisada em um determinado contexto produz conhecimento.
Um cientista de dados pode estar envolvido em várias fases da análise de dados, incluindo os requisitos para os dados, coleta, processamento, limpeza, exploração, modelagem, algoritmos, implantação em produção e comunicação.
Os componentes principais da análise exploratória de dados incluem a sumarização de dados, análise estatística e visualização de dados.
O Python possui muitas ferramentas para isso: pandas para sumarização; scipy para análise estatística; matplotlib e plotly para visualizações.
Basicamente, existem quatro etapas diferentes; Vamos defini-las brevemente:
Fontes Heterogêneas: Atualmente os dados são coletados das mais diversas fontes (pesquisas, sistemas internos, internet, vendas). Tratar esses dados e uni-los em uma única plataforma vem se tornando um desafio pro setor.
Nos siga em @aprendadatascience para mais informações.