Outliers - Pontos Fora da Curva

 

Uma flor vermelha se distingue na multidão de flores amarelas

INTRODUÇÃO

Este artigo pretende esclarecer de maneira simples alguns conceitos sobre análise de dados e distorção e anomalias, e o que são outliers em amostras de dados.

 

OUTLIERS

Na era dos dados num contexto virtual de análise é conhecido que a informação seja organizada de forma padronizada. E que o que esses dados compartilham entre si para formar padrões deva ser algo que tem em comum. 

Em contrapartida quando num fluxo de acontecimentos comumente associados daquilo que se observa, se é notado que destoa do todo deste fluxo, podemos generalizar como um comportamento desviante ou incomum, seus atributos são distintos da totalidade. 

No processo de análise de dados as anomalias ou distorções podem ser chamados de outliers ou no literal - pontos fora da curva. Um ponto fora da curva pode ser algo que se diferencia do todo e no contexto de análise de dados.

 ANÁLISE DE DADOS PELO GOVERNO

Para orgãos oficiais de estatística como o IBGE, uma fase crucial de análise de dados é a fase de detecção de padrões anormais de informação, é uma etapa extremamente importante independe do domínio. No entanto nem toda distorção pode ser entendida como um problema, é necessário saber identificar quando um dado é ou não uma anomalia, e se caracteriza como  a parte mais desafiadora para isso existem diversas técnicas envolvidas.


FONTE: https://biblioteca.ibge.gov.br/visualizacao/livros/liv81211.pdf

Comentários

Postagens mais visitadas deste blog

Gerenciamento de versões, mudanças, lançamentos e construção de sistemas em Engenharia de Software

Resenha de Artigo - A importância do teste de software

RESENHA DE ARTIGO: QUALIDADE DE SOFTWARE