1 Visualização de dados
Facilmente podemos perceber que algumas visualizações de dados são melhores do que outras. Naturalmente, isso nos faz pensar: será possível definirmos uma regra geral do que funciona e não funciona na construção de um gráfico em qualquer cenário? NÃO!
A eficácia de um gráfico está diretamente relacionada com quem está olhando para ele e seu motivo Por exemplo, uma figura destinada a um público especialista em um determinado assunto, pode não ser de fácil interpretação para um píblico mais leigo.
De uma forma geral, podemos afirmar que bons métodos de visualização oferecem ferramentas extremamente valiosas que devemos usar no processo de exploração, compreensão e explicação de dados.
Usualmente, podemos classificar os problemas relacionados a visualização de dados em três categorias: mau gosto, excessos e percepção ruim. Em muitos casos, um único gráfico pode conter os três problemas. Vejamos abaixo algumas situações problemáticas.
1.1 Excessos nas representações gráficas
Vamos considerar o gráfico de barras apresentado na Figura 1.1. O gráfico mostra a expectativa de vida no ano de 2007 nos 5 continentes. Quais os problemas que percebemos no gráfico?
Um gráfico com muitos detalhes para a quantidade de informação que ele fornece.
As barras são difíceis de ler e comparar.
Rótulos duplicados desnecessariamente.
Efeitos tridimencionais desnecessário.
Sombras projetadas sem utilidade.
Sendo assim, podemos pensar então que remover cores desnecessárias, fundos estranhos, linhas de grades que trazem pouca ou nenhuma informação são práticas que deixam os gráficos mais “clean” e portanto deveriam ser adotadas? Infelizmente, a questão não é tão simples assim.
Há evidências de que gráficos altamente embelezados, como o representado na Figura 1.2 de Nigel Holmes, são frequentemente mais facilmente lembrados do que alternativas mais simples (Bateman et al., 2010). Apesar dos espectadores não os consideram mais facilmente interpretáveis, eles lembram destes gráficos com mais facilidade e também parecem considerá-los mais agradáveis de se olhar.
1.2 Pense no que você quer representar
No dia a dia, é muito mais provável criarmos gráficos simples e com uma boa estética do que gráficos como o de Nigel Holmes. Entretanto, estes gráficos bem estruturados podem levar as pessoas a uma interpretação errada, por conta do formato utilizado.
O que a Figura 1.3 diz para vocês?
1.3 Quais os problemas com as visualizações abaixo?
Faça uma avaliação dos cenários retratados abaixo. Aponte os problemas que cada visualização possui e, se possível, sigira melhorias nas mesmas.
1.4 Um problema básico
Suponha a seguinte situação problema:
Um cientista social possui uma base de dados com informações referentes a domicílios de todo o Brasil. Inicialmente ele gostaria de avaliar algumas variáveis da sua base original.
Faça o que se pede:
Uma visualização gráfica para os dados faltantes da base de dados por variável, que nos permita identificar quais variáveis possuem mais dados faltantes, por exemplo.
Uma visualização que apresente os quantitativos (ou percentuais) de domicílios para cada Grande região.
Uma visualização gráfica que mostre a variabilidade do número de moradores por domicílio para cada grande região.