6 princípios de visualização de dados eficaz

Princípios fundamentais para a criação de gráficos úteis e informativos



A visualização de dados é uma etapa essencial no processo de compreensão da ciência de dados. É aqui que você apresenta e relata seus resultados em um formato gráfico intuitivo e fácil de entender.



A visualização de dados exige muito trabalho, muita limpeza e análise são necessárias para destilar e transformar dados sujos em belos gráficos e tabelas. Mas mesmo com os dados preparados, você ainda precisa aderir a certos princípios ou metodologias para criar gráficos úteis e informativos.



No entanto, ao escrever este artigo, me inspirei no livro Beautiful Evidence de Edward Taft, que contém seis princípios sobre como tornar os gráficos de dados úteis. São esses princípios que separam os gráficos úteis dos inúteis.



Este artigo também é fortemente inspirado na Análise de dados exploratórios de Roger D. Peng em R. Ele está disponível gratuitamente no Bookdown e você pode lê-lo para aprender mais sobre EDA.



Vamos examinar mais de perto esses princípios.





Um exemplo de visualização de dados em Our World in Data






1. Mostrar comparação (grupos de controle e experimentais)



A demonstração de comparação é a base de uma boa pesquisa científica. As provas de uma hipótese estão sempre relacionadas a outra coisa. Vamos dar um exemplo: você diz: "O chocolate amargo melhora a concentração e a capacidade de aprendizagem". A pergunta importante nesta declaração é "comparado a quê?" Sem comparação (hipótese relativa), a afirmação é inútil.



Uma maneira de mostrar a comparação é com os grupos de controle e de tratamento. As pessoas de um grupo comem chocolate, as do segundo grupo, não. Dessa forma, você pode comparar os efeitos do chocolate na concentração e na capacidade de aprendizagem com base em resultados de testes ou medindo a atividade cerebral.



Ao criar gráficos para a apresentação de sua pesquisa, você pode representar graficamente os grupos de controle e tratamento usando a caixa do bigode. Dessa forma, os leitores têm uma ideia clara do efeito do experimento.



Ao criar gráficos para representar sua pesquisa, você pode representar graficamente os grupos de controle e tratamento usando um gráfico retangular. Dessa forma, o leitor tem uma ideia clara das consequências do tratamento.



2. Causalidade e explicação



O que se segue é uma explicação que mostra a causalidade em pensar sobre a pergunta que você está tentando responder. Se você mostrou que um efeito é obtido no grupo experimental, mas não no grupo de controle, deve formular uma hipótese a partir das evidências de por que isso acontece.



Voltando ao exemplo anterior, digamos que os sujeitos do grupo experimental obtiveram notas mais altas no teste, o que mostra que o chocolate amargo melhora a concentração. Uma pergunta importante: por que exatamente isso?



Essa pergunta é importante porque ajuda a levantar outras questões que podem refutar ou apoiar sua hipótese ao longo do estudo.



Para mostrar uma relação causal ou mecanismo, você pode medir a atividade cerebral dos grupos de controle e tratamento e representar graficamente os resultados, mostrando-os lado a lado. Usando o gráfico de pontuação do teste e o gráfico de atividade cerebral, você verá o motivo pelo qual os indivíduos que tomaram chocolate receberam as pontuações mais altas, ou seja, a resposta à pergunta de como o chocolate amargo melhora a função cognitiva.



3. Dados com muitas variáveis ​​(mais de duas variáveis)



O mundo real é complexo e a relação entre dois eventos geralmente não é linear. Portanto, na pesquisa, você tem atributos ou variáveis ​​que pode medir. Todas essas variáveis ​​interagem umas com as outras de maneiras diferentes. Alguns deles podem ser confusos , enquanto outros podem ser atributos importantes que explicam a relação dos eventos.



Como você já sabe, correlação não implica causalidade. Portanto, não é uma boa ideia limitar sua pesquisa a apenas duas variáveis: isso leva a conclusões errôneas. Portanto, você deve mostrar o máximo de dados possível em seus gráficos. Isso pode ajudá-lo a descobrir qualquer confusão em seus dados.



Veja o paradoxo de Simpson, um paradoxo na estatística probabilística, quando “quando os grupos se combinam, desaparece a tendência que ocorre nos diferentes grupos de dados”. Ilustrar:



  • Duas variáveis ​​- relação negativa.

  • Três variáveis ​​são relacionamento positivo (x, y, z) (existem variáveis ​​confusas).



4. Não deixe que as ferramentas conduzam a análise



Um bom contador de histórias sabe como atrair a atenção das pessoas enquanto conta uma história de maneira produtiva. O contador de histórias não se limita à própria história, mas pode expressá-la de uma forma única, combinando diferentes percepções e incluindo múltiplas imagens, dando vida à história.



Da mesma forma, um bom visualizador de dados não se limita às ferramentas de visualização disponíveis. A pessoa que renderiza os dados tem a capacidade de alternar de uma forma de expressão (por exemplo, linhas ou círculos) para usar vários modos de apresentação.



Por exemplo, ao invés de criar relatórios contendo apenas texto, use infográficos: imagens, gráficos, palavras, números, etc., tudo isso irá enriquecer a informação. Com uma abundância de informações e gráficos, os leitores podem observar muitas correlações diferentes de evidências em um só lugar. Portanto, lembre-se de que você está contando uma história. Não deixe que as ferramentas limitem seu pensamento. Deixe a análise conduzir as ferramentas, criando gráficos impressionantes e ricos em evidências.



5. Documente seus gráficos com rótulos, escalas e fontes de dados apropriados



Quando você olha um gráfico pela primeira vez, vê primeiro o título e depois os rótulos de contexto do gráfico. Sem eles, o gráfico não diz nada. Bons relatórios / gráficos são devidamente documentados com escalas e rótulos apropriados atribuídos a cada gráfico. As fontes de dados usadas para criar os gráficos também são críticas. Assim, é uma boa prática manter o código que foi usado para gerar os dados e gráficos: isso permite que os dados sejam reproduzidos. Ele também adiciona credibilidade aos seus gráficos. Além disso, ao salvar o código, você pode editar o gráfico, se necessário.



6. O conteúdo vem primeiro



Em última análise, independentemente de todos os princípios acima, sem conteúdo de qualidade, relevante e holístico, seus gráficos serão inúteis ou enganosos. Em outras palavras, "lixo dentro, lixo fora". Antes de relatar qualquer resultado, certifique-se de que o resultado seja algo interessante e importante. Não importa quão bonitos ou visuais sejam seus gráficos, ninguém quer resultados inúteis. Algo interessante é a experiência pessoal ou algo inspirado na Internet. Em qualquer caso, sempre faça perguntas: é assim que a ideia se torna realidade.



Conclusão



A visualização de dados é uma habilidade incrível. Você pode pegar dados e transformá-los em belos gráficos e tramas que contam uma história às pessoas. Em uma era em que os dados estão crescendo exponencialmente, é cada vez mais importante ser capaz de contar uma história com dados. Este é o melhor momento para aprender coisas novas. E um resumo dos princípios:



  1. Mostrar comparação.
  2. Mostre as razões.
  3. Mostra dados multidimensionais.
  4. Combine o máximo de evidências possível.
  5. Descreva e documente a programação.
  6. Certifique-se de que sua história seja interessante.


O que quero que você tire deste artigo é o seguinte: lembre-se sempre de começar com uma boa pergunta, use a abordagem certa e apresente apenas as informações necessárias para responder à sua boa pergunta.



Deixo esta citação do matemático americano John Tukey , que inaugurou uma nova era de estatística: 



Um gráfico simples trouxe mais informações à mente de um analista de dados do que qualquer dispositivo.


Para uma compreensão mais profunda desses princípios, recomendo consultar o livro "Exploratory Data Analysis in R", de Roger D. Peng (deixarei um link para ele abaixo).



Recursos e links



Se você quiser saber mais sobre visualização de dados, confira estes ótimos livros gratuitos:





Plataformas que apresentam belas visualizações




Guias para a criação de gráficos estão disponíveis nesses recursos.




Links para este artigo




Obrigado por ler!



imagem






Outras profissões e cursos


















All Articles