Qual linguagem usar para a análise de dados é o tópico mais banal e doloroso. Por isso, nos associamos a Alexei Seleznev, chefe de analítica da Netpeak e autor do canal de telegramas R4Marketing , e preparamos uma comparação de operadores SQL e verbos da linguagem R. Por conveniência e portabilidade, fizemos em cartões.
Publicamos materiais ainda mais interessantes sobre programação e análise de dados a cada dia em nosso canal Telegram e no grupo VK . Talvez você encontre algo interessante para você.
No entanto, direto ao ponto!
R vs SQL
A primeira coisa a fazer antes de fazer uma comparação é revisar as instruções SQL básicas. Claro, todos vocês se lembram deles, mas de repente ...
Vamos considerar a instrução SELECT DML (Linguagem de Manipulação de Dados) e tudo relacionado a ela:
A própria instrução SELECT rege quais campos selecionar da tabela
A cláusula FROM aponta para a tabela a partir da qual a seleção é feita
A cláusula WHERE filtra a tabela pelos valores de uma coluna específica
GROUP BY especifica campos de agrupamento para calcular características de agregação
O operador ORDER BY classifica as linhas da tabela por valores em alguma coluna
, . R? - dplyr R ( ), .
dplyr ( tidyverse) , , :
, ,
dplyr tidy data
( %>%)
, SQL dplyr:
, , dplyr . - , :) , (.. dplyr - tidyverse) . :
Tidy data
tidy data. , 100% .
, , « »:
Data Analysis:
«» , «» -.
tidy datasets dplyr !
, tidy data .
%>%
, R - %>%. , , tidyverse.
- .
, - 2 : R, SQL, - . R - , - .