Mais cedo ou mais tarde, o analista se depara com o problema de organizar os dados. HĂĄ cada vez mais deles, a estrutura nĂŁo Ă© mais transparente e as mesmas consultas SQL precisam ser reescritas vĂĄrias vezes. Para resolver esse problema, vocĂȘ pode usar dbt - uma ferramenta que abre uma nova abordagem para a transformação e modelagem de dados. Abaixo do corte estĂĄ uma tradução do excelente artigo de David Crewitt sobre o que Ă© dbt e como ele ajuda os analistas a tornar seu trabalho mais fĂĄcil.
dbt (ferramenta de construção de dados) é uma estrutura de código aberto para executar, testar e documentar consultas SQL que traz um elemento de engenharia de software para o processo de anålise de dados.
Esta é uma ótima peça da caixa de ferramentas preguiçosa para ajudå-lo a nunca se repetir ao analisar dados.
Substituindo uma Consulta Salva
Cada consulta SQL merece um bom lar. No dbt, as consultas SQL sĂŁo estruturadas e organizadas em pastas de projeto, para que todos os membros da equipe sempre saibam onde encontrĂĄ-las:
Sempre que vocĂȘ precisar executar consultas, use o comando dbt run.
Este comando pega uma coleção de modelos SQL no projeto dbt e os atualiza no armazenamento de dados.
Simples mas efetivo.
Isso significa que vocĂȘ nĂŁo precisa mais salvar fragmentos de consultas SQL em sua ĂĄrea de trabalho ou em qualquer outro lugar, como um baĂș do tesouro.
â . - , .
dbt â , .
ref(â â)
dbt * * SQL-, {{ ref(âmodel nameâ) }}.
:
, . dbt , , :
/admin
/base
/join /
/math (, ) ( . .)
/visualization + , .
, .
« Google Analytics?»
base -> google-analytics.
« ?»
Math -> cohort-analysis.
SQL-. dbt â Monster Queriesâą, .
SQL
dbt SQL- : + JINJA.
SQL- .
, CASE 15 :
CASE WHEN x = y THEN z
WHEN 2x = 2y THEN 2z
--⊠.
â , :
dbt SQL .
dbt dbt_utils, .
, CIFL :
JINJA
, : FOR, IF-THEN . .
dbt SQL-, JINJA.
, SQL- , .
1 â2 â9.
2 â4 â11.
, « » .
dbt :
dbt , JINJA:
, , , , . «» .
dbt + Git
dbt + Git . «Pull Requests» «Issues». SQL- Slack/Notion/email.
:
SQL- , . â .
, . , .
SQL , .
SQL-
« ?» â .
dbt .
Fishtown Analytics (, dbt) dbt Cloud, hosted dbt .
dbt Cloud , .
, â $50 .
«»
« ?»
« ?»
â . :
, .
, , , , 100% , , .
, â , , , .
, : , Google BigQuery Google Data Studio.
dbt :
`dbt docs` , SQL .
dbt + .yml .
BigQuery:
Data Studio:
(Snowflake . .) (Looker . .) . , .
?
, , . , , .
dbt .
, - , dbt . JOIN , dbt .
, SQL- , dbt .
â BigQuery, Snowflake PostgreSQL â , SQL. BigQuery Snowflake Redshift BigQuery, SQL, .
dbt ! . dbt . dbt , ( , , MS SQL).
CIFL , , , .
dbt
Se vocĂȘ estĂĄ pronto para lidar com a implementação de dbt em sua equipe, o seguinte pode ajudar:
Curso gratuito " Getting Started with BigQuery SQL ", que inclui uma introdução à modelagem de dados com dbt.
O curso Build Your Data Agency, lançado recentemente, para um mergulho mais profundo na anålise de dados baseada em dbt.