Costruirò pipeline ETL automatizzate usando Apache Airflow che consolidano i dati
scienziato dei dati
Informazioni su questo servizio
Costruisco pipeline ETL (Extract, Transform, Load) di livello produzione usando Apache Airflow per automatizzare il flusso di lavoro dei tuoi dati e consolidare i dati da più fonti nel tuo magazzino cloud.
COSA OTTIENI
Configurazione e setup di Apache Airflow
- DAG di Airflow pronti per la produzione
- Pianificazione dei job e automazione
- Gestione degli errori e logica di retry
Integrazione delle fonti di dati
- Connessione a qualsiasi API o database
- Supporto: Shopify, Stripe, HubSpot, Google Analytics, ecc.
- Connettori personalizzati se necessari
Trasformazioni dei dati
- Pulizia e convalida dei dati grezzi
- Modellazione dei dati con dbt
- Implementazione della logica di business
Setup del magazzino cloud
- BigQuery, Snowflake o Redshift
- Schemi ottimizzati
- Strategie di partizionamento
Qualità e validazione dei dati
- Controlli di qualità automatizzati
- Rilevamento di anomalie
- Avvisi Slack/Email
Documentazione e supporto
- Diagrammi dell'architettura
- Istruzioni di setup
- Assistenza post consegna
Strumenti e piattaforme:
Altro

