Costruirò una pipeline ETL automatizzata usando Python e Airflow
Data Engineer e Specialista in Web Scraping Avanzato
Informazioni su questo servizio
Smetti di prendere decisioni di business su dati disordinati e poco affidabili.
Sono un Data Engineer specializzato nello Modern Data Stack. Costruisco pipeline di dati robuste, idempotenti e completamente automatizzate che trasformano input grezzi e non strutturati in dati puliti e pronti per l'analisi.
Che tu abbia bisogno di uno script semplice per spostare dati da API o di un data lake completo in "Medallion Architecture", progetterò sistemi scalabili.
La mia esperienza e stack tecnologico:
- Orchestrazione: Apache Airflow
- Streaming in tempo reale: Apache Kafka
- Transformazioni e qualità: dbt Core (test automatici e modellazione dei dati)
- Storage: PostgreSQL, AWS S3, MinIO
- Infrastruttura: Docker Compose, Terraform (AWS EC2, RDS)
- Visualizzazione: integrazioni Metabase
Cosa puoi aspettarti:
- Affidabilità: Pipeline che gestiscono i fallimenti in modo elegante con retry automatici.
- Qualità dei dati: test integrati in dbt (controlli null, unicità) così query solo dati accurati.
- Consegna pulita: codice completamente containerizzato (Docker) con documentazione dettagliata (README.md) per un deployment facile sui tuoi server.
Ti prego di scrivermi prima di effettuare l'ordine così possiamo discutere delle tue fonti di dati e delle esigenze di business!
Il mio portfolio
FAQ
Traduzione automatica.
Deployi la pipeline nel mio ambiente cloud?
Sì! Per il pacchetto Premium, fornisco script Terraform (Infrastructure as Code) per provisioning automatico delle risorse AWS necessarie (EC2, RDS, S3) e deployment della pipeline Dockerizzata.

