Costruirò una pipeline ETL automatizzata usando Python e Airflow
Junior Data Scientist, ML Engineer, Python, Pipelines ETL
Informazioni su questo servizio
I tuoi dati sono in API o file senza un modo automatizzato per raccoglierli e archiviarli? Costruisco pipeline ETL pronte per la produzione usando Apache Airflow 3 e Python che estraggono, trasformano e caricano i tuoi dati secondo un programma, completamente automatizzato, senza lavoro manuale.
Cosa consegno:
- Pipeline automatizzata con task indipendenti di estrazione, trasformazione e caricamento
- Apache Airflow 3 con TaskFlow API e pianificazione giornaliera
- Stack Docker multi-container per un deployment pulito e riproducibile
- Database PostgreSQL con record strutturati e interrogabili
- Codice sorgente completo consegnato tramite GitHub
Perché me? Ho una pubblicazione peer-reviewed in conferenza IEEE, doppie certificazioni DataCamp (Certified Data Scientist e Certified Associate Data Scientist) e uno stage di ricerca presso un laboratorio di AI nel Regno Unito. La mia pipeline ETL funziona in produzione, accumulando oltre 365 record strutturati all'anno senza intervento manuale.
Lavoro con: API REST e fonti di dati basate su file, caricando in PostgreSQL.
Nota: Per favore, inviami un messaggio prima di ordinare per discutere della tua fonte di dati e delle tue esigenze.
Destination Platform:
PostgreSQL
•
MySQL
Strumenti e piattaforme:
Altro
Il mio portfolio
FAQ
Traduzione automatica.
A quali fonti di dati puoi collegarti?
Attualmente API REST. Se hai una fonte diversa come file CSV o un database, inviami un messaggio prima e possiamo discutere della fattibilità.
Devo già avere Apache Airflow installato?
No. Configurerò l'ambiente della pipeline per te, inclusa la configurazione Docker se necessario.
La pipeline funzionerà automaticamente senza che faccia nulla?
Sì. I pacchetti Standard e Premium includono automazione completamente pianificata con Apache Airflow che funziona secondo il tuo programma senza trigger manuali.
Riceverò il codice sorgente?
Sì, tutti i pacchetti includono il codice sorgente Python completo e i file DAG.
È possibile lavorare con il mio database esistente?
Sì, purché tu possa fornire in modo sicuro le credenziali di connessione. Ti consiglio di discuterne prima di ordinare.

