Svilupperò pipeline ETL scalabili utilizzando Databricks
Informazioni su questo servizio
Hai bisogno di una pipeline ETL robusta e scalabile costruita su Databricks? Sei nel posto giusto!
Io sono Gajendra, un Data Engineer e Data Analyst certificato con oltre 6 anni di esperienza nella creazione di soluzioni dati end-to-end per clienti aziendali. Che tu lavori con dati batch o streaming, mi specializzo nella progettazione di pipeline ETL pulite, efficienti e pronte per la produzione usando Databricks, PySpark e AWS.
Cosa offro:
- Sviluppo di pipeline ETL/ELT end-to-end su Databricks
- Ingestione dati da più fonti (S3, RDS, API, ecc.)
- Pulizia, trasformazione e arricchimento dei dati usando PySpark
- Integrazione con Delta Lake, SQL e storage cloud
- Orchestrazione dei workflow con Databricks Jobs o Apache Airflow
- Deployment con controllo di versione (Git, CI/CD)
- Documentazione e consegna tramite notebook
Strumenti & Tecnologie: Databricks (Jobs, Notebooks, Delta Lake), PySpark, SQL, AWS (S3, Glue, Lambda, RDS), Airflow / Databricks Workflows, Git, CI/CD, DBFS
Perché lavorare con me?
- Certificato in Databricks & AWS
- Oltre 6 anni di esperienza in Data Engineering & Analytics
- Comunicazione rapida e chiara
- Codice di livello produzione con design riutilizzabile
Automatizziamo e scalare i tuoi workflow di dati nel modo giusto!
FAQ
Traduzione automatica.
Di cosa hai bisogno da me per iniziare?
Solo una breve descrizione delle tue fonti dati, output attesi e configurazione cloud (se presente).
Puoi lavorare con dati on-premise o altri provider cloud?
Sì, ma AWS è la mia principale competenza. Possiamo discutere altre opzioni.
