Costruirò pipeline ETL su databricks con spark

Alcune informazioni sono state tradotte automaticamente.

Pakistan

Parlo Urdu, Inglese

Data Engineer specializzato in ETL Pipelines, Databricks, Azure e Power BI

Data Engineer con oltre 5 anni di esperienza nella realizzazione di pipeline ETL/ELT scalabili, flussi di lavoro Databricks, piattaforme dati Azure, soluzioni Microsoft Fabric e dashboard Power BI. E...

Continua a leggere

Informazioni su questo servizio

Ciao, sono un consulente di Data Engineering con oltre 5 anni di esperienza nella creazione di pipeline di dati in produzione su Databricks.

Ho progettato carichi di lavoro reali su Databricks in produzione, tra cui una Customer Data Platform che elabora grandi dataset con PySpark, Delta Live Tables e architettura medallion. Lavoro quotidianamente su Databricks, non solo come parola di moda.

Cosa costruirò per te:

Pipeline ETL end-to-end (batch o streaming)
Architettura medallion Bronze Silver Gold
Delta Lake con ACID, evoluzione dello schema, time travel
Transformazioni PySpark ottimizzate
Ingestione da API, SQL Server, MySQL, Postgres, ADLS, S3, GCS, CSV, JSON, Parquet
Carichi incrementali con MERGE INTO e CDC
Autoloader, pianificazione dei job, orchestrazione dei workflow
Codice pulito, modulare, sotto controllo versione

Perché lavorare con me: