Progetterò modelli big data e pipeline ETL usando pyspark e databricks

Alcune informazioni sono state tradotte automaticamente.

India

Parlo Hindi, Gujarati, Inglese

34 ordini completati

Esperto di Data Engineering e Cloud Solutions Architect

Esperto data engineer su Azure con oltre 13 anni di esperienza nella creazione di soluzioni di dati scalabili usando Microsoft Fabric, Azure Data Factory (ADF), Azure Data Lake e Synapse Analytics. La...
Informazioni su questo servizio

Elabora petabyte di dati a velocità fulmine con modelli PySpark ottimizzati e pipeline Databricks che scalano all'infinito.


Ti senti sopraffatto da enormi dataset che fanno crashare i sistemi tradizionali? Hai bisogno di un'elaborazione in tempo reale che gestisca miliardi di record senza sforzo? Hai trovato il tuo architetto big data.


Cosa otterrai:

  • Modelli e trasformazioni PySpark scalabili
  • Configurazioni ottimizzate del cluster Databricks
  • Architettura Delta Lake per transazioni ACID
  • Pipeline di elaborazione in tempo reale e batch
  • Query Spark SQL ottimizzate per le prestazioni
  • Strategie di ottimizzazione dei costi e configurazione del monitoraggio


La mia esperienza in Big Data:

Con oltre 13 anni di esperienza nella progettazione di soluzioni Spark, ho costruito pipeline che elaborano più di 500 TB al giorno per giganti della tecnologia, raggiungendo miglioramenti di performance di 10x grazie a tecniche avanzate di ottimizzazione e tuning del cluster.


Tecnologie che padroneggio:

  • Piattaforme: Databricks, Apache Spark, Delta Lake, MLflow
  • Lingue: PySpark, Scala, Spark SQL, Python
  • Ottimizzazione: Catalyst optimizer, partizionamento, strategie di caching

Lingua:

Inglese

Esperienza tecnica:

Apache Spark

Databricks

Snowflake

Expertise:

Pipeline dati

Sviluppo ETL

Data warehousing

Settore:

Analisi dei dati

Servizi finanziari

Altri servizi della categoria Data engineer offerti da me