Costruirò e ottimizzerò pipeline scalabili di databricks delta lake
Data Engineering, Azure, AWS, Databricks, Lakehouse, Spark, Fabric
Informazioni su questo servizio
Microsoft & Databricks Certified Senior Data Engineer (oltre 9 anni di esperienza)
Finisci di combattere con dati disordinati. Crea un Lakehouse di livello enterprise che scala facilmente. Come esperto con doppia certificazione, progetterò e ottimizzerò piattaforme di dati pronte per la produzione su AWS, Azure e Databricks.
Cosa offro:
- Architettura Medallion: Implementazione completa dei livelli Bronze, Silver e Gold per garantire l'integrità dei dati.
- Pipeline scalabili: ETL/ELT batch e streaming ad alte prestazioni usando PySpark e Spark SQL.
- Ecologia Databricks: Padronanza di Unity Catalog (Governance), Delta Live Tables (DLT) e Asset Bundles (DABs).
- Integrazione cloud: Configurazione esperta per AWS (S3, Glue, EMR, Athena) e Azure (Fabric, ADF, Synapse, OneLake).
- Ottimizzazione dei costi: Tuning avanzato (Z-Order, Liquid Clustering) per ridurre drasticamente le spese di cloud computing.
- Dati pronti per l'AI: Preparazione specializzata dei dati per GenAI, chatbot RAG e Mosaic AI.
Perché lavorare con me?
- Oltre 9 anni di esperienza: Profonda esperienza con ambienti di dati complessi e su larga scala.
- Di livello produzione: Codice pulito, ben documentato e facilmente manutenibile.
- Focus sulle prestazioni: Sistemi ottimizzati per query in meno di un secondo e massima efficienza.
- Trasforma i tuoi dati grezzi in un asset strategico. Contattami oggi
Il mio portfolio
FAQ
Traduzione automatica.
Che tipo di progetti gestisci?
Gestisco pipeline ETL, architetture lake/lakehouse, migrazione cloud, ottimizzazione dei dati e pipeline di analisi.
Con quali piattaforme cloud lavori?
AWS, Azure e Databricks.
Lavori con dati batch e streaming?
Sì, lavoro con pipeline di dati batch, quasi in tempo reale e streaming.
Quali strumenti e tecnologie utilizzi?
PySpark, Spark SQL, Azure Data Factory, AWS Glue, Databricks, EMR, Synapse e altri.
Puoi ottimizzare pipeline esistenti?
Sì, mi specializzo in ottimizzazione delle prestazioni e riduzione dei costi.
Fornisci documentazione?
Sì, è inclusa documentazione tecnica chiara.
Puoi integrare più fonti di dati?
Assolutamente — API, database, storage cloud e file flat.
Supporti progetti a lungo termine?
Sì, sono disponibile per supporto a lungo termine e collaborazioni continue.
I miei dati saranno sicuri?
Sì. Seguo le migliori pratiche del settore per la sicurezza dei dati e il controllo degli accessi.
Lavori con grandi dataset?
Sì, gestisco regolarmente milioni o miliardi di record.

