Costruirò pipeline di dati scalabili con spark o pyspark
Informazioni su questo servizio
Hai problemi con l'elaborazione di grandi quantità di dati o pipeline ETL lente?
Sono un Data Engineer con oltre 5 anni di esperienza nella creazione di pipeline di dati ad alte prestazioni per sistemi fintech che elaborano milioni di transazioni ogni giorno.
Posso aiutarti a progettare, costruire e ottimizzare pipeline di dati scalabili usando le tecnologie di big data più moderne.
Servizi che offro:
Costruzione di pipeline ETL usando Spark / PySpark
Pipeline di streaming Kafka
Elaborazione di dati batch e in tempo reale
Ottimizzazione delle pipeline di dati
Ingestione di dati da API, database o file
Integrazione con data warehouse
Tecnologie:
Spark | PySpark | Kafka | Scala | Hive | BigQuery | BigTable | SQL | GCP | Azure
Perché scegliermi?
Pipeline di livello produzione
Ottimizzate per grandi dataset
Codice pulito e scalabile
Comunicazione rapida
