Costruirò pipeline di streaming dati in tempo reale usando kafka, spark e python
Ingegnere di big data
Livello 1
Ha soddisfatto determinati criteri di prestazione e mostra un forte potenziale nel marketplace.
Informazioni su questo servizio
Le applicazioni moderne generano enormi flussi di dati in tempo reale da siti web, app mobili, dispositivi IoT e piattaforme cloud. Elaborare questi dati in modo efficiente richiede architetture di streaming scalabili e pipeline di dati affidabili.
Sono un Data Engineer specializzato in sistemi big data e elaborazione in tempo reale, e ti aiuterò a progettare e implementare pipeline di streaming ad alte prestazioni usando tecnologie come Apache Kafka e Apache Spark.
Ho esperienza nella costruzione di sistemi di dati distribuiti e pipeline di analisi su larga scala, tra cui un sistema di raccomandazione musicale in tempo reale che ha elaborato oltre 100GB di dati in streaming usando Hadoop e Spark, e pipeline ETL in tempo reale con data warehousing per analisi aziendali.
Tecnologie
- Apache Kafka
- Apache Spark / Spark Streaming
- Python / PySpark
- Scala
- AWS / Azure
Esempi di casi d'uso
- Analisi in tempo reale dei siti web
- Elaborazione di transazioni finanziarie
- Pipeline di dati sensore IoT
- Motori di raccomandazione in tempo reale
Mi concentro sulla costruzione di pipeline di streaming scalabili, affidabili e pronte per la produzione che trasformano dati live in insight utili.
Contattami prima di effettuare un ordine per discutere le tue esigenze.
