Costruirò pipeline di streaming dati in tempo reale usando kafka, spark e python

Alcune informazioni sono state tradotte automaticamente.

Pakistan

Parlo Inglese, Urdu

38 ordini completati

Ingegnere di big data

Sono una persona curiosa che ama imparare, costruire e semplificare sistemi complessi usando dati e AI. Lavoro come ingegnere Big Data a tempo pieno, progettando e automatizzando pipeline che trasfor...

Livello 1

Ha soddisfatto determinati criteri di prestazione e mostra un forte potenziale nel marketplace.

Informazioni su questo servizio

Le applicazioni moderne generano enormi flussi di dati in tempo reale da siti web, app mobili, dispositivi IoT e piattaforme cloud. Elaborare questi dati in modo efficiente richiede architetture di streaming scalabili e pipeline di dati affidabili.


Sono un Data Engineer specializzato in sistemi big data e elaborazione in tempo reale, e ti aiuterò a progettare e implementare pipeline di streaming ad alte prestazioni usando tecnologie come Apache Kafka e Apache Spark.


Ho esperienza nella costruzione di sistemi di dati distribuiti e pipeline di analisi su larga scala, tra cui un sistema di raccomandazione musicale in tempo reale che ha elaborato oltre 100GB di dati in streaming usando Hadoop e Spark, e pipeline ETL in tempo reale con data warehousing per analisi aziendali.


Tecnologie

  1. Apache Kafka
  2. Apache Spark / Spark Streaming
  3. Python / PySpark
  4. Scala
  5. AWS / Azure


Esempi di casi d'uso

  1. Analisi in tempo reale dei siti web
  2. Elaborazione di transazioni finanziarie
  3. Pipeline di dati sensore IoT
  4. Motori di raccomandazione in tempo reale


Mi concentro sulla costruzione di pipeline di streaming scalabili, affidabili e pronte per la produzione che trasformano dati live in insight utili.

Contattami prima di effettuare un ordine per discutere le tue esigenze.

Tecnologia:

Apache Hadoop

Apache Kafka

Apache Spark

Python

SAS

Expertise:

Classificazione

clustering

Estrazione dati

Il mio portfolio