Costruirò pipeline di big data e processerò dataset usando pyspark e sql

Alcune informazioni sono state tradotte automaticamente.

Pakistan

Parlo Inglese, Francese

Ingegnere AI, Data e Web3

Sono un ML & Data Engineer con un Master in Data & Intelligence dall'Université Claude Bernard Lyon 1. Mi specializzo nel colmare il divario tra la ricerca avanzata sull'AI e software scalabili e pron...
Informazioni su questo servizio

Hai problemi con dataset enormi o tempi di elaborazione lenti?


Sono un Data Engineer specializzato in elaborazione di Big Data su larga scala, ETL e analisi. Costruisco pipeline di dati altamente ottimizzate per ingestione, pulizia e trasformazione di gigabyte di dati in modo efficiente usando PySpark e Python. Che tu abbia bisogno di aggregazioni complesse, mapping geospaziali o visualizzazioni pulite, consegno codice pronto per la produzione.


I miei servizi principali:


  • Pipeline di Big Data: Workflow ETL ad alte prestazioni usando Apache Spark, PySpark e Python.
  • Trasformazioni avanzate: Query Spark SQL ottimizzate, funzioni finestra complesse, UDF e join su larga scala.
  • Integrazione dati: Pulizia e formattazione di dati strutturati/semi-strutturati per analisi downstream.
  • Dati geospaziali: Elaborazione di dati basati sulla posizione e serie temporali.
  • Visualizzazioni intuitive: Trasformare big data in visualizzazioni pratiche usando Pandas e Matplotlib.


Stack tecnologico: Python | Apache Spark | PySpark | Spark SQL | Pandas | Matplotlib


Perché scegliermi?

Scrivo codice pulito, scalabile e completamente documentato, assicurando che le tue operazioni sui dati siano precise e ottimizzate dal punto di vista computazionale.


Contattami prima di ordinare per discutere del tuo dataset!

Destination Platform:

Databricks Lakehouse

PostgreSQL

Strumenti e piattaforme:

Altro