Costruirò un data lake AWS e una pipeline ETL usando pyspark

Alcune informazioni sono state tradotte automaticamente.

Pakistan

Parlo Inglese

Data Engineer cloud che costruisce pipeline ETL scalabili

Ciao, sono un Data Engineer indipendente specializzato nella costruzione di pipeline ETL scalabili e architetture di dati cloud robuste. Aiuto le aziende a trasformare log disordinati e non strutturat...
Informazioni su questo servizio

Come Data Engineer, progetterò architetture robuste native del cloud e pipeline ETL scalabili. Che si tratti di elaborare log ad alto volume o di costruire Medallion Data Lakes, fornisco soluzioni pulite e ottimizzate.

Cosa offro:

  • Pipeline ETL End-to-End: Estrazione, trasformazione e caricamento automatizzati dei dati usando Python e PySpark.
  • Data Lake nel cloud: Architettura di Medallion Data Lakes senza server (Bronze, Silver, Gold) su AWS (S3, Glue, Athena).
  • Architettura di database: Progettazione di database relazionali (3NF) e ottimizzazione di query SQL complesse (CTE, funzioni finestra) in PostgreSQL.
  • Ottimizzazione delle prestazioni: Riduzione dei tempi di elaborazione dei dati e abbattimento dei costi di storage usando formati come Apache Parquet.

Stack tecnologico: AWS (S3, Glue, Athena) | PySpark | Python | PostgreSQL | SQL avanzato | Git/GitHub

Perché scegliermi? Scrivo codice pronto per la produzione, garantisco design scalabili e seguo rigorosamente le best practice di data engineering.

Contattami prima di ordinare per discutere nel dettaglio il tuo progetto!

Lingua:

Inglese

Urdu

Esperienza tecnica:

dbt (Data Build Tool)

Apache Airflow

Expertise:

Pipeline dati

Sviluppo ETL

Integrazione dati

Settore:

Analisi dei dati

Il mio portfolio