Sembra che questo servizio sia in sospeso

Costruirò pipeline ETL scalabili usando Python o PySpark

Alcune informazioni sono state tradotte automaticamente.

India

Parlo Hindi, Inglese

Dal caos dei dati alla chiarezza, fatto bene al primo colpo

Ciao! Sono un Data Engineer con più di 5 anni di esperienza nella creazione di pipeline ETL scalabili e automatizzate usando Python, PySpark e strumenti nativi del cloud. Mi specializzo nell'estrazion...
Informazioni su questo servizio

Se ti trovi sommerso da dati disordinati o fai fatica a spostare i dati tra sistemi diversi,

posso aiutarti con una pipeline ETL pulita, efficiente e scalabile usando Python o PySpark.

Sono un Data Engineer con più di 5 anni di esperienza nella creazione di pipeline dati robuste, nella pulizia di milioni di record e nell'automazione di workflow per startup, aziende e prodotti SaaS.

Quello che offro:

  • Estrazione da CSV, Excel, API, PostgreSQL, MySQL, ecc.
  • Pulizia dei dati (gestione null, duplicati, cast di tipo, ecc.)
  • Logica di business e trasformazioni
  • Caricamento su PostgreSQL, Snowflake, BigQuery, S3, ecc.
  • Logging, gestione degli errori e monitoraggio
  • Pianificazione con cron o Airflow

Strumenti & Tecnologie:

  • Python
  • PySpark
  • Pandas
  • SQLAlchemy
  • psycopg2
  • Apache Airflow
  • PostgreSQL
  • Docker

Destination Platform:

Google BigQuery

Databricks Lakehouse

Strumenti e piattaforme:

Airbyte

AWS Glue DataBrew

Kafka Connect