Costruirò pipeline ETL spark per elaborazione batch e flussi di lavoro big data

Alcune informazioni sono state tradotte automaticamente.

Turchia

Parlo Turco, Inglese

10 ordini completati

Soluzioni scalabili, codice pulito e comunicazione chiara

Ciao! Sono Veysi, uno sviluppatore software freelance che crea soluzioni potenti, sostenibili e scalabili usando .NET Core, RabbitMQ, PostgreSQL e Vue.js. Con più di 4 anni di esperienza in ambito az...
Informazioni su questo servizio

Progetterò e svilupperò pipeline Spark ETL scalabili per l'elaborazione batch dei dati, trasformazioni e flussi di lavoro di grande volume.


Questo servizio è ideale per aziende che devono elaborare dati da file, database, API o altre fonti strutturate in modo affidabile e facilmente manutenibile. Che tu abbia bisogno di una nuova pipeline batch da zero o di miglioramenti a un lavoro esistente, posso aiutarti a creare una soluzione pulita e orientata alla produzione.


Mi concentro su risultati pratici di data engineering come ingestione, trasformazione, convalida, aggregazione e consegna in dataset pronti per l'analisi o sistemi downstream.


Ciò che può includere questo servizio

  • Sviluppo di pipeline ETL Spark o PySpark
  • elaborazione batch per grandi dataset
  • inserimento dati da CSV, JSON, Parquet, API e database
  • pulizia, normalizzazione e trasformazione dei dati
  • join, aggregazioni, filtri e logica di arricchimento
  • output su file, data warehouse o database
  • ottimizzazione e refactoring di lavori Spark esistenti
  • registrazione strutturata e organizzazione del codice manutenibile
  • documentazione di base e supporto al passaggio di consegne

Expertise:

Integrazione API

Big data

Estrazione dati

Tecnologia:

Apache Spark

BigQuery

Python

Scala

SQL

Apache Airflow