Pulirò e automatizzerò i tuoi dati come data engineer
Ingegnere di dati cloud
Informazioni su questo servizio
Pulirò, formaterò e trasformerò dataset da qualche migliaio a decine di milioni di righe in modo efficiente usando Python & PySpark per un'analisi precisa.
Rimuovi null e duplicati
Standardizza testo, date e numeri
Lavora con CSV, Excel & JSON (piatti/semi-strutturati)
Automazione con Python/PySpark per aumentare l'efficienza
Con la mia esperienza in Data Engineering, i tuoi dati saranno coerenti, precisi e pronti per l'analisi.
Warehouse Platform:
Azure Synapse
•
Databricks
Tipo di progetto:
New Build
Il mio portfolio
Altri servizi della categoria Data engineer offerti da me
FAQ
Traduzione automatica.
Cosa devo fornire prima di effettuare un ordine?
Devi condividere il tuo dataset (CSV, Excel, JSON semi-strutturato, ecc.) insieme a istruzioni chiare su cosa pulire o trasformare.
Quali strumenti/tecnologie usi?
Principalmente uso Python e PySpark per dataset più grandi.
Puoi gestire grandi dataset (milioni di righe)?
Sì, per il pacchetto Premium progetto workflow scalabili usando PySpark che possono gestire milioni di righe in modo efficiente.
Riceverò lo script/codice insieme ai dati puliti?
Sì, consegnerò il dataset finale e lo script Python/PySpark nel pacchetto premium così potrai riutilizzarlo ogni volta che vuoi.
Puoi integrarti con database o cloud storage?
Sì, sono un Data Engineer e utilizzo cloud storage (Azure Blob, Databricks, ecc.) se necessario (per i pacchetti Standard e Premium).
Fornite documentazione?
Sì, per il pacchetto Premium fornisco documentazione passo passo così puoi eseguire e gestire facilmente il workflow.

