Pulirò dati avanzati o pronti per ML, da base a professionale

Alcune informazioni sono state tradotte automaticamente.

India

Parlo Bengali, Hindi, Inglese

Data Scientist, Analytics, Python, SQL, ML, Specialista in Data Cleaning!

Ciao! Sono Soham, data scientist ed esperto di Python, dedicato ad aiutare le aziende a sbloccare il vero potenziale dei loro dati. Che tu abbia bisogno di modelli predittivi o di workflow automatizza...
Informazioni su questo servizio

Hai bisogno di trasformare i tuoi dati disordinati in un formato pulito, pronto per analisi o machine learning?


Sono specializzato in tre livelli di pulizia dei dati, dal semplice alle pre-elaborazioni avanzate per modelli di ML.


CLEAN BASIC (Perfetto per report e visualizzazioni)

- Rimuovi duplicati e colonne irrilevanti

- Gestisci valori mancanti (elimina o imputazione semplice)

- Correggi tipi di dato (date, numeri, categorie)

  • Analisi statistica

- Standardizza il testo (maiuscolo/minuscolo, trimming, rimuovi spazi)


CLEAN AVANZATO (Per analisi approfondite e dashboard)

- Tutto nel Basic +

- Analisi outlier (IQR, Z-score)

- Imputazione avanzata di valori mancanti (KNN, mediana, moda)

- Unisci o collega più dataset

- Crea caratteristiche derivate (rapporti, aggregati)

- Correggi categorie e codifiche incoerenti


DATI PRONTI PER ML (Per training del modello)

- Tutto nell'Avanzato +

- Codifica variabili categoriche (One-Hot, Label, Ordinale)

- Scaling delle caratteristiche (MinMax, StandardScaler, RobustScaler)

- Suddivisione train/validation/test (70-20-10 o personalizzata)

- Gestisci squilibri di classe (oversampling/undersampling se necessario)

- Rimuovi leakage di target

- Output in formato compatibile con TensorFlow o sklearn


COSA FORNISCI:

- File di dati grezzi CSV, Excel o SQL.

-

Piattaforma:

Quaderno jupyter

Tecnologia di sviluppo:

Python

Power BI

Expertise:

Formattazione

Funzioni

Charts

Pulizia

Convalida dati