Sembra che questo servizio sia in sospeso
Farò task di big data usando apache hadoop superset kafka mongo clickhouse
Pakistan
Informazioni su questo servizio
Ciao! Sono un data engineer interessato a scalare e ottimizzare le pipeline di dati.
Questo servizio riguarda l'offerta dei miei servizi di Big-data per Machine Learning e analisi con Apache Spark, Apache Hadoop, Apache Hive, Apache Kafka, Apache Airflow, superset, Spark SQL e MongoDB, clickhouse.
Programmo in Python.
Mi piace trasformare i dati grezzi di big data (strutturati o non strutturati) in analisi, visualizzazioni o per addestrare modelli ML altamente accurati.
Il mio progetto precedente
- sistema di raccomandazione musicale su spotify,
- motore di ricerca personalizzato di file Excel,
- analisi del carrello di Amazon,
- ottimizzazione del cluster Hadoop,
- algoritmo di Dijkstra usando GraphX.
strumenti: shell-scripting, hadoop, pyspark, java + spark, Scala + Spark, kafka e mongodb
Includono tutti questi progetti anche dati streaming, ETL, analisi, ML.
Inoltre, posso configurare cluster Spark su VM o cloud con Mesos, Yarn o configurazioni standalone.
Scrivimi un messaggio e discutiamo del task prima di effettuare l'ordine.
Grazie, non vedo l'ora di aiutarti nel tuo prossimo progetto :)
Lingua:
Inglese
Esperienza tecnica:
Altro
Settore:
Analisi dei dati
