Sono un ingegnere di Deep Learning specializzato in Compressione di Modelli e Deployment Edge. Trasformerò i tuoi modelli di ricerca ad alta precisione in asset pronti per la produzione, ottimizzati per dispositivi mobili, web e IoT.
Cosa Offro:
- Conversione di Modelli: Converti senza problemi tra framework come PyTorch a ONNX, Keras a TFLite o TensorFlow a CoreML.
- Ottimizzazione dell'Inference: Velocizza il tuo modello usando TensorRT, OpenVINO o ONNX Runtime.
- Compressione di Modelli: Riduci l'ingombro usando Quantizzazione Post-Training (INT8/Float16) e Pruning dei Pesi senza perdere precisione significativa.
- Deployment Edge: Ottimizzazione per hardware come Raspberry Pi, Android (TFLite), iOS (CoreML) e NVIDIA Jetson.
- Refinement dell'Architettura: Implementazione di Knowledge Distillation per creare modelli "student" efficienti.
Perché Scegliere Questo Servizio?
- Esperienza in Architetture SOTA: Conoscenza di YOLO (v8-v11), Transformers (ViT), MobileNet e EfficientNet.
- Benchmarking delle Prestazioni: Ricevi un rapporto dettagliato che mostra Latency, Throughput e Utilizzo della Memoria prima e dopo l'ottimizzazione.
- Implementazione Pulita: Script di integrazione Python o C++ completamente documentati.
Strumenti & Frameworks:
PyTorch | TensorFlow | Keras | ONNX | TFLite