Come Ricercatore di AI specializzato in computer vision e ottimizzazione del deep learning, costruisco e comprimo reti neurali complesse per ottenere massimi tempi di inferenza su hardware con risorse limitate senza compromettere le metriche di accuratezza.
Perché scegliere questo servizio?
- Ottimizzazione di architetture di modelli di élite: Progetto pipeline CNN personalizzate e perfeziono Vision Transformers (ViTs) per spingere le precisioni di classificazione dai limiti di base fino ai requisiti clinici/operativi più elevati.
- Compressione avanzata dei modelli: Eseguire modelli di visione massicci su setup edge è inefficiente. Applico workflow di Knowledge Distillation personalizzati tra studente e insegnante per ridurre l’uso di memoria proteggendo al contempo i criteri di performance del modello.
- Distribuzioni pronte per la produzione: Niente setup complicati. Converto pesi complessi in ambienti ONNX Runtime ottimizzati, abbinati a API di predizione veloci per un deployment software in tempo reale senza problemi.
Lo stack tecnico:
- Frameworks: PyTorch, TensorFlow, ONNX Runtime.
- Architetture: CNN personalizzate, ResNet, MobileNet, Vision Transformers (ViTs).
- Strumenti di deployment: Docker, Flask/FastAPI REST, Linux