Costruirò una pipeline di computer vision con yolov8 opencv e ffmpeg
Ingegnere Full Stack senior e Python, Mobile RE, AI Agents, fondatore di SaaS
Informazioni su questo servizio
Hai difficoltà a ottenere una pipeline di computer vision che funzioni in produzione? Stanco di demo che crollano su video reali, GPU reali o risoluzione reale?
Io costruisco pipeline CV con YOLOv8, OpenCV e FFmpeg ogni giorno. Rilevamento, tracciamento, elaborazione batch, inferenza REST, non solo un notebook.
- Lavori consegnati (alcuni pubblici su github.com/pyotrmuhammad):
- Pipeline batch di immagini AI ComfyUI-BatchFactory da Google Sheets.
- Factory video TikTokBatchFactory con FFmpeg + orchestrazione.
- KrakenSubtitle, il burner di sottotitoli karaoke parola per parola con precisione frame.
- SPORTSREELZ, estrattore di highlights di partite di calcio con CV + rilevamento scena.
- Canale di video quiz automatizzato Pepite Quiz (@pepitequiz su YouTube) che ho creato da zero.
- nzs-luxe.com generazione video AI + auto-upload sui social, per il mio negozio e-commerce.
- Pipeline di clip podcast, estrattore di clip virali con rilevamento speaker + scena.
Ciò che ottieni: pipeline funzionante adattata al tuo input e hardware. Dimensione modello YOLOv8 in base al budget di latenza. Pre/post-processing con OpenCV. FFmpeg per ingest, codifica, estrazione clip. README ed esempio eseguibile.
Dimmi cosa vuoi che venga rilevato, classificato o estratto. NDA su richiesta.
Linguaggio di programmazione:
Python
•
MATLAB
•
SQL
•
Colab
•
NoSQL
Framework:
Scikit-learn
•
Google ML Kit
•
SimpleCV
•
keras
•
PyTorch
Il mio portfolio
FAQ
Traduzione automatica.
Q: Quali progetti di computer vision reali hai effettivamente consegnato?
A: ComfyUI-BatchFactory e TikTokBatchFactory sono pubblici su github (github.com/pyotrmuhammad), oltre a rmbg-enhance per rimozione sfondo in produzione e KrakenSubtitle per burn dei sottotitoli con precisione frame. Tutto costruito e distribuito da me
Q: Puoi gestire inferenza in tempo reale o ottimizzazione GPU?
A: Sì. YOLOv8n raggiunge oltre 30 FPS su una singola GPU T4. Adatto la dimensione del modello (n/s/m/l/x) e la batch size al tuo budget di latenza. Esportazione ONNX e ottimizzazione TensorRT disponibili con Premium.
Q: Quali consegne ricevo?
A: Pipeline Python funzionante, README, requirements.txt, un esempio eseguibile, il file del modello addestrato e gli script di inferenza. La versione Premium include Dockerfile e server REST API.
Q: Firma NDA?
A: Sì, su ogni progetto — prassi standard. Il tuo dataset, il caso d'uso e il codice rimangono privati.
Q: Quanto velocemente puoi iniziare?
A: Entro 24 ore dalla conferma dell'ordine. Inviami il formato di input e il rilevamento target — ti invierò un piano chiaro in poche ore.

