Mid Senior Computer Vision Engineer
Descrizione dell'offerta
Siamo alla ricerca di un/una Senior Computer Vision Engineer da inserire nel team di percezione per lo sviluppo di sistemi di visione avanzati destinati al nostro robot umanoide.
La figura contribuirà alla progettazione e implementazione di pipeline di percezione basate su computer vision, deep learning e 3D vision, con particolare focus su stima della posa 3D degli oggetti, scene understanding e ottimizzazione dell’inferenza su GPU ed edge devices embedded a bordo del robot.
Il ruolo prevede attività ad alto impatto sul comportamento percettivo del robot, contribuendo direttamente alle capacità di manipolazione autonoma, interazione con l’ambiente e comprensione della scena.
La persona selezionata lavorerà su:
- integrazione software di modelli di object detection, segmentation e 3D pose estimation
- sviluppo di pipeline multi-stage di percezione (detection → refinement → pose estimation)
- elaborazione dati RGB-D e point cloud provenienti da sensori onboard
- sviluppo di pipeline robuste per robot operanti in ambienti dinamici e non strutturati
- deployment su hardware embedded (es. NVIDIA Jetson) integrato su piattaforme robotiche umanoidi
- conversione e ottimizzazione modelli (ONNX, TensorRT, quantizzazione FP16 / INT8)
- sviluppo di pipeline modulari in Python
- collaborazione con team software, AI e hardware per integrazione end-to-end del sistema percettivo del robot
- Laurea in Computer Science, Software Engineering, Robotics o discipline affini
- Almeno 2 anni di esperienza nello sviluppo software con focus su computer vision, perception robotica o sistemi di visione 3D
- Ottima conoscenza di Python Object-Oriented Programming, incluse librerie di multithreading e programmazione asincrona
- Esperienza con protocolli di streaming (es. WebRTC) e comunicazione IoT (es. MQTT)
- Esperienza pratica con pipeline RGB-D, elaborazione point cloud e librerie 3D (es. PCL)
- Esperienza nello sviluppo o integrazione di modelli deep learning per object detection, segmentation e pose estimation, utilizzando PyTorch o TensorFlow
- Esperienza nel deployment e nell’ottimizzazione di modelli su GPU ed edge device (es. ONNX Runtime, TensorRT, CUDA, NVIDIA Jetson)
- Esperienza con conversione modelli, quantizzazione (FP16 / INT8) e ottimizzazione inference real-time
- Ottima conoscenza di OpenCV
- Familiarità con workflow collaborativi basati su Git
- esperienza con calibrazione camere e setup multi-camera / RGB-D (es. RealSense, ZED)
- esperienza con ROS o ROS2
- esperienza con Docker o infrastrutture MLOps
- esperienza con pipeline CI/CD per modelli ML
- familiarità con Vision-Language Models (VLM) o modelli emergenti per robotica
- esperienza con ambienti di simulazione per testing perception (es. Gazebo o NVIDIA Isaac Sim)
We are looking for a Senior Computer Vision Engineer to join our perception team and contribute to the development of advanced vision systems for humanoid robots operating in real-world environments.
The selected candidate will design and implement perception pipelines based on computer vision, deep learning, and 3D vision, with a strong focus on 3D object pose estimation, scene understanding, and GPU / edge inference optimization on embedded robotic platforms.
This role directly impacts the robot’s ability to perform autonomous manipulation, environment interaction, and visual scene understanding.
Responsibilities include:
- integration of deep learning models for object detection, segmentation, and 3D pose estimation
- development of multi-stage perception pipelines (detection → refinement → pose estimation)
- processing of RGB-D data and point clouds from onboard sensors
- development of robust perception pipelines for robots operating in dynamic, unstructured environments
- deployment on embedded hardware platforms (e.g. NVIDIA Jetson) integrated on humanoid robots
- model conversion and optimization (ONNX, TensorRT, FP16 / INT8 quantization)
- performance optimization for real-time onboard inference
- collaboration with software, AI, and hardware teams for end-to-end humanoid perception system integration
Nice to Have- experience with camera calibration and multi-camera / RGB-D setups (e.g. RealSense, ZED)
- experience with ROS or ROS2
- experience with Docker or MLOps infrastructures
- experience with CI/CD pipelines for ML models
- familiarity with Vision-Language Models (VLMs) or emerging models for robotics
- experience with perception testing simulation environments (e.g. Gazebo or NVIDIA Isaac Sim)