Mid Senior Computer Vision Engineer

Oversonic · Lombardia, Italia ·


Descrizione dell'offerta

Descrizione del ruolo

Siamo alla ricerca di un/una Senior Computer Vision Engineer da inserire nel team di percezione per lo sviluppo di sistemi di visione avanzati destinati al nostro robot umanoide.

La figura contribuirà alla progettazione e implementazione di pipeline di percezione basate su computer vision, deep learning e 3D vision, con particolare focus su stima della posa 3D degli oggetti, scene understanding e ottimizzazione dell’inferenza su GPU ed edge devices embedded a bordo del robot.

Il ruolo prevede attività ad alto impatto sul comportamento percettivo del robot, contribuendo direttamente alle capacità di manipolazione autonoma, interazione con l’ambiente e comprensione della scena.

La persona selezionata lavorerà su:

  • integrazione software di modelli di object detection, segmentation e 3D pose estimation
  • sviluppo di pipeline multi-stage di percezione (detection → refinement → pose estimation)
  • elaborazione dati RGB-D e point cloud provenienti da sensori onboard
  • sviluppo di pipeline robuste per robot operanti in ambienti dinamici e non strutturati
  • deployment su hardware embedded (es. NVIDIA Jetson) integrato su piattaforme robotiche umanoidi
  • conversione e ottimizzazione modelli (ONNX, TensorRT, quantizzazione FP16 / INT8)
  • sviluppo di pipeline modulari in Python
  • collaborazione con team software, AI e hardware per integrazione end-to-end del sistema percettivo del robot


Requisiti
  • Laurea in Computer Science, Software Engineering, Robotics o discipline affini
  • Almeno 2 anni di esperienza nello sviluppo software con focus su computer vision, perception robotica o sistemi di visione 3D
  • Ottima conoscenza di Python Object-Oriented Programming, incluse librerie di multithreading e programmazione asincrona
  • Esperienza con protocolli di streaming (es. WebRTC) e comunicazione IoT (es. MQTT)
  • Esperienza pratica con pipeline RGB-D, elaborazione point cloud e librerie 3D (es. PCL)
  • Esperienza nello sviluppo o integrazione di modelli deep learning per object detection, segmentation e pose estimation, utilizzando PyTorch o TensorFlow
  • Esperienza nel deployment e nell’ottimizzazione di modelli su GPU ed edge device (es. ONNX Runtime, TensorRT, CUDA, NVIDIA Jetson)
  • Esperienza con conversione modelli, quantizzazione (FP16 / INT8) e ottimizzazione inference real-time
  • Ottima conoscenza di OpenCV
  • Familiarità con workflow collaborativi basati su Git


Nice to have
  • esperienza con calibrazione camere e setup multi-camera / RGB-D (es. RealSense, ZED)
  • esperienza con ROS o ROS2
  • esperienza con Docker o infrastrutture MLOps
  • esperienza con pipeline CI/CD per modelli ML
  • familiarità con Vision-Language Models (VLM) o modelli emergenti per robotica
  • esperienza con ambienti di simulazione per testing perception (es. Gazebo o NVIDIA Isaac Sim)
Role Description

We are looking for a Senior Computer Vision Engineer to join our perception team and contribute to the development of advanced vision systems for humanoid robots operating in real-world environments.

The selected candidate will design and implement perception pipelines based on computer vision, deep learning, and 3D vision, with a strong focus on 3D object pose estimation, scene understanding, and GPU / edge inference optimization on embedded robotic platforms.

This role directly impacts the robot’s ability to perform autonomous manipulation, environment interaction, and visual scene understanding.

Responsibilities include:

  • integration of deep learning models for object detection, segmentation, and 3D pose estimation
  • development of multi-stage perception pipelines (detection → refinement → pose estimation)
  • processing of RGB-D data and point clouds from onboard sensors
  • development of robust perception pipelines for robots operating in dynamic, unstructured environments
  • deployment on embedded hardware platforms (e.g. NVIDIA Jetson) integrated on humanoid robots
  • model conversion and optimization (ONNX, TensorRT, FP16 / INT8 quantization)
  • performance optimization for real-time onboard inference
  • collaboration with software, AI, and hardware teams for end-to-end humanoid perception system integration



Nice to Have
  • experience with camera calibration and multi-camera / RGB-D setups (e.g. RealSense, ZED)
  • experience with ROS or ROS2
  • experience with Docker or MLOps infrastructures
  • experience with CI/CD pipelines for ML models
  • familiarity with Vision-Language Models (VLMs) or emerging models for robotics
  • experience with perception testing simulation environments (e.g. Gazebo or NVIDIA Isaac Sim) 

Candidatura e Ritorno (in fondo)