FULL STACK ENGINEER (AI/LLM FOCUS) - 23871.02.MB

DRD Recruiting · Lombardia, Italia ·


Descrizione dell'offerta

Per una società nostra cliente, startup italiana fondata nel 2025, cresciuta rapidamente fino a 30 persone e finanziata con 3,2 milioni di euro per innovare il settore delle costruzioni, con l’obiettivo di diventare la piattaforma digitale di riferimento in Italia ed Europa., siamo alla ricerca di un\una:


FULL STACK ENGINEER (AI/LLM FOCUS)


Il candidato avrà le seguenti responsabilità:

  • Ideare e costruire workflow agentici: progettazione dei prompt, coordinamento degli strumenti, ragionamento multi-step e messa in produzione.
  • Sviluppare pipeline di ricerca RAG e semantica sfruttando database vettoriali e modelli di embedding per fornire contesto pertinente agli agenti di IA.
  • Creare pipeline di document processing che convertano file non strutturati (fatture, report, moduli) in dati strutturati all’interno di database.
  • Implementare sistemi di osservabilità e valutazione: tracciamento, monitoraggio degli esperimenti e analisi automatizzata della qualità degli output dei modelli LLM.
  • Migliorare le strategie di gestione del contesto degli agenti: suddivisione dei contenuti, ricerca ibrida e ri-ranking per aumentare la qualità delle risposte.
  • Operare su tutto lo stack tecnologico (React/Next.js, tRPC, PostgreSQL, funzioni serverless) quando necessario per abilitare funzionalità basate su IA.


Il candidato avrà i seguenti requisiti:

  • Esperienza nello sviluppo di applicazioni in produzione basate su LLM: agenti intelligenti, utilizzo di strumenti esterni e generazione di output strutturati.
  • Esperienza pratica con sistemi RAG: embedding, database vettoriali, ricerca ibrida e strategie di suddivisione dei contenuti (chunking).
  • Conoscenza di TypeScript o forte motivazione ad apprenderlo: l’intero stack tecnologico è sviluppato in questo linguaggio.
  • Esperienza con framework di orchestrazione per AI (come LangChain, Mastra, CrewAI o soluzioni analoghe).
  • Ottima padronanza di SQL e database relazionali: capacità di scrivere query complesse e ottimizzare pipeline di dati.
  • Conoscenza delle tecniche di prompt engineering: few-shot prompting, chain-of-thought e strutturazione avanzata degli output.


Requisiti preferenziali:

  • Esperienza in MLOps: deploy di modelli su infrastrutture GPU serverless, CI/CD per sistemi AI e monitoraggio di modelli e agenti in produzione.
  • Conoscenza di MCP (Model Context Protocol) o standard simili per l’integrazione e la distribuzione di strumenti.
  • Esperienza nella realizzazione di agenti conversazionali multi-turno con gestione della memoria e dello stato.


Orario di lavoro: Full Time

Sede di lavoro: Milano (zona Lorenteggio)

L’inquadramento sarà commisurato al grado di autonomia acquisito.


La Selezione è rivolta ad ambo i sessi ai sensi dell’Art. 1 L. 903/77

Candidatura e Ritorno (in fondo)