Selezione e recruiting

Il miglior test di project manager per la selezione (che funziona davvero)

ClarityHire Team(Editorial)2026-05-098 min read

Perché la tua valutazione PM è probabilmente sbagliata

La maggior parte dei team gestisce le assunzioni PM così: colloquio comportamentale più un take-home in cui la candidata costruisce un Gantt o scrive un piano. Poi assumono in base a quanto è organizzato il documento.

Questo fallisce per due motivi. Primo, scrivere un documento non prevede come qualcuna prenderà decisioni sotto pressione. Secondo, lo stesso documento può essere scritto da cinque PM diversi con cinque filosofie diverse — non si possono confrontare candidate in modo equo.

La miglior valutazione PM bypassa entrambi i problemi: dà a tutte le candidate lo stesso scenario, chiede di prendere una decisione e difenderla, e le valuta su criteri osservabili.

Cosa non funziona (e perché)

Credenziali e certificazioni

PMP, CSM e CAL mostrano che qualcuno ha studiato framework. Non mostrano giudizio. Una PM certificata può comunque mancare rischi ovvi, esitare su ogni decisione e fallire nella comunicazione con stakeholder.

Usa le certificazioni come nice-to-have, non come filtro. Una PM forte senza certificazione supera una PM debole con essa.

Take-home Gantt o piano di progetto

La candidata costruisce un piano per un progetto fittizio. Lo giudichi su quanto è dettagliato e organizato. Problema: un piano dettagliato per un problema vago non è segnale — stai testando la qualità del documento, non il pensiero.

Se usi il take-home, abbinalo a un debrief di 30 minuti. Falle difenderlo. «E se la deadline è davvero dura e non possiamo spostarla?» Forza ragionamento, non solo pianificazione.

Colloquio comportamentale non strutturato

«Raccontami un progetto difficile». La candidata racconta una storia. Tu decidi se ti piace. Risultato: nessuna due candidate rispondono alla stessa domanda, nessuna due intervistatrici valutano allo stesso modo, nessun confronto reale.

Se fai colloqui comportamentali, falli strutturati. Stesse domande, rubrica condivisa.

Cosa funziona: lo stack scenario + prioritizzazione + rischi

Questo è l'approccio che concentra meglio il segnale. Costa 95 minuti per candidata e separa in modo coerente le PM forti dalle medie.

1. Scenario (30 min, async)

Formato: mandale via email uno scenario realistico con vincoli. Risponde con un testo di 1–2 pagine in 30 minuti. Niente indizi.

Esempio di scenario: Sei PM in un'azienda SaaS B2B. Il vostro più grande cliente (20 % dell'ARR) vi ha detto che se ne andrà se non consegnate una nuova feature di reporting entro il 1° ottobre. È il 1° agosto. Engineering stima la feature in 800 ore (5 engineer, 4 settimane se non fanno altro). Hai un secondo team che lavora su debito tecnico che crea instabilità in produzione. Il CTO dice che puoi prendere in prestito un'engineer da quel team per massimo 2 settimane.

Per iscritto, dimmi:

Quali informazioni raccoglieresti prima
Tre opzioni per procedere (con trade-off per ciascuna)
La tua raccomandazione e perché
Un rischio maggiore che mitigheresti subito

Punteggio (4 dimensioni, scala 1–5):

Chiede prima delle incognite (4–5: «Prima di decidere devo sapere: la stima da 800 ore è fondata o gonfiata? Possiamo ridurre lo scope? Il 1° ottobre è una data dura o negoziabile?») vs. (1–2: «Assumo contractor e finisco in tempo.»)
Nomina trade-off espliciti (4–5: «L'opzione A costa 100k$ in tempo di ramp dei contractor ma perde agilità. L'opzione B descopa feature e rischia la fiducia del cliente. L'opzione C parallelizza ma aumenta il rischio di merge.») vs. (1–2: «Possiamo assumere, descopare o lavorare più velocemente.»)
Fa una raccomandazione chiara (4–5: «Raccomando l'opzione C (parallela) con questa mitigazione: bloccherei lo scope entro il 10 agosto e farei handoff giornalieri tra design e engineering.») vs. (1–2: «È difficile dire senza saperne di più.»)
Identifica rischi non ovvi (4–5: «Se la stima delle 800 ore è sbagliata e siamo realmente a 1200 ore, siamo affondati. Farei un proof-of-concept la prima settimana per validare.») vs. (1–2: «Potremmo mancare la deadline.»)

Soglia di decisione: 4+ su tre delle quattro dimensioni = avanza. 3–3,5 = colloquio e sondaggi più approfonditi. Sotto 3 = decline.

2. Problema di prioritizzazione (20 min, live)

Formato: chiamata live, dalle un backlog, un vincolo e chiedi di classificare. Tu fai la stakeholder difficile.

Esempio: Hai 6 settimane di capacità del team. Il tuo backlog:

A: feature di compliance (richiesta per nuova verticale, potenziale 300k$ ARR, build di 6 settimane)
B: redesign del dashboard (pain point interno, aumenta la retention del 5 %, 8 settimane)
C: API per integrazioni (tre clienti la vogliono, 4 settimane, sblocca upsell)
D: ottimizzazione di performance (esperienza mobile lenta, 3 settimane)
E: bug critico nell'export (colpisce il 2 % di power user, 1 settimana)

Classifica le top 3. Hai 6 settimane di capacità.

Pushback live:

«La CEO tiene molto a B.»
«E se uno dei clienti delle integrazioni sta per andarsene?»
«Possiamo fare tutto se descopiamo sulla qualità?»

Punteggio (3 dimensioni):

Quantifica l'impatto (4–5: «C sono tre clienti, circa 50k$–150k$ ARR a seconda della deal size. B è retention, circa il 5 % dell'ARR attuale, quindi 25k$–100k$. A è la nuova verticale, 300k$, ma funziona solo se otteniamo clienti.») vs. (1–2: «A è la più grande opportunità.»)
Separa importanza da urgenza (4–5: «E è urgente ma colpisce solo il 2 % degli utenti, quindi impatto basso. A è importante ma possiamo mancarla senza morire. C è sia importante (revenue) che fattibile (4 settimane), quindi sale in cima.») vs. (1–2: «E è critico perché è un bug.»)
Tiene la raccomandazione sotto pushback (4–5: «Anche se la CEO tiene a B, la matematica del revenue non sostiene 8 settimane. Proporrei di descopare B a una fase-uno di 2 settimane e tornare alla versione completa in Q3.») vs. (1–2: «OK, se la CEO vuole B, possiamo fare B.»)

3. Rischio e mitigazione (15 min, live)

Formato: descrivi una struttura di progetto reale con dipendenze. Chiedi: «Tre rischi e una mitigazione concreta per ciascuno?»

Esempio: Stai lanciando un redesign del sistema di pagamento. Tre team: il tuo (6 settimane), il team data (4 settimane per la strumentazione), compliance (audit di 2 settimane). Tutto in parallelo. Deadline dura: 8 settimane. Nomina tre rischi e una mitigazione concreta per ciascuno.

Punteggio (2 dimensioni):

Identifica rischi non ovvi (4–5: «Rischio di dipendenza: se data slitta di una settimana, manchiamo il lancio. Mitigazione: assegnerei una liaison al loro standup e bloccherei lo schema entro la settimana 3. Rischio di comunicazione: compliance potrebbe fare review tardi. Mitigazione: la includerei nelle design review e farei un audit pilota in settimana 5. Rischio di scope: i team potrebbero interpretare 'redesign' diversamente. Mitigazione: one-pager con sign-off entro il 15 agosto.») vs. (1–2: «Potremmo mancare la deadline. Potremmo trovare bug.»)
Mitigazioni concrete (4–5: «Assegnerei una liaison» o «bloccherei lo schema») vs. (1–2: «Serve comunicazione» o «attenzione»).

4. Colloquio comportamentale strutturato (30 min, live, opzionale)

Se vuoi verificare il giudizio sugli stakeholder attraverso esempi vissuti, fai un colloquio comportamentale strutturato:

«Raccontami di una volta in cui hai dovuto descopare un progetto. Cosa l'ha innescato e come l'hai comunicato?»
«Raccontami di una volta in cui uno stakeholder ha spinto per qualcosa con cui non eri d'accordo. Come l'hai gestita?»
«Raccontami di una volta in cui hai mancato una deadline o un forecast. Cosa è andato storto?»
«Raccontami di una volta in cui hai consegnato in tempo tagliando angoli. Era il trade-off giusto?»

Valuta su specificità, consapevolezza di sé, riflessione e rilevanza al ruolo.

Il punteggio composito

Dopo tutte e quattro le componenti (o tre se salti il comportamentale), hai punteggi su:

Decision-making (scenario)
Giudizio sotto vincolo (prioritizzazione)
Consapevolezza del rischio (risk assessment)
Comunicazione con gli stakeholder (comportamentale, opzionale)

Soglie di assunzione:

Media 4+ su tutte le componenti = strong hire. Offerta veloce.
Media 3,5–4 = good hire. Verifica una preoccupazione con reference.
Media 3–3,5 = borderline. Solo se disperati; probabilmente farà fatica a metà progetto.
Sotto 3 = decline.

Errori comuni

Errore 1: concentrarsi sulle skill di comunicazione invece che sul giudizio. Una PM può essere silenziosa e prendere comunque buone decisioni. Testa il pensiero, non la personalità.

Errore 2: usare lo stesso scenario per ogni coorte. Dopo 10 candidate, lo condivideranno online. Aggiorna ogni 6 mesi.

Errore 3: lasciarti ingannare dalla sicurezza. Una candidata che dice «assumo contractor e finisco» suona decisa ma manca i rischi. Valuta la sostanza, non la performance.

Errore 4: saltare il debrief live. Uno scenario scritto è valido. Un debrief di 10 minuti in cui spingi indietro («e se la deadline è dura?») rivela come pensa sotto pressione. Non saltarlo.

Perché questo stack funziona

Lo scenario test rivela velocità e chiarezza decisionale. Il test di prioritizzazione rivela giudizio sotto vincolo di business. Il risk assessment rivela pensiero sistemico. Insieme, prendono 95 minuti e fanno emergere se qualcuna sa consegnare.

Come scalare questa valutazione

Se assumi più PM, standardizza scenari e rubriche così ogni candidata affronta la stessa asticella. ClarityHire può ospitare queste valutazioni per scoring coerente e confronto side-by-side.

Poi porta i top scorer ai colloqui live e aggiungi la componente comportamentale se vuoi verificare il giudizio sugli stakeholder attraverso il loro comportamento passato.

project-managementselezionevalutazionepmptest