Contratación y selección

La mejor prueba de Project Manager para contratar (que de verdad funciona)

ClarityHire Team(Editorial)7 min read

Por qué tu evaluación PM probablemente esté mal

La mayoría de los equipos hace contrataciones PM así: entrevista comportamental más una take-home en la que la candidatura construye un Gantt o redacta un plan. Luego deciden por lo organizado que se vea el documento.

Falla por dos razones. Primero, escribir un documento no predice cómo decide alguien bajo presión. Segundo, el mismo documento puede salir de cinco PM con cinco filosofías distintas, así que no puedes comparar de forma justa.

La mejor evaluación PM esquiva ambos problemas: da el mismo escenario a todas las candidaturas, les pide tomar una decisión y defenderla, y las puntúa con criterios observables.

Lo que no funciona (y por qué)

Credenciales y certificaciones

PMP, CSM y CAL muestran que alguien estudió marcos. No muestran juicio. Una PM certificada puede pasar por alto riesgos obvios y fallar en comunicación con stakeholders.

Usa certificaciones como nice-to-have, no como filtro. Una PM fuerte sin certificación supera a una débil con ella.

Take-home Gantt o plan de proyecto

Construye un plan para un proyecto ficticio. Lo juzgas por el detalle. Problema: un plan detallado para un problema vago no es señal. Estás midiendo calidad de documento, no pensamiento.

Si usas take-home, empareja con un debrief de 30 minutos. Que la defienda. «¿Y si la fecha es dura y no se puede mover?» Fuerza razonamiento, no planificación.

Entrevista comportamental no estructurada

«Cuéntame un proyecto difícil». La candidatura cuenta una historia. Decides si te cae bien. Resultado: ninguna candidatura responde igual, ninguna persona entrevistadora puntúa igual, sin comparación real.

Si haces comportamental, hazla estructurada. Las mismas preguntas, rúbrica compartida.

Lo que funciona: escenario + priorización + riesgos

Esta es la combinación que mejor concentra señal. Cuesta 95 minutos por candidatura y separa de forma consistente fuertes de mediocres.

1. Escenario (30 min, asíncrono)

Formato: mándale por email un escenario realista con restricciones. Responde con 1–2 páginas en 30 minutos. Sin pistas.

Escenario ejemplo: Eres PM en una SaaS B2B. Tu mayor cliente (20 % del ARR) te dice que se va salvo que entreguéis una nueva feature de informes para el 1 de octubre. Es 1 de agosto. Ingeniería estima 800 horas (5 ingenieras, 4 semanas si no hacen nada más). Hay un segundo equipo trabajando en deuda técnica que provoca inestabilidad en producción. La CTO dice que puedes coger una ingeniera 2 semanas máximo.

Por escrito, dime:

  • Qué información recolectarías primero
  • Tres opciones para proceder (con trade-off de cada una)
  • Tu recomendación y por qué
  • Un riesgo mayor que mitigarías ya

Puntuación (4 dimensiones, 1–5):

  1. Pregunta primero por incógnitas (4–5: «¿La estimación de 800 h está fundamentada o inflada? ¿Podemos recortar alcance? ¿La fecha es dura o negociable?») vs. (1–2: «Contrato a externos y lo saco»).
  2. Nombra trade-offs explícitos (4–5: «A cuesta 100k$ en rampa de externos pero pierde agilidad. B recorta features y arriesga la confianza del cliente. C son trabajos paralelos pero aumenta riesgo de merge») vs. (1–2: «Podemos contratar, recortar o trabajar más rápido»).
  3. Hace una recomendación clara (4–5: «Recomiendo C (paralelo) con esta mitigación: cierro alcance al 10/8 y hago handoffs diarios entre diseño e ingeniería») vs. (1–2: «Es difícil decir sin saber más»).
  4. Identifica riesgos no obvios (4–5: «Si las 800 h son en realidad 1.200, estamos hundidos. Haría una prueba de concepto la primera semana para validar») vs. (1–2: «Podemos no llegar»).

Umbral de decisión: 4+ en tres de cuatro = avanza. 3–3,5 = entrevista y profundiza. Por debajo de 3 = descarta.

2. Problema de priorización (20 min, en vivo)

Formato: llamada en vivo, dale un backlog y una restricción. Tú haces de stakeholder difícil.

Ejemplo: Tienes 6 semanas. Backlog:

  • A: feature de cumplimiento (necesaria para nuevo vertical, 300k$ ARR potenciales, 6 semanas)
  • B: rediseño de dashboard (dolor interno, +5 % retención, 8 semanas)
  • C: API de integraciones (3 clientes lo piden, 4 semanas, desbloquea upsell)
  • D: optimización de rendimiento (móvil lento, 3 semanas)
  • E: bug crítico en export (afecta al 2 % de power users, 1 semana)

Top 3. Tienes 6 semanas.

Empuja en vivo:

  • «La CEO valora mucho B».
  • «¿Y si una de las clientes de C está a punto de churnar?»
  • «¿Podemos hacer todo si recortamos calidad?»

Puntuación (3 dimensiones):

  1. Cuantifica impacto (4–5: «C son 3 clientes, 50–150 k$ ARR. B es retención, 25–100 k$. A es nuevo vertical, 300 k$ pero solo si captamos») vs. (1–2: «A es la mayor oportunidad»).
  2. Separa importancia de urgencia (4–5: «E es urgente pero solo 2 % de usuarios — bajo impacto. A es importante pero podemos perderla. C es importante y factible (4 semanas)») vs. (1–2: «E es crítico porque es un bug»).
  3. Mantiene la recomendación bajo presión (4–5: «Aunque la CEO quiera B, los números no soportan 8 semanas. Propongo recortar B a fase 1 de 2 semanas y la versión completa en Q3») vs. (1–2: «Si la CEO la quiere, hagamos B»).

3. Riesgo y mitigación (15 min, en vivo)

Formato: describe la estructura real de un proyecto con dependencias. Pide tres riesgos y una mitigación concreta para cada uno.

Ejemplo: Estás lanzando un rediseño de pagos. Tres equipos: el tuyo (6 semanas), data (4 semanas para instrumentación), compliance (auditoría de 2 semanas). Todo en paralelo. Lanzamiento duro: 8 semanas. Tres riesgos y una mitigación concreta.

Puntuación (2 dimensiones):

  1. Identifica riesgos no obvios (4–5: «Riesgo de dependencia: si data se retrasa una semana, perdemos lanzamiento. Mitigación: enlace en su standup y bloqueo de schema en semana 3. Riesgo de comunicación: compliance puede revisar tarde. Mitigación: incluirlos en design reviews y auditoría piloto en semana 5. Riesgo de alcance: equipos pueden interpretar 'rediseño' distinto. Mitigación: one-pager con sign-off para el 15/8») vs. (1–2: «Podemos no llegar. Pueden surgir bugs»).
  2. Mitigaciones concretas (4–5: «Asignaría un enlace», «bloqueo schema», «hago auditoría piloto») vs. (1–2: «Necesitamos comunicación», «cuidado»).

4. Entrevista comportamental estructurada (30 min, opcional)

Si quieres verificar juicio con stakeholders, haz una entrevista comportamental estructurada:

  • «Cuéntame una vez que recortaste un proyecto. ¿Qué lo desencadenó y cómo lo comunicaste?»
  • «Cuéntame un stakeholder que insistió en algo con lo que no estabas de acuerdo. ¿Cómo lo manejaste?»
  • «Cuéntame un deadline o forecast que fallaste. ¿Qué salió mal?»
  • «Cuéntame una entrega a tiempo recortando esquinas. ¿Fue el trade-off correcto?»

Puntúa: especificidad, autoconciencia, reflexión, relevancia para el rol.

La puntuación compuesta

Después de los cuatro componentes (o tres si saltas el comportamental), tienes:

  • Decisión (escenario)
  • Juicio bajo restricción (priorización)
  • Conciencia de riesgo
  • Comunicación con stakeholders (comportamental, opcional)

Umbrales:

  • Promedio 4+ = contratación fuerte. Oferta rápida.
  • 3,5–4 = buena. Verifica una preocupación con referencias.
  • 3–3,5 = límite. Solo si urge.
  • Por debajo de 3 = descarta.

Errores comunes

Error 1: centrarse en habilidades de comunicación en lugar de juicio. Una PM puede ser callada y decidir bien. Evalúa pensamiento, no personalidad.

Error 2: mismo escenario para cada cohorte. Tras 10 candidatas, lo comparten online. Refresca cada 6 meses.

Error 3: dejar que la confianza te engañe. «Contrato externos y lo saco» suena decidido pero pierde riesgo. Puntúa sustancia, no entrega.

Error 4: saltarte el debrief en vivo. Una hoja escrita es valiosa. 10 minutos de empuje en vivo revela mucho.

Por qué funciona

El escenario revela velocidad y claridad de decisión. La priorización revela juicio bajo restricción. El riesgo revela pensamiento sistémico. Juntos, 95 minutos te dicen si entregará.

Cómo escalarla

Si contratas varios PM, estandariza escenarios y rúbricas. ClarityHire puede alojar las evaluaciones para puntuación consistente y comparación.

Toma a las mejores a entrevistas en vivo y añade la comportamental para verificar juicio con stakeholders.

project-managementcontrataciónevaluaciónpmptest

Artículos relacionados