La mejor prueba de Product Manager para contratar: comparativa de herramientas y marco
El estado de la evaluación PM
La mayoría de las empresas hace una de tres cosas: (1) revisión de portafolio y cafés, (2) casos genéricos de Google o McKinsey, (3) entrevistas no estructuradas tipo «cuéntame un caso». Las tres tienen agujeros.
La revisión de portafolio favorece a quien tiene marca personal y empresas conocidas. Los casos genéricos te dicen quién ha estudiado más, no quién decide mejor. Las no estructuradas miden simpatía, no juicio.
El mejor enfoque combina los tres, pesados según lo que de verdad necesitas predecir.
Tres formatos y qué miden
Formato 1: caso take-home (2–3 horas)
Qué mide: juicio con datos incompletos; claridad escrita y estructura; priorización; literacy métrica.
Cómo correrlo: plantéale un escenario realista con métricas reales, feedback de cliente y datos de mercado. Pídele (1) diagnosticar, (2) plan, (3) métricas de éxito, (4) riesgos.
Fortalezas: asíncrono; revela pensamiento; comparable a ciegas.
Debilidades: consume tiempo; no muestra reacción rápida; algunas candidaturas piden ayuda y es difícil cazarlo.
Cuándo usarlo: PM y PM Senior. Menos relevante para APM (mides potencial).
Cómo personalizarlo: usa tu negocio real. Si contratas para onboarding, presenta tus métricas de onboarding, feedback y competencia. Filtra por quien ha pensado en tu problema.
Formato 2: entrevista estructurada en vivo (45 minutos)
Qué mide: pensamiento al vuelo; literacy métrica y diagnóstico; comunicación y persuasión; manejo de ambigüedad.
Cómo correrlo: preséntale un escenario. Que diagnostique y proponga. Sin preparación. Escucha, indaga, no interrumpas.
Buen ejemplo: «Los DAU bajaron 8 % la semana pasada. El año pasado en esta época subieron 12 %. Explica qué pasa y qué harías».
Fortalezas: difícil de fingir en directo; ves cómo prioriza bajo presión; estandarizable.
Debilidades: algunas grandes PMs se bloquean (especialmente introvertidas); varianza por entrevistadora; no revela claridad escrita.
Cuándo usarlo: todos los niveles. Más corto para APM (20 min, un escenario), más largo para Senior (45 min, varios).
Cómo puntuar: rúbrica simple: pensamiento diagnóstico, literacy métrica, comunicación. 1–4 en cada uno.
Formato 3: entrevista comportamental + ejecución (30 minutos)
Qué mide: ejecución pasada; aprendizaje del fracaso; influencia transversal; toma de decisiones bajo restricciones reales.
Cómo correrlo: pregunta sobre una vez que entregó bajo presión, mató un proyecto o convenció a una ejecutiva escéptica. Indaga: «¿Cuál era el objetivo? ¿Qué se interpuso? ¿Qué harías diferente? ¿Mediste el resultado?».
Las mejores tienen historias donde (1) apostaron, (2) se equivocaron, (3) aprendieron.
Fortalezas: comportamiento pasado predice futuro; revela aprendizaje de fracaso (rasgo más importante); difícil fingir una historia coherente.
Debilidades: depende de si han entregado algo; difícil para perfiles jóvenes; sesgo de quien entrevista.
Cuándo usarlo: PM y PM Senior. Para APM, pregunta sobre la decisión más grande que ha apoyado, no liderado.
Cómo puntuar: ¿revela aprendizaje? ¿asume errores o culpa al exterior? ¿articula la decisión bajo las restricciones reales (no las que quisiera haber tenido)?
Construir tu mezcla
Para APM:
- Caso (45 min): mini spec. ¿Sabe recortar alcance?
- En vivo (20 min): «2 semanas y 1 ingeniera. ¿Qué entregas?»
- Comportamental (15 min): feedback recibido y cómo actuó.
Total: ~80 min. Señal: velocidad de aprendizaje, ejecución, coachability.
Para PM:
- Caso (2 horas): priorización estratégica con datos incompletos.
- En vivo (45 min): diagnóstico + estrategia.
- Comportamental (30 min): decisión donde se equivocó.
Total: ~3 horas. Señal: juicio, métricas, ejecución, aprendizaje.
Para PM Senior:
- Caso (2–3 horas): pensamiento de cartera y estrategia.
- En vivo (45 min): articulación estratégica y desacuerdo entre pares.
- Comportamental (30 min): decisión más dura de personas o priorización.
- Referencias (30 min): ¿entregó? ¿desarrolló a la gente?
Total: ~4,5 horas + llamadas. Señal: estrategia, apalancamiento organizativo, mentoría.
Herramientas comunes y comparación
Plataformas de casos genéricas (Reforge, Case Coach…)
Pros: preparación a fondo; escalable; benchmark amplio.
Contras: todo el mundo ha visto los mismos; respuestas memorizadas puntúan alto pero no predicen; no evalúa juicio en tu contexto.
Veredicto: útil como cribado, no como señal real.
Ejercicios prácticos (mockup en Figma, modelo en Excel)
Pros: salida concreta; las candidaturas disfrutan trabajo real; revela artesanía.
Contras: caros para ambas partes; el diseño puede tapar el pensamiento de producto; difícil comparar entre problemas distintos.
Veredicto: bien acompañando un caso, no en solitario.
Revisión de portafolio (su trabajo real)
Pros: evidencia de impacto; contexto de decisiones reales; quien ha entregado destaca.
Contras: sesgo a candidaturas de empresas conocidas; no puedes evaluar trabajo confidencial; tamaño de empresa y suerte importan.
Veredicto: valioso pero insuficiente. Punto de partida, no decisión.
Entrevistas no estructuradas
Pros: flexibles; rápidas; quien narra bien brilla.
Contras: alta varianza; sesgo a candidaturas pulidas; no compara en los mismos ejes.
Veredicto: evítalas como evaluación principal. Solo como check final de cultura.
Construye la tuya
La mejor evaluación es la adaptada a tu negocio.
Paso 1: define cómo es el éxito en tu rol PM. ¿Crecimiento? ¿Retención? ¿Unit economics? ¿Ingresos? ¿Estabilidad?
Paso 2: construye un caso en torno a eso. Métricas reales, decisiones reales, restricciones reales. Ver ejemplos de preguntas.
Paso 3: crea una rúbrica. ¿Qué puntúa alto? Aprender del fracaso, pragmatismo, métricas. Plantillas en cómo evaluar PMs.
Paso 4: pruébala. Da el caso a 3–5 de tus mejores PMs. Si los altos rendimientos no puntúan alto, la rúbrica está mal.
Paso 5: lánzala. Usa la evaluación estructurada para entrega consistente y puntuación a ciegas. Para resultados, mira interpretar resultados.
Qué evitar
No confundas confianza con competencia. Algunas grandes PMs son discretas.
No confundas inteligencia con juicio. Personas muy listas pueden tomar pésimas decisiones de trade-off.
No confundas marcos con pensamiento. Una PM que recita RICE pero no lo aplica es peligrosa.
No evalúes sola. Que varias personas puntúen de forma independiente y luego debriefen. La discrepancia es donde está la señal.
Asegura validez y equidad. Lee validez y equidad de tests PM.
ROI de una buena evaluación
Una mala incorporación PM cuesta 18+ meses (rampa, fracaso, reemplazo). Una buena evaluación toma 3–4 horas y te dice si entregará en tu contexto.
Los mejores equipos automatizan, puntúan a ciegas y tratan la evaluación con la misma seriedad que una entrevista técnica. Tú deberías también.