Interpretar resultados de tests de software skills: guía de hiring
La mentira seductora de scores
78% en Excel test. Se siente como data. No puedes simplemente rankear.
Qué mide el score
Performance bajo restricciones específicas
"Bajo estas condiciones (este data, este time, este audience), produjo algo scoring 82% en este rúbrica."
No significa: 82% as skilled, 18% slower, comparable a otro test.
Anchored al rúbrica, no a skill absoluto
Scenario A: rúbrica simple "runs without errors (40%), correct numbers (40%), professional (20%)". Score 80%. Scenario B: rúbrica con edge cases, DAX logic, performance, future queries. Mismo candidato 45%.
Ninguno es "true." Miden cosas diferentes.
Tres tipos de evaluación
1. Scenario-based (30-45 min)
- Pass: aproachó sensiblemente
- Fail: don't know o froze
- Barely-pass: figured out con struggle
Red flag: pristine en mitad del tiempo. Lookup?
2. Take-home (2-4 horas)
Mide juicio, iteración, problem-solving. Review artifact + explanation. Busca signs de iteración.
No captura: ayuda recibida, autenticidad.
3. Live assessments (30-60 min)
Mide speed, claridad, ability to handle interruption.
Red flags: silente, no puede explicar, finish perfecto en time.
Framework de interpretación
| Finding | Significado | Acción |
|---|---|---|
| High + clear | Skill + articulate | Advance |
| High + vague | Solved, unclear ownership | Probe |
| Medium + thoughtful errors | Concepto, missed nuances | Hire con mentorship |
| Low + clear struggle | No tiene skill | Skip si core |
| Low + frustrated | Unknown | Conversation crítica |
Comparar candidatos
Wrong way
A: 85, B: 72. Hire A.
Problema: scores scale-specific.
Right way
- Mismo test
- Score contra rúbrica, no otro score
- Look at difference en qué hicieron well/poorly
Consistencia
Más important que accuracy absoluta. Si test consistently separa good de bad, score exacto secundario.
Tracking: ¿high-scorers succeed? ¿low-scorers struggle?
Red flags en interpretación
- "No fit por test alone" — wrong, un signal
- "Match exact mi gut feel" — suspect
- "Higher correlated con hired" — bias?
- "Todos 70-80%" — test easy
Integración
Test es una pieza:
- Phone screen
- Skills test
- Take-home
- Behavioral
- System design
- Culture/team fit
Score útil. Score alone misleading.