Cómo detectar uso de ChatGPT en entrevistas de coding
La nueva línea base: cada candidata tiene ChatGPT abierto
Para 2026, la pregunta ya no es si las candidatas usan IA en entrevistas — es cuánto y si pueden producir el mismo trabajo sin ella. Si no adaptas tu cribado, contratarás gente cuya habilidad anunciada es la de la IA, no la suya.
Este post es una guía de campo para detectar respuestas asistidas por IA en entrevistas de coding live y async, extraída de las señales que saca a la luz nuestro motor de integridad.
Señal 1: ritmo de tecleo que no coincide con autoría humana
Cuando una persona escribe código, pausa para pensar, retrocede, refactoriza nombres de variables y se queda a media línea. Cuando una persona pega código, ves un solo burst de pulsaciones — a menudo cientos de caracteres en menos de un segundo — seguido de silencio.
El modelo de biometría de tecleo de ClarityHire flagea dos patrones:
- Eventos burst-paste. Tasas sostenidas de tipeo sobre ~700 chars/min, especialmente cuando precedidas por silencio de 10-60 segundos (la clásica señal "alt-tab a ChatGPT").
- Drift de autoría. La huella de tipeo de la candidata cambia a media tarea. Los primeros 10 minutos lucen como una persona; el minuto 30 luce como otra distinta.
Ninguna concluyente sola. Juntas, casi siempre lo son.
Señal 2: rupturas en coherencia de código
El código generado por LLM es fluido pero a menudo demasiado fluido. Las ingenieras reales dejan artefactos: un TODO que olvidaron quitar, una variable llamada x que pensaban renombrar, un estilo ligeramente inconsistente entre dos funciones escritas con 20 minutos de diferencia.
Corremos un pase de juez LLM sobre el envío final con una pregunta: ¿luce esto como que una persona lo escribió, de extremo a extremo? Banderas rojas comunes:
- Comentarios que explican código trivial en prosa de libro de texto
- Mejoras súbitas de idiom (loops
forcrudos en una función, comprehensions elegantes en la siguiente) - Manejo defensivo de errores para casos que la candidata nunca testeó
Señal 3: latencia pregunta-a-keystroke
Si una candidata lee un problema y empieza a tipear una solución funcional dentro de 8 segundos, no está pensando — está transcribiendo. Medimos tiempo-a-primer-keystroke-significativo y flageamos cualquier cosa implausiblemente rápida para la dificultad del problema.
Qué hacer al respecto
La detección es la mitad de la respuesta. La otra mitad es diseño de entrevista que hace el uso de IA menos útil:
- Pregunta seguimientos en vivo. "¿Por qué elegiste un hash map aquí? ¿Qué pasa si el input está ordenado?" Una solución pegada de LLM tendrá una autora que no puede responder.
- Usa problemas con restricciones novedosas. El LeetCode estándar está en el training set. Un pequeño twist — una forma de datos custom, una función de coste inusual — fuerza pensamiento real.
- Combina async con live. Un seguimiento en vivo de 30 minutos sobre el take-home es la entrevista única de mayor señal que la mayoría no corre.
El hiring moderno no es anti-IA. Es anti-falso. Las candidatas que usan IA bien, transparentemente, son exactamente las personas que quieres contratar. La meta es asegurarse de que también sean las personas que aparecen.