Integridad

Cómo detectar código generado por IA en un envío take-home

ClarityHire Team(Editorial)3 min read

Por qué los "detectores de IA" mayormente no funcionan

Las herramientas que dicen clasificar si un envío fue generado por IA tienen consistentemente precisión débil. Producen muchos falsos positivos (penalizando a candidatas que escriben con estilo limpio) y muchos falsos negativos (los LLMs modernos pueden producir código de aspecto idiosincrático bajo demanda). Actuar sobre su output es arriesgado.

La detección fiable viene de un ángulo distinto: no intenta clasificar el artefacto. Compara el artefacto con el proceso que lo produjo.

Qué realmente distingue envíos humanos de IA

Tres señales, ninguna basada en clasificar el código final:

1. Trace de proceso

¿Cómo se escribió el código? Los humanos escriben iterativamente — una función aparece, se edita, se renombra, recibe un fix de bug. El código pegado de IA llega en grandes bloques, a menudo completo en su primera aparición. Captura la línea de tiempo de keystrokes y ediciones del envío y la diferencia es visible.

ClarityHire registra esta línea de tiempo para envíos take-home y saca a la luz señales de "tasa de paste" y "iteración de edición" que flagean patrones inconsistentes con código escrito a mano. No acusa — saca la señal para que el revisor sondee.

2. Coherencia entre código y explicación

Una candidata que escribió el código puede explicarlo específicamente. Una que lo pegó no puede. La entrevista de walk-through al final de cualquier take-home es el detector único más fiable de envíos pegados de IA porque la candidata tiene que defender sus propias elecciones en tiempo real.

Sondea específicamente: "¿Por qué elegiste este enfoque sobre la alternativa?" "¿Qué cambiaría si X fuera diferente?" "Recórreme qué pasa cuando esta función se llama con [caso borde]." Las candidatas que lo escribieron responden fluido. Las que pegaron improvisan vagamente.

3. Consistencia de estilo

A través de múltiples envíos o entre partes diferentes de un solo envío, ¿el estilo se mantuvo coherente? Naming, estilo de comentarios, patrones de manejo de errores. Los envíos IA a menudo tienen consistencia interna sospechosa e inconsistencia externa sospechosa: más uniforme de lo que un humano escribiría dentro de un proyecto, más variable que los otros artefactos de la candidata.

Qué hacer con la señal

Nunca auto-rechazar. Las señales son probabilísticas, y el coste de un falso positivo es alto — éticamente y para el pipeline.

Úsalas como triage: un envío flageado obtiene un walk-through más riguroso. El walk-through lo resuelve limpiamente en casi todos los casos. Si la candidata defiende fluido su código, el score se mantiene. Si no puede, el score refleja lo que puede defender.

Esto es más humano que un clasificador de caja negra emitiendo veredicto, y produce mejores resultados de hiring.

Qué comunicar a las candidatas

Diles por adelantado: "Este take-home está seguido por un walk-through de 30 minutos donde explicarás tu código. Usa lo que te ayude a hacer tu mejor trabajo, pero prepárate para defender tus elecciones."

Las candidatas que pueden usar asistentes IA efectivamente como herramienta y explicar su trabajo fluido no son las personas que quieres filtrar — así trabajan las ingenieras en 2026. El filtro es para personas que pegan sin entender. El walk-through es el instrumento correcto.

Hacia dónde va esto

Los enfoques basados en detección continuarán perdiendo terreno frente a LLMs mejorados. Los enfoques de trace-de-proceso y walk-through seguirán funcionando porque no dependen del artefacto luciendo distinto — dependen de que la relación de la candidata con su propio trabajo sea defendible. Esa relación es para lo que estás contratando de cualquier manera.

detección iatake-homellmcoherencia de código

Artículos relacionados