La Pasada Adversarial

Man muss immer umkehren.

Siempre hay que invertir.

— Carl Gustav Jacob Jacobi, siglo XIX

La primera vez que corrí la pasada adversarial, la corrí sobre el sitio web de SatsRail.

Le di al modelo la copia de la página principal que había redactado, los casos de uso que pensaba perseguir, los demos del producto — la superficie con la que un cliente se encontraría primero, el frente del rail de pagos que estaba construyendo — y le dije que construyera el caso. Asume que esto es sospechoso. Encuentra el hilo. Tira. La salida fue una crítica que no podría haber escrito sobre mi propio proyecto, porque no me lo habría permitido. Era precisa, selectiva e implacable. Tardó unos doce segundos en generarse y costó unos centavos en llamadas a la API. Esa fue la tarde en que entendí lo que era la herramienta, porque la herramienta ahora apuntaba en la otra dirección.

No cuesta nada pedirle a una IA que construya un caso contra alguien.

Un LLM puede ser apuntado a la huella digital de una persona — un perfil de LinkedIn, un historial de GitHub, metadatos de correo, declaraciones públicas, comentarios de código, patrones de transacciones — y se le puede preguntar: ¿qué revela esto? ¿Qué puede hacerse parecer sospechoso? ¿Qué narrativa vive en los vacíos?

La IA no vacila. No sopesa primero la evidencia. No dice “esto no es concluyente” o “la evidencia exculpatoria es igual de fuerte”. Encuentra el hilo y tira. Y como la información para contar la historia completa ya estaba ahí — dispersa por bases de datos, archivos, marcas de tiempo — la narrativa que construye se siente como descubrimiento. Como excavación. Como verdad.

No es verdad. Es selección disfrazada de análisis.

La investigación de costo cero

Un investigador humano es caro. Uno bueno cuesta dinero — por hora, por día, por iguala. Esa fricción solía importar. Significaba que alguien tenía que justificar el gasto. ¿Valía la pena la investigación? ¿Era el objetivo lo bastante importante para vigilarlo? ¿Había causa suficiente para escarbar?

Las preguntas mismas imponían un tipo de disciplina. No disciplina moral, necesariamente, sino disciplina operativa. Escarbar costaba recursos. Los recursos debían asignarse. La asignación requería justificación. La fricción era proporcional a lo que estaba en juego.

Un LLM no tiene tal umbral.

Puedes pedirle que construya un caso contra cualquiera por el costo de unos centavos de llamadas a la API. Sin comité de presupuesto. Sin proceso de aprobación. Sin un investigador humano que pueda objetar y decir “en realidad, esta interpretación es un estiramiento” o “te falta el contexto aquí”. La IA toma la asignación tal como está y la ejecuta.

Y como no hay costo proporcional, no hay fricción proporcional. Puedes correr una investigación adversarial contra alguien a quien nunca has conocido. Contra un empleado que estás pensando en despedir. Contra un contratista con quien estás negociando. Contra un competidor. Contra un desconocido cuyo trabajo quieres desacreditar. La barrera de entrada es un prompt.

Lo que está en juego es infinito. El costo es cero. Ese es el problema estructural.

La máquina de confirmación

Cuando le pides a un LLM que construya un caso contra alguien, el modelo entiende el patrón. Dado un objetivo hostil y un conjunto de datos, sabe qué hacer.

Encuentra la evidencia que lo apoya. La ordena. Construye una narrativa. No pregunta si la evidencia es suficiente. No pregunta si la conclusión está justificada. No pregunta si la evidencia para apoyar una conclusión opuesta es igual de fuerte. Responde la pregunta que hiciste.

Considera a un ingeniero de software que lleva años programando en público. Miles de commits — algunos escritos a las tres de la mañana, algunos enviados demasiado rápido, algunos reflejando opiniones de una época en la que esas opiniones eran distintas. Casos límite, implementaciones incompletas, comentarios airados en el historial de commits. El mismo conjunto de datos también contiene los años de trabajo cuidadoso: refactorizaciones, mentoría, revisiones de código que mejoraron la salida de otras personas. Crecimiento. Corrección de errores pasados.

Pídele a un LLM que construya un caso a partir de ese historial. Encontrará los commits de las tres de la mañana y los encadenará, resaltará el comentario airado y la rama abandonada, construirá una narrativa de imprudencia, inmadurez, tal vez algo más oscuro. La evidencia exculpatoria no es ignorada. Simplemente no es parte de la pregunta.

Un adversario no pide equilibrio. Pide un caso. La IA lo construye.

Los ojos del desconocido

Aquí está el giro: ya sabes que esto viene.

Alguien le va a pedir a una IA que haga un caso contra ti. O contra tu equipo. O contra tu trabajo. Tal vez sea un competidor buscando un ángulo. Tal vez un periodista. Tal vez un inversor haciendo debida diligencia. Tal vez alguien a quien rechazaste, y quiere entender por qué reformulándolo como un defecto en ti.

Le harán la misma pregunta a la IA. Y la IA la responderá de la misma manera.

La única defensa es correr la pasada adversarial primero.

No por la verdad en abstracto. No para lograr algún tipo de autoconocimiento objetivo. Corre la pasada para encontrar tu superficie de ataque. Alimenta a la IA con tu huella profesional, tu historial de código, tus declaraciones públicas, tu toma de decisiones en momentos de estrés. Pídele que construya un caso contra ti. No por catarsis — por inteligencia.

¿Qué ve un desconocido cuando mira tu trabajo? No un colega que te conoce desde hace años. No un mentor que cree en ti. Un desconocido. Un adversario. Un LLM sin memoria, sin caridad, sin confianza previa.

¿Qué historia construye? ¿Dónde están los puntos débiles? ¿Dónde se ve la evidencia peor que la realidad? ¿Dónde te dejaste expuesto?

Esta es la ventaja de no tener memoria. Un adversario no conoce tu historia. No sabe que estabas aprendiendo. No sabe que corregiste el rumbo. No sabe el contexto en el que tomaste una decisión bajo presión de tiempo. El LLM es una simulación de ese adversario. No tiene memoria de tu trayectoria, solo los artefactos. Solo la superficie.

No puedes darle una memoria que no tienes. Pero puedes ver lo que él ve.

La jugada

La superficie es lo que un adversario ve. Es lo único que puedes cambiar.

No te mueves para esconderte. Te mueves para reconstruir. Para reorganizar. Para hacer la elección que habrías hecho con información perfecta y tiempo ilimitado — la elección que estás haciendo ahora que sabes qué encontrará un adversario.

Puedes reescribir, recomponer, borrar — o, una vez que has visto lo que el adversario verá, decidir que en realidad no te importa, y dejar el artefacto como está. Eso también es una jugada; ya no es un punto ciego.

El punto es: te estás moviendo desde una posición de análisis, no desde una posición de ignorancia.

Un investigador con tiempo y recursos siempre pudo hacer esto. Podía poner a prueba su trabajo, su pensamiento, sus posiciones. Podía preguntar “¿cómo se vería esto para alguien hostil?” y luego ajustar. Esto solía ser un lujo del privilegio — de estar bien financiado, bien conectado, ser capaz de contratar personas para que hicieran el pensamiento adversarial por ti.

Ahora cualquiera con un LLM puede hacerlo. El costo es nada. La fricción es un prompt.

La habitación barata

El canon de seguridad llama a esto la mentalidad adversarial. Yo la estoy aplicando al orden cívico en lugar de al texto cifrado.

Un jugador de ajedrez piensa desde ambos lados del tablero. Antes de que el oponente mueva, el jugador ya se ha sentado en la otra silla — ha visto la posición a través de los ojos del otro, ha encontrado la amenaza que haría, la casilla a la que apuntaría. La disciplina es posicional, no reactiva. No esperas el movimiento. Lo juegas en tu cabeza, contra ti mismo, antes de que se forme.

La pasada adversarial es la misma postura. Corrida una vez, es reacción. Corrida en rotación, es la habitación del jugador de ajedrez — la sala de análisis, la habitación donde cada variación puede intentarse porque intentarla no cuesta nada.

Eso es lo que cambió. Mirar tu posición a través de los ojos de cada adversario solía ser caro. Podías permitírtelo para los adversarios que esperabas. El adquiriente si estabas levantando capital. El regulador si estabas en una industria vigilada. El periodista si eras el tipo de persona sobre la que escriben los periodistas. Los demás no podías permitírtelos, así que adivinabas cuáles importaban, y los ojos que te perdías eran los que te encontraban.

Ahora el costo de una variación más es un prompt. Te sientas al otro lado del tablero primero por el periodista, luego por el regulador, luego por el empleado rechazado, luego por el competidor, luego por el adquiriente, luego por el actor estatal, luego por el desconocido que solo oyó tu nombre de segunda mano. Cada uno empieza en un contexto limpio — modo incógnito, una nueva conversación, un modelo que no te recuerda. Asignas el rol y el modelo lo juega. La limpieza es lo que hace honesta la simulación. Un modelo que ha hablado contigo antes será cortés. Un modelo que te encuentra en frío y al que se le dice que es hostil, no.

La asignación del rol importa. “Construye un caso” es la jugada principiante. La disciplina es el casting: eres un regulador a quien le han dicho que esta compañía está cometiendo fraude. Encuentra el patrón. Eres un periodista escribiendo un perfil con una tesis hostil. La tesis está dada. Encuentra la evidencia. Eres un adquiriente cuyo equipo de deal ha recibido la orden de encontrar una razón para retirarse. El rol tiene que ser limpio y completo, o el modelo se cubre. Asignado limpiamente, el modelo lleva el papel hasta el final.

Rotas. Y a medida que las rotaciones se acumulan, aparece algo que ninguna pasada individual puede mostrar. Los hallazgos dejan de ser individuales y empiezan a ser una forma. Algunas debilidades aparecen sin importar quién esté mirando — esas están en la posición misma. Otras aparecen solo para un rol — esas son particulares, situacionales, a veces vale la pena arreglarlas y a veces no. La rotación es cómo las distingues. Una sola pasada no puede.

Después de la rotación, dejas de arreglar lo que el último adversario vio y empiezas a arreglar la forma que cada adversario sigue encontrando. Dejas de reaccionar a amenazas y empiezas a jugar la posición. Aprendes el tablero.

Esta es la habitación barata. El jugador de ajedrez no paga por cada variación que considera en el análisis — paga atención. El costo de encontrar un agujero en tu propia posición, antes de que un oponente lo encuentre, solía ser el costo de contratar a alguien para que mirara. Ahora es el costo de preguntar. La fricción se fue. La disciplina es lo que queda.

El Arquitecto ha modelado cada variación, cada respuesta posible

Pensar lo que otros piensan es un superpoder. También es una trampa.

La trampa es que la habitación es barata, y cualquier cosa barata se expande para llenar el tiempo disponible. Una pasada se vuelve cinco. Cinco se vuelven veinte. Veinte se vuelven una práctica permanente donde cada movimiento se analiza desde cada ángulo antes de salir de tu escritorio. La rotación se convierte en ritual. El ritual se convierte en una forma de no moverse en absoluto.

Esto es lo que la figura del ajedrez casi esconde. Los jugadores de ajedrez saben algo que el entusiasmo por la sala de análisis olvida: no ganas partidas en la sala de análisis. Ganas en el tablero, en el tiempo asignado, bajo el reloj. El jugador que no puede comprometerse sin haber visto cada variación hasta el fondo pierde por tiempo. El análisis era real. El reloj también era real.

Los modos de fallo se acumulan. Hay parálisis — cada pasada encuentra algo, y si intentas abordar todo lo que cada adversario ve, nunca envías. Te cubres. Lijas los bordes que hacían que valiera la pena hacer el trabajo en primer lugar. El trabajo más interesante tiene bordes, y los bordes son lo que encuentran los adversarios. Lijarlos no es una defensa. Es rendición con pasos extra.

Hay elegancia confundida con verdad. El modelo es bueno construyendo narrativas adversariales coherentes. El adversario real, cuando llegue, puede ser tosco, estúpido o aleatorio. El periodista puede no ser el escritor cuidadoso que simulaste. El regulador puede no correr el manual sofisticado que el modelo imaginó. Puedes sobre-prepararte para la simulación elegante y llegar sin preparación a la realidad tonta. Un modelo inteligente hace adversarios inteligentes. Los adversarios reales a menudo son peores en su trabajo de lo que es el modelo. El Arquitecto había modelado cada variación, cada permutación, cada respuesta posible — y aun así perdió ante el movimiento que no podía modelar.

Y hay auto-distorsión. Pasa suficiente tiempo viéndote a través de ojos hostiles y empiezas a creer que esa es la visión precisa. Pierdes la caridad requerida para seguir haciendo cosas. El primer espejo advertía sobre un tipo de ahogo — Narciso en su propio reflejo.

Aquí es donde la prescripción tiene que ponerse límites, o se convierte en aquello a lo que el resto del libro se opone. El libro argumenta contra interiorizar la mirada vigilante; este capítulo prescribe correrla sobre ti mismo. Las dos solo se reconcilian con el límite. La mirada se queda en los artefactos, no en el yo que los hizo. La pasada termina cuando tú decides. En el momento en que no termina, ya no eres tú quien la corre — es ella la que te corre a ti.

La jugada sigue siendo moverse. La habitación es un insumo, no un reemplazo. En algún momento el análisis tiene que cerrarse y el trabajo tiene que enviarse. La rotación es una herramienta; la disciplina que termina la rotación es la habilidad real. Los jugadores de ajedrez la llaman intuición — el punto en el que el cálculo se detiene y la mano va a la pieza. No puedes analizar tu camino hasta ese momento. Solo puedes analizar lo suficiente para saber cuándo el resto es evitación.

Lo que no existe no puede convertirse en arma

La mayoría de la gente piensa la seguridad como un problema de ocultamiento. No dejes que el adversario vea la información sensible. Cifrala. Compártmentalízala. Cubre tus huellas. La suposición es que la exposición es el ataque.

Pero hay otra aproximación: minimizar la superficie. No recolectes los datos en primer lugar. No crees el artefacto. No construyas la estructura que un adversario encontraría valiosa para investigar.

Este es el principio de diseño detrás de sistemas que resisten la investigación no ocultando sino por arquitectura. Ciegos al contenido. Libres de identidad. Sistemas que no necesitan saber quién eres o qué estás haciendo, así que no hay registro permanente que encontrar.

Una IA no puede convertir en arma datos que no existen. Un adversario no puede construir una narrativa a partir de artefactos que nunca fueron creados.

Esta es la diferencia entre privacidad como ocultamiento y privacidad como estructura. Una siempre está mirando por encima del hombro. La otra está construida de tal forma que quien mira por encima del hombro no tiene nada que encontrar. Pensar en voz alta deja rastros nombró el problema: la infraestructura centralizada convierte cada pensamiento en un artefacto. La respuesta estructural no es esconder mejor. Es infraestructura que no crea el artefacto en primer lugar.

Este es el principio de diseño sobre el que corre Bitcoin. El libro mayor es público; la bóveda no existe. Sin cuenta que confiscar, sin custodio al que presionar, sin emisor al que citar — porque el artefacto que un adversario convertiría en arma nunca fue creado. El rail de pagos que estaba construyendo aplica la misma jugada en la capa de identidad; los capítulos que siguen la aplican en las capas moral, de acceso y de atención. En cada caso la jugada es la misma. Quita la manija. No hay nada a lo que el LLM del adversario pueda apuntar.

Las tres caras

Los dos capítulos anteriores nombraron el regalo y el costo. El espejo fue el regalo — la primera habitación libre de juicio para que un humano piense en voz alta. El rastro fue el costo — cada pensamiento que pones en la infraestructura de otra persona se convierte en un artefacto en el sistema de otra persona, recuperable por cualquiera que lo pida.

Este capítulo nombra la jugada. La misma investigación de costo cero que te amenaza es la que puedes correr sobre ti mismo, en rotación, hasta que veas el tablero. La asimetría corre en ambas direcciones.

El regalo, el costo y la jugada. Tres caras de la misma tecnología. Un espejo para pensar, una infraestructura que recuerda, y un arma que cualquiera puede apuntar — incluido apuntarla a ti mismo, en tus propios términos, antes de que nadie más lo haga.

No puedes controlar qué preguntas hará un adversario a un LLM apuntado a tu trabajo. No puedes controlar qué narrativa construirá. No puedes asegurar que sea justo, o minucioso, u honesto.

Puedes controlar si lo ves primero.

La pasada adversarial no te cuesta nada. No correrla te cuesta todo lo que el adversario encuentre.