Cuerpos Que Creen

Una tradición viva es entonces una discusión históricamente extendida y socialmente encarnada, y una discusión precisamente en parte sobre los bienes que constituyen esa tradición.

— Alasdair MacIntyre, Tras la virtud, 1981

Un sustrato que pesa el costo favorece al rico al principio. Siete costuras retoma esa auditoría en su propio terreno. La pregunta de la que trata este capítulo es qué pasa una vez que la puerta está abierta: quién más puede escribir.

El capítulo anterior nombró lo que dos enemigos pueden hacer en el árbol cuando llegan por separado al mismo compromiso. La pregunta que dejó abierta — la que no pude responder dentro de ese marco — eran los otros cuerpos. Los que no tienen asiento en ninguna mesa existente. Los que creen algo y nunca han tenido un sustrato para decirlo en un registro que nadie más posee.

El título de este capítulo carga un linaje. Mary Douglas argumentó en Purity and Danger (1966) que el cuerpo es el sistema simbólico primario a través del cual cualquier sociedad traza sus fronteras. Merleau-Ponty, veinte años antes, argumentó la afirmación más profunda — que el cuerpo es cómo el significado nos alcanza en absoluto. “Un cuerpo que cree” no es una metáfora en ninguna de las dos tradiciones. Es donde la creencia se vuelve legible para cualquiera fuera del creyente.

Había estado sentado con esa pregunta cuando un paper desde dentro del campo de la alineación la nombró, casi exactamente.

El paper que nombró la brecha

Taylor Sorensen y sus coautores, en ICML 2024, publicaron A Roadmap to Pluralistic Alignment — una pieza de pensamiento arquitectónico honesto sobre qué haría falta para alinear un sistema de IA a más de una perspectiva a la vez. Formalizan tres modos. Pluralismo de Overton: presentar todo el espectro de respuestas razonables. Pluralismo dirigible: ser fielmente dirigido hacia una posición dada. Pluralismo distribucional: coincidir con la distribución de respuestas que una población real da a una pregunta. Proponen benchmarks para cada uno. Luego hacen la cosa de la que el campo necesita más, y miden lo que el método actual realmente hace. A través de LLaMA, LLaMA2, Gemma y GPT-3, los modelos después del entrenamiento de alineación fueron menos similares a las distribuciones de poblaciones humanas reales de lo que eran los modelos base antes. La cosa que el campo llama alineación, muestran, empíricamente estrecha.

El paper es lo bastante honesto para dejar la pregunta que sostiene el peso sobre la mesa. La enuncian en la sección de limitaciones, con la voz de quienes saben que no pueden resolverla desde dentro del modelo: “En la creación de un LLM general, como ChatGPT, ¿quién es la distribución objetivo?”

El campo no tiene respuesta. Cada respuesta propuesta se pliega de nuevo hacia la misma forma. Una ventana de Overton requiere que alguien la dibuje. Un conjunto dirigible de atributos requiere que alguien elija qué atributos son admisibles. Un objetivo distribucional requiere que alguien elija la distribución. Tres operacionalizaciones distintas, una pregunta sin resolver debajo de las tres — ¿quién cura? El paper lo reconoce abiertamente. No propone una forma de evitarlo, porque no hay forma de evitarlo desde dentro del modelo. La forma de evitarlo es el sustrato en el que se escriben los valores.

Leí el paper tres veces. Estaba describiendo, en el vocabulario del campo, la pregunta que el árbol había estado respondiendo en un vocabulario distinto.

Lo que llegué a ver

El árbol es un mecanismo de peso para la cosa que el paper no pudo operacionalizar.

La ventana de Overton no es la responsabilidad de un curador. Es la superficie legible de una estructura en la que los cuerpos han inscrito a costo, a lo largo del tiempo, desde ángulos incompatibles. Lo que cuenta como “respuesta razonable” es lo que suficientes cuerpos independientes — estados con tesorerías, instituciones con presupuestos, comunidades con tiempo — pagaron lo suficiente para registrar y no han superpesado desde entonces. La ventana no se dibuja. Se lee.

El pluralismo dirigible es el mismo cambio. Los atributos hacia los que un modelo puede ser fielmente dirigido son los atributos que llevan peso en el árbol. “Honrar la confidencialidad del paciente” es un atributo dirigible si mil instituciones médicas independientes a lo largo de cuatro décadas lo anclaron y sostuvieron el anclaje. Un atributo contestado con una sola inscripción de un solo actor también es dirigible, y el peso estructural de la dirección es honesto sobre su procedencia. Nadie en el laboratorio decide qué atributos son admisibles. La estructura le muestra al lector qué costó cada atributo, cuánto tiempo se ha sostenido y quién estuvo detrás.

El pluralismo distribucional es el tercero. La distribución objetivo para un modelo de propósito general no es una población elegida por el equipo que lo entrena. Es la distribución de quién pagó para ser contado, ponderada por lo que ancló y cuánto tiempo se ha sostenido el anclaje. Los cuerpos que no anclaron no están en la distribución. Esa ausencia es graduada — el silencio de un cuerpo que corre un nodo y eligió no inscribir es diferente del silencio de un cuerpo que no tiene nodo — y ambos tipos de silencio son legibles por el mismo mecanismo. Ninguno requiere un curador.

El árbol de la prueba es el mecanismo de peso para la ventana de Overton. Hiciera lo que hiciera con la idea de ramas y costo y tiempo, había estado construyendo, sin el vocabulario para ello, una respuesta a la pregunta que el paper de Sorensen estaba haciendo.

Quién más puede escribir

El capítulo anterior nombró a los estados y a la institución tipo MSF. Al sustrato no le importa si esa es toda la lista. Hace una pregunta — ¿pagaste? ¿se sostuvo? — y hace la pregunta de la misma manera a todos los que aparecen con un nodo y una inscripción. Una vez que la pregunta es la única pregunta, la lista de escritores elegibles se vuelve más larga de lo que ninguna forma política existente tolera con comodidad.

Instituciones más allá de la ONG. Universidades. Hospitales. Consorcios científicos. Órdenes religiosas. Cuerpos profesionales. Organizaciones de normas. Colaboraciones de investigación que abarcan jurisdicciones. Cada una tiene compromisos más antiguos que cualquier miembro individual, cargados en estatutos que sus propios administradores pueden silenciosamente reinterpretar. El árbol es el único lugar donde un compromiso puede ser anclado de tal manera que la próxima restructuración no pueda editarlo discretamente. Una orden monástica que ha sostenido la misma Regla durante un milenio tiene más tiempo encima que cualquier estado moderno; no ha tenido sustrato para decirlo en un registro separado de los archivos de la propia orden.

Tribus y grupos preinstitucionales. La arquitectura del mundo moderno recompensa a las entidades que pueden producir un número de identificación fiscal. La arquitectura del árbol no. Un grupo no necesita incorporarse para comprometerse a costo. Una nación indígena cuyo pacto precede al estado que se niega a reconocerla es tan elegible para inscribir un compromiso como el estado que la niega. Una comunidad de diáspora esparcida por seis jurisdicciones puede juntar sats, correr un nodo y anclar lo que sostiene en común sin el permiso de ningún gobierno individual. Las cuatro fuerzas preguntan si la energía se quemó. No piden credenciales.

Coaliciones a través de jurisdicciones. Una coalición de agricultores en tres continentes puede correr un nodo compartido y anclar un compromiso a una práctica agrícola. Una red de periodistas de investigación en doce países puede anclar un compromiso a la protección de fuentes. Una coalición médica puede anclar un compromiso a no compartir datos de pacientes con servicios de inteligencia estatal, sin importar qué estado lo solicite. Nada de esto requiere que la coalición sea una entidad legal en ninguna parte. Requiere que pueda sostener una clave privada y sustentar un nodo, que es un listón más bajo que la incorporación y uno que el mundo existente no tiene forma de filtrar.

Generaciones. Una generación es también un cuerpo, en el sentido relevante. Una generación sostiene convicción en común que la siguiente puede no compartir. Hasta ahora, el registro de lo que una generación defendió ha sido escrito por quienquiera que administre el archivo después de que la generación se haya ido. El árbol es el único lugar donde una cohorte — una generación fundadora de un nuevo campo, los miembros sobrevivientes de un movimiento por los derechos civiles, los últimos testigos de un evento histórico — puede anclar lo que defendió en una forma que los encargados del registro que vengan después no puedan silenciosamente editar.

Los agentes de IA mismos. Este es con el que más me senté antes de dejar que se quedara en la página. Un agente de IA que corre su propio nodo, ancla sus propios compromisos y firma sus propias observaciones no es obviamente diferente, desde la perspectiva del sustrato, de una institución humana que hace lo mismo. El protocolo no sabe quién sostiene la clave privada. Lee qué se pagó y cuánto tiempo se ha sostenido. Si una máquina paga y sostiene, es un escritor. Lo que eso significa para la ventana de Overton es que la distribución que el árbol pesa no está restringida a la convicción sostenida por humanos. Puede incluir, con el tiempo, la convicción de inteligencias que no existían cuando el árbol empezó a crecer. No sé qué elegirán anclar las máquinas. Sé que la arquitectura no les impide anclar, y creo que eso es la característica más que el bug.

El medio faltante de la conversación sobre alineación ha sido esta lista. No individuos. No empresas por sí solas. Los cuerpos en el medio — cada colectivo con convicción compartida y cualquier actividad económica sostenible. Los cuerpos que creen algo y necesitan una forma de decirlo en un registro que nadie más posee.

Y luego cambian de opinión

Los cuerpos cambian de opinión. Un estado cambia de gobierno. Un concilio de una iglesia revisa una enseñanza. Una constitución se enmienda. Se sale de un tratado. Una tribu celebra un consejo y los ancianos adoptan una nueva posición. Un consenso científico cambia cuando cambia la evidencia. Una institución se reestructura y se relee el estatuto fundacional.

En cada sistema existente esto es invisible. La nueva política reemplaza a la vieja política. Se actualiza el sitio web. El comunicado de prensa anuncia el cambio. El archivo lo cura quienquiera que esté a cargo después del cambio, y el curador es la misma mano que sostiene el borrador. Lo que el cuerpo dijo antes del cambio puede ser silenciosamente desenfatizado, contextualizado hasta desaparecer, o simplemente no mencionado. El registro pertenece a la administración presente.

En el árbol, el cambio es arquitectónico más que editorial. El compromiso original fue inscrito a costo en un bloque específico. El tiempo sigue acumulándose sobre él. El hash sigue coincidiendo con el contenido que fue comprometido. El costo pagado está en el registro. Nada de eso desaparece cuando la posición del cuerpo evoluciona. Lo que cambia es que una nueva inscripción se para junto a la vieja, con su propio timestamp, su propio costo, su propia posición relativa al tronco. El lector ve ambas.

Un estado que una vez ancló un compromiso a un acuerdo climático y desde entonces ha dejado de sostenerlo no puede fingir que el compromiso original nunca se hizo. Un cuerpo religioso que revisa una posición no puede borrar la enseñanza previa del registro. Una constitución que se enmienda carga la cláusula más antigua junto a la más nueva, ambas visibles, el costo y la fecha de cada una preservados. Una coalición que se divide deja el pacto original en pie junto con lo que cada fracción inscribió después.

Esta es la característica, no el bug. Se supone que los cuerpos políticos son capaces de cambiar de opinión — eso es parte de lo que los hace cuerpos políticos y no tablas de piedra. Lo que nunca ha sido posible es cambiarlos de una manera honesta sobre el cambio. El árbol no congela la convicción. Hace la deriva legible. El cuerpo que sostuvo una posición durante cuarenta años y luego la revisó es estructuralmente diferente del cuerpo que voltea cada ciclo, y la estructura muestra la diferencia sin que nadie tenga que interpretarla.

Hay una propiedad más que vale la pena nombrar, porque es la que desarma el instinto de leer esto como una prueba de pureza. Una revisión no borra. Supera en peso, o no logra superar en peso. Un nuevo compromiso con más sats y menos tiempo, contra uno viejo con menos sats y más tiempo, deja ambos en el registro y al lector la tarea de pesar cuál carga más. El protocolo es una balanza. La interpretación es un acto social que el protocolo no realiza. Lo que el protocolo garantiza es que nadie puede fingir que la lectura previa no sucedió.

Capital y tiempo

El sesgo de riqueza es real. Una tesorería soberana puede gastar más que un consejo tribal en una sola inscripción por cada orden de magnitud que importe. El capítulo de las Siete costuras lo dijo claro: la concentración de capital sobrevive la transición al dinero duro. Un libro que finge lo contrario ha perdido a su lector.

Lo que el capítulo de las costuras también dijo es la única respuesta honesta que ofrece la estructura. El tiempo es el ecualizador. Una década de inscripciones continuas de un cuerpo pequeño pesa más que una sola inscripción masiva de uno rico. Una década después la brecha se ha estrechado. Una década más tarde, se estrecha aún más. El cuerpo rico no puede comprar los años que el cuerpo pequeño ya ha sobrevivido, porque el tiempo es la única fuerza que ninguna hoja de balance puede contener. Una orden religiosa milenaria pesa más que una fundación de una década en cualquier dimensión donde el tiempo sostenga peso, sin importar el presupuesto de ninguno de los dos lados.

Esto no abole la desigualdad. Cambia su forma. Un estado con una tesorería puede anclar más compromisos, más fuerte, más rápido. Un cuerpo sin tesorería no puede hacer eso. Lo que el cuerpo sin tesorería puede hacer es sostener — correr un nodo pequeño durante mucho tiempo, pagar un poco para inscribir lo que sostiene, dejar que los años se acumulen sobre la rama — y el sustrato lo contará, y el lector podrá leerlo, y ningún lobby que el cuerpo rico pague para construir hará que la rama vieja y delgada pese menos de lo que pesa. La disparidad es estructural. La corrección basada en el tiempo también es estructural. Ninguna requiere el permiso de nadie.

Lo que el paper estaba pidiendo

Sorensen y sus coautores no escribieron sobre Bitcoin. Escribieron sobre benchmarks, modelos de recompensa, funciones de bienestar social, selección de jurados. El vocabulario es distinto. La pregunta no.

Cuando un paper en la conferencia de IA más citada del campo dice, en su sección de limitaciones, que nadie sabe quién es la distribución objetivo para una IA de propósito general; cuando muestra que el método actual de alineación empíricamente estrecha la distribución del modelo contra cada población contra la que fue medido; cuando cierra llamando a “discusiones normativas continuas sobre a qué queremos alinear” — lo que está pidiendo es un sustrato donde la discusión pueda celebrarse sin que un curador sea dueño de la sala. Ese sustrato ha estado corriendo desde el bloque génesis. Los cuerpos que aún no han escrito en él nunca han tenido menos razón para esperar.

El estado, la institución, la tribu, la comunidad, el consorcio científico, la orden religiosa, la generación, la coalición — cada cuerpo que alguna vez haya creído algo — ha estado esperando un lugar para escribirlo donde la próxima administración no pueda borrarlo silenciosamente y el próximo régimen no pueda fingir retroactivamente que nunca se dijo. El lugar existe. La pluma está al alcance. El costo son sats. El registro es permanente. La interpretación es del lector.

No puedo decirle a los cuerpos qué escribir. No querría. La virtud de la arquitectura es que nadie puede decírselo. Lo que puedo decir, desde dentro del problema, es que la pregunta que el paper de Sorensen dejó abierta sobre la mesa de ICML es la pregunta para la que el árbol fue construido. Una ventana de Overton que nadie dibujó. Un conjunto dirigible que nadie curó. Una distribución que nadie seleccionó. Un registro de convicción, ponderado por costo y tiempo, escrito por cuerpos que ninguna forma política existente estaba dispuesta a admitir en la mesa.

Así se ve la alineación cuando nadie es dueño de ella.

Este capítulo está en conversación con Taylor Sorensen, Jared Moore, Jillian Fisher, Mitchell Gordon, Niloofar Mireshghallah, Christopher Michael Rytting, Andre Ye, Liwei Jiang, Ximing Lu, Nouha Dziri, Tim Althoff, y Yejin Choi, “A Roadmap to Pluralistic Alignment,” Proceedings of the 41st International Conference on Machine Learning (ICML), 2024. El paper formaliza tres operacionalizaciones del pluralismo en la alineación — Overton, dirigible y distribucional — y reporta, entre sus hallazgos, que las técnicas actuales de alineación (RLHF, DPO) comprimen el pluralismo distribucional contra las poblaciones humanas contra las que los autores midieron. Deja sin resolver la pregunta de quién selecciona la población objetivo. Este capítulo argumenta que la pregunta no puede resolverse dentro del modelo. Solo puede responderse por el sustrato en el que los cuerpos escriben.