10. Nota reflexiva: una tesis construida orquestando IA bajo supervisión humana

Esta nota cumple, dentro del argumento global, una función singular y un tanto incómoda: vuelve sobre las condiciones materiales de producción del propio trabajo. Los capítulos anteriores sostuvieron, con apoyo en el experimento (T1–T6) descrito en el capítulo «04. Metodología experimental» y cuantificado en «05. Resultados», que la inteligencia artificial estadística mejora la imitación sin cruzar ningún umbral categorial, y que las limitaciones decisivas de la urbanidad computada no son técnicas sino políticas, económicas y ontológicas. Ahora bien, esta tesis fue redactada y construida orquestando sistemas de IA estadística bajo supervisión humana. La condición no es anecdótica: es performativa. El trabajo es, en parte, un ejemplar de aquello que examina. En consecuencia, en este capítulo me permito —contra el registro general en primera persona del plural— escribir en primera persona del singular, porque la supervisión, el juicio de relevancia y la responsabilidad por el resultado son irreductiblemente míos y no se delegan en ningún sistema. Examino aquí cinco cuestiones: cómo se produjo el trabajo, qué ironía encierra ese modo de producción, por qué el humano funcionó como horizonte y no como insumo, qué riesgos tiene argumentar con un caso que es a la vez prueba, y qué implicación normativa se sigue para la noción de soberanía.

10.1. Descripción honesta del método de producción

Comienzo por la descripción, en el sentido estricto fijado en la introducción metodológica: qué ocurrió, antes de qué significa. La producción de esta tesis combinó tres tipos de operación que conviene no confundir. Primero, operaciones de generación lingüística delegadas a modelos de lenguaje: redacción de borradores, reformulación de párrafos, traducción de notas, sugerencia de estructuras, recuperación parafrástica de argumentos de la bibliografía. Segundo, operaciones de cómputo determinístico ejecutadas por programas exactos y no por modelos estadísticos: el cálculo de la verdad de referencia de las tareas T1 a T5 (la multiplicación de doce dígitos cuyo valor exacto es 349625969488102520908371, el conteo combinatorio de rutas cuyo valor exacto es 2704156, la iteración recursiva afín que arroja 23842, la suma de cuadrados que arroja 651396404, y el camino más corto resuelto con un algoritmo determinístico). Tercero, operaciones de juicio: la decisión sobre qué tareas diseñar, qué teoría urbana computable incluir en el catálogo del capítulo «03», qué contaba como acierto, qué fuentes eran admisibles y, sobre todo, qué de todo lo generado merecía permanecer en el texto.

Conviene ser preciso sobre el reparto, porque la honestidad metodológica es aquí parte del argumento. La IA estadística hizo trabajo de imitación competente: produjo prosa académica plausible, encadenó argumentos verosímiles y propuso conexiones entre autores. No fijó nada. Lo que fijé yo —y solo yo podía fijar— fue el marco: la tesis central, la terminología estable, la regla dura de fuentes según la cual ante la duda sobre la existencia de una obra no se cita, y el criterio de relevancia que descarta lo verosímil cuando no es pertinente o no es verdadero. Esta distinción reproduce, dentro del taller de escritura, la misma frontera que el experimento midió en el dominio de las ciudades. Los modelos de lenguaje resolvieron con soltura las tareas donde basta la plausibilidad estadística respaldada por un patrón frecuente, pero erraron precisamente donde se exige fidelidad aritmética sin atajos: en T1 uno de los dos intentos de Opus devolvió 349634804376851666458571 en lugar del valor correcto, y en T5 ambos intentos de Opus devolvieron 651397404 y 651400404, números cercanos pero falsos. El cómputo no admite cercanía; o se acumula con precisión o se estima, y estimar no es computar. La verdad aritmética de esos agregados no la produjo ningún modelo de lenguaje: la produjo un programa determinístico, y la verificación de las respuestas fue, una vez más, una decisión humana sobre qué cuenta como correcto.

10.2. La ironía performativa: la herramienta sobredimensionada que argumenta su sobredimensionamiento

Paso de la descripción a la interpretación. El hecho de haber escrito esta tesis con asistencia intensiva de modelos de lenguaje no debilita su argumento; lo encarna. La tesis sostiene que disponemos de una herramienta epistémica sobredimensionada respecto de su aplicación efectiva sobre la ciudad, y que el salto epistémico prometido no se produce. Usar esa misma herramienta para construir el argumento es, en apariencia, una contradicción performativa; en realidad es una demostración por ejemplar. Si bastara escalar el cómputo para cruzar un umbral categorial, entonces el sistema que me asistió debería haber podido, por sí solo, fijar la tesis, decidir la relevancia y garantizar la verdad de las cifras. No pudo. Hizo exactamente lo que el capítulo «06. Crítica técnica» predice que hace: imitar bien, sin garantizar verdad aritmética ni decidir relevancia. La herramienta sobredimensionada sirvió, pues, como banco de pruebas involuntario de su propia descripción.

La ironía tiene un valor argumentativo y no meramente retórico. Hui advierte contra la monocultura tecnológica que presenta el desarrollo de la IA como una flecha única e inevitable hacia una inteligencia general (Hui, 2020). Frente a esa narrativa de aceleración, el modo de producción de esta tesis ofrece un contraejemplo doméstico y verificable: un sistema de altísimo coste material y energético resultó útil como amplificador de la imitación lingüística y como acelerador de tareas mecánicas, pero el conocimiento —en el sentido de aquello por lo que respondo, lo que sostengo como verdadero y pertinente— no migró a la máquina. Permaneció en la frontera donde un humano decide. La economía de la aplicación que defiende la tesis se ilustra aquí en miniatura: el valor no estuvo en un modelo más potente, sino en hacer presentable, usable y aplicable un saber que ya existía, tarea para la cual la potencia bruta del modelo fue auxiliar y nunca soberana.

10.3. El humano como horizonte: la operación T6 no delegable

La interpretación anterior se apoya en una tesis más fuerte, que ahora argumento. En la arquitectura del experimento, las tareas T1 a T5 son directas: tienen una entrada estructurada, una función objetivo explícita y una salida verificable contra una verdad de referencia. La tarea T6 es inversa y se marcó deliberadamente como NO_COMPUTABLE: una escena urbana ambigua, entregada en lenguaje natural, sin métrica de peligro ni función objetivo, en la que se pide un juicio de relevancia sobre a quién dirigir una alerta. Lo decisivo, y por eso la tarea es inversa, es que la formalización que haría falta para escribir el algoritmo es ella misma el juicio que se pide. No hay función de entrada-salida antes de que un humano fije qué cuenta como relevante. Los modelos produjeron respuestas plausibles y coherentes —unas focalizaron en el niño que pisa la calzada, otras en el repartidor en moto como agente activo del peligro, otras en el acompañante capaz de retener al niño—, todas defendibles, ninguna verdadera o falsa en el sentido en que lo eran las cifras de T1 a T5. Esa pluralidad de respuestas razonables no es un defecto del modelo: es la marca de que el problema pertenece al dominio del significado contextual, donde el cómputo puro no puede siquiera arrancar.

Sostengo que la producción de esta tesis fue, de principio a fin, una sucesión de operaciones del tipo T6. Cada vez que decidí que un párrafo generado era irrelevante aunque fuera correcto, o que una cita propuesta debía descartarse porque la obra podía no existir, o que una estructura argumentativa servía mejor a la tesis que otra igualmente verosímil, ejecuté un juicio de relevancia que ningún modelo podía ejecutar por mí, porque ese juicio es el que constituye el marco dentro del cual el modelo opera. Aquí se vuelve operativo el aparato conceptual del capítulo «07. Crítica ontológica». En términos de Dreyfus, la relevancia presupone un mundo, un horizonte de significatividad que no se da como conjunto de datos sino como trasfondo de prácticas en el que ciertas cosas importan y otras no (Dreyfus, 1992). En términos kantianos retomados por Hui, lo que el modelo no hace es juicio reflexionante: no asciende del caso a la regla, no se da sus propios fines, sino que opera siempre dentro de fines que otro fijó (Hui, 2020). El humano no fue, entonces, un insumo más del proceso de producción, una fuente de datos entre otras; fue el horizonte dentro del cual el cómputo adquirió sentido. La supervisión no fue control de calidad añadido al final: fue la condición que hizo del cómputo conocimiento y no ruido plausible.

10.4. Riesgos y límites de la autoevidencia: por qué esto ilustra pero no demuestra

Debo ahora aplicar a esta misma nota el rigor que la tesis exige, distinguiendo lo que el caso muestra de lo que no muestra. La autoevidencia es un recurso peligroso. Un argumento que se ofrece a sí mismo como prueba corre tres riesgos que conviene nombrar sin atenuarlos. El primero es la circularidad complaciente: usar el hecho de que escribí la tesis con IA como si fuera por sí mismo evidencia concluyente de la tesis. No lo es. Que en este caso particular el juicio de relevancia haya sido irreductiblemente humano no demuestra que deba serlo siempre y en todo sistema posible; muestra, más modestamente, que en una instancia controlada y verificable la potencia del modelo no sustituyó al juicio. La instancia ilustra el argumento; no lo clausura. La carga de la prueba sigue recayendo en el experimento sistemático (T1–T6) y en la crítica conceptual de los capítulos «06», «07» y «08», no en la anécdota de la producción.

El segundo riesgo es el sesgo del superviviente epistémico: yo describo el reparto entre máquina y humano desde el lugar de quien supervisó, y es precisamente ese lugar el que está en cuestión. Un crítico podría sostener que la frontera entre orquestar y ser orquestado es más porosa de lo que esta nota admite. La respuesta es metodológica: esa frontera se mantiene solo si la supervisión deja rastro verificable —fuentes controladas, cifras computadas aparte y contrastadas, regla dura ante la duda bibliográfica. El Banco Epistémico Urbano es, también en este sentido, el dispositivo que convierte la supervisión declarada en supervisión auditable.

El tercer riesgo es la complacencia tranquilizadora: concluir que, puesto que el humano conserva el juicio de relevancia, no hay nada que temer. Esa lectura traiciona el argumento. Que el modelo no cruce un umbral categorial no lo vuelve inocuo; al contrario, su capacidad de producir prosa plausible y cifras casi correctas es justamente lo que lo hace peligroso cuando se lo usa sin supervisión, porque el error de T5 —651397404 en lugar de 651396404— es del tipo que pasa desapercibido. La autoevidencia, bien entendida, no consuela: advierte. Muestra que la diferencia entre conocimiento y plausibilidad depende de un trabajo humano que es costoso, frágil y fácil de omitir, y que omitirlo no produce un error escandaloso sino uno discreto y verosímil.

10.5. Implicación normativa: la supervisión humana como soberanía y aplicación responsable

Cierro pasando de la interpretación a la argumentación normativa, que es donde esta nota se conecta con la tesis política de los capítulos «08» y «11». Si la supervisión humana es la condición que hace del cómputo conocimiento, entonces sostener esa supervisión no es una preferencia metodológica: es una forma concreta de soberanía. La tesis ha insistido en que las limitaciones decisivas de la urbanidad computada son políticas, económicas y ontológicas, y en que la pregunta central es quién decide qué se computa, con qué cosmotécnica y a costa de qué soberanía. La nota reflexiva permite formular una respuesta situada: la soberanía de cómputo no es solo la propiedad de la infraestructura material —los centros de datos, la energía, los modelos—, sino también, y de modo más íntimo, la retención del juicio de relevancia en manos humanas responsables. Una ciudad que delega en un sistema estadístico la decisión sobre qué cuenta como relevante en una escena urbana ambigua no ha ganado eficiencia: ha cedido la operación T6, que es la operación soberana por excelencia.

Esta soberanía tiene una dimensión cosmotécnica en el sentido de Hui. Mantener el juicio humano como horizonte no es nostalgia antitecnológica; es la condición para que existan muchas maneras de habitar la relación entre técnica y mundo, en lugar de una sola optimización universal impuesta por la monocultura del cómputo (Hui, 2020). La supervisión, así entendida, es el lugar donde la tecnodiversidad se vuelve práctica: cada acto de decidir qué se computa y qué no, con arreglo a qué fines y a qué forma de vida urbana, es un acto de afirmación de un cosmos particular frente a su disolución en datos sin resto. Wiener ya advertía, en términos cibernéticos, que el uso humano de los seres humanos se degrada cuando se trata a las personas como engranajes intercambiables de un sistema de control, y que el valor de la máquina depende enteramente de los fines humanos a los que sirve (Wiener, 1950). La supervisión es la traducción contemporánea de esa advertencia: no se trata de rechazar la herramienta, sino de no confundir su potencia con autoridad.

De aquí se sigue la implicación práctica que enlaza esta nota con la conclusión. La aplicación responsable del conocimiento urbano —hacer presentable, usable y aplicable el saber clásico ya existente, que es la tarea pendiente que la tesis defiende— exige instituciones, protocolos y hábitos de supervisión que no son automatizables, porque automatizarlos sería delegar precisamente la operación que no se delega. El Banco Epistémico Urbano del capítulo «09» es la propuesta técnica; la supervisión humana documentada es su condición de legitimidad. La presente tesis, construida orquestando modelos de lenguaje bajo un juicio que no se cedió, queda así como ilustración performativa de su propio argumento —en el sentido que la sección 10.4 fijó: ilustra, no demuestra—: la herramienta fue grande, el salto no ocurrió, y lo decisivo siguió siendo quién decide. El capítulo siguiente, «11. Conclusiones: aplicar antes que escalar, fragmentar antes que optimizar», recoge esta lección y la generaliza en una orientación normativa para la urbanidad computada.

Referencias

Dreyfus, H. L. (1992). What Computers Still Can't Do: A Critique of Artificial Reason. Cambridge, MA: MIT Press.
Hui, Y. (2020). Fragmentar el futuro. Ensayos sobre tecnodiversidad. Buenos Aires: Caja Negra.
Wiener, N. (1950). The Human Use of Human Beings: Cybernetics and Society. Boston: Houghton Mifflin.