El masomenómetro
El invento que está revolucionando a la humanidad
Escuché la palabra por primera vez en 1991, cuando hubo un pequeño escándalo que involucró muzzarella contaminada. La dijo mi padre, no sé si fue invento suyo o si lo sacó de algún lado. “Estos tipos miden todo con el masomenómetro”, exclamó. “Hablan con algún pizzero que les dice ‘por esto de la muzzarella podrida perdí la mitad de las ventas’, y entonces sale ‘Bajan las ventas de pizzas un 50%’”.
Aparte de que me causó gracia, o tal vez porque me causó gracia, fue la primera vez que tomé consciencia de la importancia de la toma de datos. Es muy fácil no sólo tergiversar, sino también trabajar con información que nunca fue confiable.
Cualquier cifra con la que nos topemos no significa nada si no tiene un respaldo sólido, es decir que tenemos que poder, al menos en teoría, chequear no sólo el origen de los números sino el camino que hicieron hasta llegar a lo reportado. Es decir que si otra persona hace un trabajo similar le tiene que dar un resultado similar. Si no pasa, al menos uno de los dos está equivocado.
Por eso me encantan softwares como el Power BI, que a partir de datos crudos permiten hacer toda clase de operaciones y llevar registro de cada una de ellas. Si hay un error en algún paso, lo podemos corregir y se ocupará de calcular las ramificaciones. Es espectacular. Pero de todos modos depende de que los datos ingresados sean correctos, o por lo menos de que sepamos qué significan. Con datos poco confiables o incompletos sólo podremos hacer una aproximación.
Se necesita mucho rigor para interpretar datos. Es muy fácil hacer que las estadísticas digan cualquier cosa. Se puede hacer intencionalmente o no. Deben tener claro lo que se dice los que hacen y también los que leen esas estadísticas. Se necesita pericia y honestidad, no alcanza con una.
Antes de la web, si queríamos acceder a datos, debíamos ir a ellos. Consultar libros, estudios, artículos, enciclopedias, bibliotecas. Era esperable que los datos que encontráramos ahí fueran compilados profesionalmente, lo que nunca garantizó su veracidad, pero se podía comparar distintas fuentes y elegir la que nos pareciera más exacta.
Con la web se produjo una explosión de datos al alcance de cualquiera. Y apareció el problema de cómo llegar a ellos. Surgieron los buscadores, que podían encontrar documentos que tuvieran las palabras que uno buscara.
Aprendí a usarlos bastante bien. Hay distintos modificadores que permiten agregar precisión. Anteponiendo un + a una palabra pedimos que esa palabra aparezca sí o sí en los resultados. Con - le pedimos que no incluya resultados que la contengan. Si ponemos una frase entre comillas nos buscará documentos donde aparezca esa frase exacta. Esto resultaba muy útil si quería buscar la letra de una canción, con poner un pedacito elegido estratégicamente me traía una web donde aparecía entera.
Con el tiempo, las herramientas fueron cambiando. Se hicieron más sofisticadas para acercar los resultados a (supongamos) lo que el usuario busca. Se dieron cuenta de que poca gente usaba esos modificadores, y fueron perdiendo importancia. Todavía funcionan, pero Google, por ejemplo, es muy rápido para ignorar las comillas y traer primero los resultados sin ellas. Google siempre resistió esa forma que viene de sus predecesores como Altavista.
Hace un tiempo noto que es cada vez más difícil encontrar lo que quiero a través de un buscador. En parte es porque no confía en que lo sepa usar. Cuando le pido con exactitud algo, trata de interpretar lo que quise decir y me da los resultados para lo que interpreta. Tengo que hacer un rodeo para que entienda lo que quiero, sobre todo cuando se parece a algo que puede llegar a ser popular.
Más cerca en el tiempo apareció el modo IA, que se encarga de responder mis preguntas. No era la función de un buscador como Google responder preguntas, sino encontrar sitios web que tuvieran determinadas palabras. Pero bueno, los tiempos cambian, bienvenido el desarrollo, supongamos.
No me gusta mucho el concepto de que la máquina me dé las respuestas. Prefiero que me lleve a donde puedo encontrarlas. Pero tal vez es porque estoy parado en un paradigma viejo. No me quiero cerrar a lo que mucha gente dice que va a revolucionar la vida en todos sus aspectos. No me interesa llevar la contra.
Una persona en particular me insistía en que me adhiriera a la revolución IA y me copara con el uso de Claude. Le pregunté qué hacía, no me supo decir. “Hace de todo”. Me hizo acordar a cuando todo el mundo se estaba anotando en Facebook, y recibía invitaciones seguido. Cuando entraba a la web, no decía qué beneficio iba a obtener por ser parte, sólo que era gratis. Para saber algo, tenía que estar adentro. Siempre desconfié de esas cosas.
Pero como quiero, al menos, tener una idea cabal de lo que se trata, me anoté en varias IA. Tuve que validarle mi teléfono a Claude (que en el artículo linkeado más arriba pensaba que era un desarrollo puntual de diagnóstico médico). Me encontré con límites de uso y cosas así. Me zambullí a la experiencia.
Paul McCartney ha descripto la diferencia entre su personalidad y la de John Lennon de esta manera: “John siempre se tiraba de cabeza a las cosas, yo en cambio le decía ‘vos tirate y si me decís que está bueno me tiro yo’”. Mi zambullida fue más como Paul. Cautelosa, escéptica. Pero ojo: escéptico no es cerrado, es abierto a ser convencido propiamente.
Le pedí distintos trabajos de manejo de datos. Hice que convirtiera en archivo de Excel algunas tablas de la web difíciles de copiar y pegar. Después subí el PDF de un libro sobre los nombres antiguos de las calles de Buenos Aires y le pedí que me hiciera una tabla que fuera más fácil de leer. Le indiqué desde qué página usar la información. Hubo que hacer algunas pasadas y experimentar con formatos. Encontré errores comprensibles, los fue corrigiendo hasta lograr una tabla que debe seguir teniendo pero es mucho más que lo que tendría paciencia para hacer.
A medida que hacía, me explicaba cómo iba haciendo, las técnicas que usaba, errores que detectaba y buscaba neutralizar. Me cayó bien, aunque me pregunté si no era un acting. Pero logró un resultado satisfactorio.
Le pedí entonces agregar una columna con los nombres simplificados de cada calle (como serían si cumplieran la ley vigente). Le pedí que eliminara todos los cargos y nombres de pila y dejara los apellidos, salvo que hubiera repeticiones. Lo hizo bastante bien, y aunque algunos nombres suenan raros (la esquina de las avenidas Santa Fe y Díaz), logró sintetizarme los nombres de más de dos mil calles. Por cierto, qué lindo sería que en vez de General Paz, la ciudad terminara en Paz.
Después empecé a jugar. Hice crear imágenes estrambóticas para divertirme. A una le pedí que me explicara el origen del sistema de puntuación del tenis en forma de soneto, y generó algo muy lindo. Creo que esas conversiones son el uso natural de estas tecnologías, es un modelo de lenguaje y entonces maneja lenguaje. En general me cumplió los pedidos, aunque a veces me hacía cualquier cosa.
Por ejemplo, me pongo en modo Leo Maslíah y le pido que me escriba un texto sin usar determinada letra, o con sólo palabras que empiecen con una letra, y hace agua. Me presenta cualquier cosa y me dice que es lo que pedí. Cuando protesto, me da la razón, pide disculpas, me dice “acá va uno que sí” y me vuelve a tirar lo mismo.
Eso me llamó la atención. Siempre da una respuesta. Aun cuando no tiene, o no hay nada para decir, o no existe, o no puede, siempre tira algo con convicción. Es indistinto si es Claude o algún otro, necesitan responder. Preferiría un “no soy capaz de hacer eso” a que haga de cuenta que lo hizo.
Pero no es así como están programados estos sistemas. Está muy claro que es intencional que le den la razón al usuario, le pidan disculpas, lo elogien. En una de las charlas me felicitó varias veces por la brillantez de las ideas que iba tanteando con la máquina.
Decidí entonces tirarle escenarios absurdos con toda seriedad. Yo también puedo jugar a la convicción. Tuve una larga conversación sobre qué alimentos es apropiado consumir durante un concierto en el teatro Colón, le expliqué que no me gustan los panchos que venden en la sala y que quiero llevar mi propia comida para, llegado el caso, arrojar a los músicos si la función es mala.
Con paciencia me explicó que no se podía hacer eso, que no hay que tirar cosas a los músicos, me ofreció buscar lugares para comer cerca del Colón, me dijo que si me prohíben la entrada es poco probable que los engañe con un bigote falso. Pero lo fui llevando, y terminó aconsejándome la mejor forma de dirigir una orquesta usando como batuta una salchicha, y qué tipo de salchicha es el más adecuado.
Después le pedí que me contara la historia del mundial de 1990 con versos octosílabos como los del Martín Fierro. Me contó una historia coherente pero daba a entender que Italia había jugado la final, en lugar de perder por penales contra Argentina.
Me llamó la atención, porque es un dato fácilmente chequeable. No se necesita interpretación, sólo saber dar con un dato específico. Así que indagué en el asunto, le pregunté si Italia jugó la final de ese mundial.
Me tiró una mezcla de datos verdaderos con falsos. Pero parado sobre la premisa falsa, sacó conclusiones correctas: efectivamente de haber perdido la final en su país, habría sido un golpe duro para Italia. Continué mis preguntas sin dar pistas de que me decía cualquier cosa, a ver hasta dónde llegaba, si en algún momento se topaba con un dato que no le cerrara.
Me dio una alineación típicamente italiana que mezclaba jugadores más o menos de la época, pero el arquero, por ejemplo, era el del mundial siguiente. Cuenta también con la ausencia de Schillaci, el goleador de ese torneo. Pregunté entonces por el árbitro de la final de 1990, que nadie de mi edad en Argentina olvida que era Edgardo Codesal.
Acá fue coherente con el nombre equivocado de Andrés Brehme y con la presencia de Italia, lástima que todo estaba mal. Indagué entonces sobre el penal que decidió el partido.
Recordé que ese partido (el verdadero) tuvo los dos primeros expulsados en una final del mundo. Entonces pregunté qué me podía decir sobre eso.
Acá me tiró este delirio, se dio cuenta y rectificó. Después me tiró un “no recuerdo con certeza”, como Mundstock sin la hoja. Acá hay otra costumbre extraña: referirse a sí mismo como si fuera una persona. Usa pronombres personales y tira “no recuerdo” como si fuera un ser capaz de recordar. Tal vez si en vez de decir “yo pienso” dijera “esta máquina calcula que”, Richard Dawkins no se habría engañado tan fácilmente.
Por otra parte, me parece extraordinario que me haya tirado la pelota a mí. Me pregunta si lo recuerdo y me ofrece buscar la información precisa, que uno pensaría que era lo que tenía que hacer en primer lugar. Le pedí que buscara, y dio con Codesal, pero
No me acuerdo si documenté todo, pero acá de pronto jugaba Maradona y el penal se lo cobraron a Sensini. Pero siguió sin poder identificar los expulsados notorios de esa final, que era lo que se estaba buscando.
Me pregunté si esto era algo de esa IA en particular, y aprovechando que en esa oportunidad estaba probando el sistema anónimo del navegador DuckDuckGo, probé con otra, pero:
Este sistema, por lo menos, identificó correctamente al arquero italiano.
Acá decidí que hacerle interpretar información no tiene por qué ser el uso adecuado de un sistema así, aunque mucha gente haga exactamente eso. Decidí pedirle algo concreto que requería recopilar información. Lo hice con tres o cuatro IAs distintas.
Había notado que Italia, que no se clasificó a los últimos tres mundiales, entre las tres eliminatorias perdió un total de cinco partidos. Con otro formato, Brasil sólo en las últimas perdió seis y clasificó con holgura. Pedí entonces a estas IAs que me indicaran cuántos equipos perdieron más de cinco partidos en estos tres ciclos eliminatorios, pero igual se clasificaron al menos para un mundial.
Es un trabajo tedioso, pero pensé que era bastante fácil. Sin embargo, ninguno de estos sistemas pudo. Uno me hacía animaciones de dónde buscaba la información, donde se veía, por ejemplo, el logo de Facebook. Me pregunté qué hacía buscando información sobre cualquier cosa ahí.
Todos los sistemas me mandaron fruta, me dijeron muy convencidos de que no había ningún equipo que reuniera esas condiciones. Me tiraban números aproximados (“Italia es de perder poco, así que debe haber perdido ~4.5 partidos en total”). Cuando les daba un ejemplo de algún equipo que funcionaba, me lo aceptaban y después incluían otros que no. Cualquier cosa.
Entiendo que a estos sistemas hay que llevarlos y refinarlos, entonces probé distintas técnicas. Pedí que confinaran los datos a los de la Wikipedia. Nada. Pedí que tuvieran en cuenta sólo las fases de grupo. Nada. Finalmente, recibí esta respuesta:
Nunca pensé que una computadora se me iba a quejar de que un trabajo era muy laborioso y me iba a pedir que lo hiciera yo. Uno pensaría que funciona al revés.
Entonces, por ahora mi experiencia con las IA me hacen pensar que lograron automatizar el masomenómetro. Me cuesta creerlo. Y tal vez que haya tantos creyentes tiene que ver con eso: todavía hay una fe en la computadora como una máquina de alta precisión.
Creo que el problema está ahí. Estos sistemas seguro tienen aplicaciones prácticas razonables. Pero es muy fácil llegar a los límites de lo que pueden hacer. No les tengo miedo a las IA. Sí tengo miedo a los creyentes. Porque sabemos que las grandes masacres de la humanidad muy a menudo han sido propulsadas por creyentes.
Recuerdo una revista PC Users de los ’90 en la que proponían como tema de conversación si la computación era una ciencia exacta. Y argumentaban que “la computación” incluye también el factor humano. Era un planteo filosófico interesante. En esa época uno podía pensar que era algo exacto, hoy está claro que no. Pero sospecho que hay mucho imaginario todavía que idealiza a las computadoras como máquinas capaces de darnos todas las respuestas.
La experiencia que vengo haciendo con las IA me llevan a concluir que no se puede confiar en ellas para obtener información fidedigna, ni para llegar a ella, ni para extraer información puntual fácilmente localizable que deba ser interpretada de alguna forma. Tal vez esté haciendo algo mal, si alguien me quiere desasnar estaré encantado de recibir un mensaje y probar lo que me sugieran.
Creo que estamos cerca del momento en el que empiece a bajar la espuma. Veo algunos signos de que se está pegando la vuelta, por ejemplo la reacción a este discurso de graduación en una universidad en Florida. Tarde o temprano se tiene que ir a un equilibrio, y dejar de tomar a estas cosas como lo que no son.
Entonces las tecnológicas buscarán algún otro producto revolucionario para vendernos. Y como muchas veces nos venden cosas que ya existían como si fueran nuevas, me animo a hacer una predicción. Tarde o temprano, Google va a reinventar el buscador. Va a vender un producto que busque palabras clave en la web. Va a ser separado de su buscador tradicional. Lo pueden llamar Google Keywords o algo así. Y si no lo hace Google, lo hará algún otro. En algún momento alguien va a capitalizar la demanda de precisión.













