La estadística bayesiana y el aprendizaje automatizado (II)
Vinicio Barrientos Carles | Para no extinguirnos / AUTÓMATOS
Somos lo que hacemos repetidamente. La excelencia, entonces, no es un acto; es un hábito.
Aristóteles
En la primera parte de este artículo, establecimos un vínculo entre el aprendizaje automatizado por parte de los autómatas más complejos y mejor desarrollados, y uno de los dos enfoques estadísticos más importantes, el enfoque bayesiano, el cual ha adquirido gran importancia en la actualidad, cabalmente por su inmersión en las ciencias computacionales, a través del denominado machine learning. Nos concentraremos ahora en un primer punto: las nociones fundamentales sobre cómo opera el enfoque estadístico bayesiano y su relación con el conocimiento cierto (científico). Ameritará que en una futura oportunidad podamos ampliar las diferencias y alcances en los distintos conceptos de «aprendizaje», realizando unas pinceladas críticas sobre los peligros que se tienen al respecto de un posible abuso de estas novedosas herramientas tecnológicas. Ambos aspectos resultaran relevantes para cualquier masificación al respecto del ML dentro del marco expansivo del nuevo paradigma de la inteligencia artificial –IA–.
Conviene clarificar primero que el desarrollo inicial de la IA estuvo basado en un paradigma de programación de tipo determinista, es decir, aquella que se realiza a través de una serie de instrucciones de control, de tipo condicional, las cuales representaban el conocimiento de los expertos en una determinada materia. Los nexos lógicos y la estructura de las decisiones estaban definidos desde un inicio en el programa, operando por medio de la recurrencia característica de la computación, lo que como particular implicaba que cualquier elemento no considerado por los humanos programadores se traduciría en procesamientos deficientes o errores en la corrida de los programas. Ante la presencia de escenarios complejos, como sucede con los ambientes humanos en general (piénsese en la conducción de un automóvil yendo al trabajo), es claro que el enfoque anterior puede resultar marcadamente limitado ante la presencia de obstáculos imposibles de predeterminar. Por ello, escribir un algoritmo que incluya una inmensa cantidad de posibilidades y variables intervinientes podría fácilmente derivar en una forma inviable, y hasta imposible, de operar con efectividad, y más aún cuando el autómata (o programa algorítmico) deba intercambiar acciones con otros seres inteligentes y autónomos.
Por lo anterior, el modelaje de escenarios complejos de nuestro «mundo real» exigió ir más allá de los lenguajes formales construidos a partir de un elemental «if, then, else». Así surgió un área de la IA enfocada en el desarrollo de sistemas que pueden aprender y autodesarrollarse a partir de unos procesos iniciales básicos. El machine learning, en lugar de indicar explícitamente cómo resolver un problema, creará soluciones temporales (parciales), de manera que pueda ir generando mejores soluciones por medio de los ejemplos (casos) con los que va interactuando, tomando decisiones mediante predicciones basadas en el uso de métodos de inferencia lógica y del enfoque estadístico bayesiano. La estadística bayesiana es de naturaleza intrínsecamente inductiva, empirista, pues parte de los casos y ejemplares conocidos, para realizar predicciones sobre lo desconocido, lo cual resulta muy apropiado en las ciencias sociales o en la vida cotidiana. A diferencia del enfoque bayesiano, la estadística frecuentista se basa en el concepto de distribución de frecuencia, el cual tiene severos problemas para ser aplicados en la práctica bajo escenarios de ignorancia profunda. La regla de inferencia básica en el enfoque bayesiano es el teorema de Bayes, y para ilustrar su uso regresamos al ejemplo presentado previamente.
En la imagen precedente se observa una tabla de contingencia para dos variables (sexo y fumador), referida a 300 personas tomadas como muestra de una determinada población. En desconocimiento completo, el computador podría estimar que la probabilidad de ser un fumador (en la población) es del 50 %. Por otro lado, si se conocen las frecuencias marginales de ser fumador, las estimaciones de ser un fumador poblacional mejoran, es decir, el conocimiento mejora, porque ahora la probabilidad estimada será de 56.7 %. Al tener conocimiento adicional sobre cómo se distribuye el sexo en el grupo de fumadores y no fumadores podremos estimar aún mejor la probabilidad de ser una persona fumadora, pues ahora se discrimina respecto al sexo. Es decir, la probabilidad de ser fumador será de 41.7 %, si se sabe que la persona es mujer, y de un valor distinto si es hombre. En este segundo cálculo se ha usado la regla de Bayes (como se ilustra en la imagen), lo cual permite una inferencia «posterior a la evidencia», por lo que se denomina estimación a posteriori, diferencia del conocimiento previo, a priori.
Existe un detalle que por lo general pasa desapercibido. En el modelo inferencial bayesiano, existe una partición del universo (y en la muestra) de acuerdo a una variable de la cual se supone algún conocimiento, que en nuestro ejemplo es el sexo. Por otro lado, de la otra variable se desea realizar una predicción: ¿es fumador o no? En cierta forma, realizaremos una estimación de lo desconocido con base en lo que ya conocemos, o conocemos parcialmente. La variable predictora, o estimador, contiene los indicadores o las evidencias con las que se cuenta, para estimar el estimando o variable objetivo. Obsérvese que el sexo es fácilmente observable, o al menos resulta más evidente de la variable fumador (en condiciones «normales», porque si la persona está fumando, ambas variables sería estimadoras, constitutivas de evidencia). Conviene pensar en un escenario mucho más realista.
Cuando buscamos la ayuda de un profesional de la Medicina, lo hacemos porque percibimos algunos síntomas de una posible enfermedad, sin saber de qué se trata. Lo hacemos porque el experto (el médico) «nos dirá qué tenemos». Se trata de un sistema experto, una modalidad de ML. El médico se ha preparado durante años, «ha aprendido» de Medicina y de otras áreas del conocimiento científico. En la imagen que sigue se muestra el esquema de decisión estándar, que opera con base en unos parámetros conocidos (como los niveles de error aceptable, la sensibilidad o la especificidad de la prueba), y en función de los cuales un sistema experto puede proceder a la toma de decisiones, usando una determinada prueba clínica. Como ejemplo de la lectura, véase que si en una muestra, con la cual el sistema aprende, se tiene que la prueba sale positiva para un 80 % de los enfermos, se podrá utilizar esta información (y la otra incluida en la red bayesiana «de conocimiento») para estimar que la probabilidad de que alguien esté enfermo si la prueba sale positiva es del 96.4 %. Nótese que será posible concluir sobre la enfermedad, que no es visible (o evidente), a partir de la evidencia (o indicador–estimador) disponible, que en este ejemplo es la prueba clínica P.
Las ventajas de gran rapidez de cómputo y elevada capacidad de almacenamiento por parte de los ordenadores electrónicos, hacen que los procesos automatizados de aprendizaje resulten increíblemente efectivos, los cuales son ya usados día a día en múltiples situaciones, como en el reconocimiento facial, de huella digital y otros simuladores de percepción. Un ejemplo notable es el de la clasificación taxonómica actual, la cual se está viendo revolucionada por el uso sistemático de árboles filogenéticos computacionales que ciertamente operan como acá se ha indicado, usando el principio de máxima parsimonia que en la reconstrucción cladística tiene como objetivo la búsqueda e identificación de un posible árbol filogenético que requiera el menor número de eventos evolutivos, bajo los principios de máxima verosimilitud.
Imagen principal tomada de Planeta ChatBOT, editada por Vinicio Barrientos Carles.
Vinicio Barrientos Carles
Guatemalteco de corazón, científico de profesión, humanista de vocación, navegante multirrumbos… viajero del espacio interior. Apasionado por los problemas de la educación y los retos que la juventud del siglo XXI deberá confrontar. Defensor inalienable de la paz y del desarrollo de los Pueblos. Amante de la Matemática.
Correo: [email protected]