¿Qué son los filtros bayesianos?
Este tipo de estadísticas se utiliza en múltiples campos, tradicionalmente donde más se ha utilizado ha sido en estudios epidemiológicos, como modo de diagnosticar enfermedades de acuerdo con los síntomas observados y el historial del enfermo. Un cuadro clínico de síntomas, como el resultado de un análisis de sangre, la temperatura, vómitos etc., permite diagnosticar varias enfermedades como posibles.
Pero, si una enfermedad es hereditaria y otra es tropical, aunque el cuadro clínico responda a otras enfermedades, si el paciente tiene antecedentes familiares de la primera, o ha vuelto recientemente de un viaje a país tropical, el médico se decidirá por diagnosticar la enfermedad que corresponda en cada caso, aunque la pura probabilidad señale a una tercera enfermedad como la más probable.
Modelos matemáticos capaces de aprender
Cuando pretendemos utilizar un modelo matemático que de respuesta a problemas de este tipo, donde junto a datos mensurables y concretos hay se añade la experiencia adquirida, el método más eficaz es la estadística bayesiana. En resumen, un filtro bayesiano es una herramienta matemática que permite, retroalimentar la fórmula que calcula la probabilidad de un acontecimiento, con la experiencia adquirida anteriormente en casos similares, de modo que la formula "aprende" y cada vez da respuestas que en principio acierten con más probabilidad que en el pasado, pues el peso de cada una de las antiguas creencias, (o síntomas), aumenta o disminuye de acuerdo con la experiencia adquirida.
Un filtro bayesiano nunca es categórico, es decir, nunca garantiza al 100% la calidad de la respuesta, pero al incorporar la experiencia anterior, permite mejorar cada vez más la probabilidad de acertar en la respuesta. Es por ello que este tipo de estadísticas es especialmente adecuado en los casos en que solicita un pronóstico sobre la posibilidad que ocurra determinado suceso.
Usos de la estadística Bayesiana
La estadística de Bayes, resulta de particular utilidad, cuando se valora, junto a datos objetivos, la convicción personal sobre la posibilidad que ocurra o no un suceso. Por ejemplo, sería el sistema adecuado para pronosticar resultados de las quinielas a partir de aseveraciones del tipo es muy probable que el equipo X gane al Z, tal árbitro es casero, o la lluvia perjudica al equipo A, es decir obtener una valoración subjetiva de la probabilidad, a diferencia de la respuesta dada por una estadística puramente frecuentista, que solo devuelve conclusiones dicotómicas, correcto o falso.
En el mundo informático la estadística bayesiana se utiliza en multitud de campos; en la limpieza de ruidos en todo tipo de señales analógicas, en la elección del camino a seguir en internet por los paquetes de información, en la ponderación que hacen los buscadores de las páginas web, para reconstruir imágenes digitales a partir ficheros comprimidos con pérdida, en traducciones automáticas, etc. Su uso es amplísimo y todos los días se encuentran nuevas utilidades en campos relacionados de alguna manera con la inteligencia artificial, dada la posibilidad de crear procesos basados en esta estadística, con capacidad para aprender.
Riesgos de esta estadística
No obstante, la estadística bayesiana, incorporar inevitablemente la opinión personal del investigador, lo que puede producir, desde sesgos inadvertidos en el resultado, a resultados matemáticos que han sido manipulados de forma voluntaria en una dirección preestablecida. Este error no depende tanto del método empleado como de la ecuanimidad del investigador. Ello es claramente notorio en las encuestas de opinión, donde las respuestas obtenidas, suelen estar claramente condicionadas por la ideología de quien encarga la encuesta.
En cualquier caso, un filtro bayesiano, por su propia esencia, no puede dar resultados concluyentes, por lo que da siempre lugar a la aparición de falsos positivos y falsos negativo, o sea, hay casos en los que el filtro de Bayes fracasa, bien por marcar como correctos casos erróneos o por lo contrario. No obstante el hecho de incorporar la experiencia al resultado, consigue reducir el coeficiente de error con el paso del tiempo.