¿Por qué no podemos predecir las elecciones?
02 November 2013

Todos nosotros tenemos una batería de buenos argumentos para justificar que “¿Quién ganará las próximas elecciones?” no es una pregunta que pueda usarse para determinar la validez general de la investigación politológica. Y, sin embargo, debemos reconocer que es una pregunta legítima. Las elecciones y la violencia son los eventos políticos de mayor magnitud y no nos falta investigación sobre los determinantes del comportamiento de cada uno de los agentes políticos que pueden estar involucrados en ellos. Entonces, ¿por qué su predicción se nos resiste?

Es casi un truismo que algunos eventos de gran magnitud son demasiado complejos. Escoger un ganador para las siguientes legislativas es un ejercicio futil cuando, por ejemplo, ni siquiera sabemos en qué momento se van a celebrar. Además, en la medida en que hay factores contextuales que no podemos adelantar y que afectan sistemáticamente a la decisión individual de voto, la posibilidad de hacer predicciones fiables se desmorona, independiente de la sofisticación de nuestras teorías. Nadie puede sostener nuestra incapacidad en ese sentido como argumento contra la disciplina: si no podemos predecir las elecciones es porque, sencillamente, hay demasiadas piezas en movimiento.

Ahora bien, lo más llamativo es que ni siquiera tenemos herramientas para sortear problemas mucho más modestos. Dado el bagaje en estudios de comportamiento electoral, construir un modelo de predicción individual del voto debería ser un ejercicio sencillo. Pero creo que es justo decir que ninguno de nosotros podría preparar un modelo con datos de encuesta que supere una validación cruzada con un mínimo éxito. Debemos reconocer que los modelos de comportamiento electoral de los que disponemos no son en absoluto adecuados para la tarea. Ahora bien, si dada una muestra aleatoria de individuos no somos capaces de asignar con cierta precisión un voto esperado para una muestra de retención (holdout sample), es razonable que se cuestione estado del conocimiento acumulado en el campo.

Es tentador responder a la agresión anterior descartando la premisa fundamental, negando la necesidad de la predicción en la disciplina. Sin embargo, sospecho que ese argumento requiere forzar una separación excesiva entre causalidad y predicción. Por supuesto, se trata de objetos teóricos distintos, pero no podemos trabajar sobre la base de que son ortogonales.

No pretendo cuestionar la validez de la investigación estándar. Mi argumento apunta a una meta mucho más modesta. Abogo porque tengamos la predicción presente no solo como objetivo final del proyecto intelectual de nuestro campo de investigación, sino incluso en la presentación de los resultados de cada uno de nuestros papers. Creo que debería ser un estándar en las publicaciones (exigible en el caso de trabajos no-experimentales) plantear y comprobar las hipótesis en términos de su valor predictivo out-of-sample. Quizás ese sea el único modo de atajar el overfitting rampante en la disciplina.