Lo que las encuestas dicen y lo que no dicen

Alberto Penadés

Lo primero, el dato: de acuerdo con el conjunto de las encuestas que se han publicado hasta ayer –unas 150- en los principales periódicos durante toda esta legislatura, además del CIS, un resultado probable es que el PP gane las elecciones con  el 46,5% del voto válido y que el PSOE las pierda con el 30,2%. Esa es la media a la que apuntan las predicciones (condicionada por su tendencia de cambio mensual; no dispongo de todos los datos semanales).  Un resultado que es muy cercano  al predicho por la encuesta pre-electoral del CIS (46,6% y 29,91%). Lo nunca visto. Es importante darse cuenta de que lo insólito es siempre un reto para los sondeos. La mayoría absoluta del PP en el año 2000 no se anticipó correctamente en las encuestas publicadas, y el CIS estimó entonces que la ventaja sería de cuatro puntos (fueron algo más de diez).

¿Dicen todas lo mismo? Hay un par de cosas más o menos evidentes (o que pueden verse con números sencillos). La primera es  que hay más variación en las predicciones para el PSOE que para el PP, especialmente después de las elecciones de mayo. Lo insólito es sobre todo el descenso del PSOE, y eso parece que tiene a los institutos algo desconcertados. La segunda es que, si bien casi todas las encuestas dicen “lo mismo”, hablan con acento personal.  Sobre todo por lo que se refiere al PP:  Sigma-Dos (El Mundo), DYM (ABC) y NC-Report (La Razón) tienden a estimar valores más altos y un crecimiento más pronunciado, mientras que el CIS y el Obradoiro de Socioloxia  (Público) y, en menor medida , Metroscopia (El País) tienden a dar valores algo más bajos y un crecimiento menos rápido. Las encuestas de los dos diarios de Barcelona recogidas aquí (elaboradas por Noxa y Gesop para La Vanguardia y El Periódico) suelen aproximarse a la tendencia media.

¿Hay diferencia entre datos crudos y publicados? Naturalmente, pero ninguna encuesta en España explica cómo llega a su resultado predicho: lo que se llama, a veces, la “cocina”.  Eso ni siquiera es tan grave, pese al humo que levanta; lo malo es que en la inmensa mayoría de los casos no se informa sobre el resultado “crudo”: qué es lo que de hecho responden las personas de la muestra cuando se les pregunta su intención de voto. Es decir, la mayoría de los medios no solo no dan la receta sino que ni siquiera dan los ingredientes. Es como comprar un envase de bebida naranja que dice “hecho a partir de naranja”, pero sin saber cuánta, si pulpa o cáscara, ni qué otras cosas lleva.

El CIS sí publica los resultados no tratados, gracias a lo cual podemos saber que practica una cocina bastante natural, al menos últimamente: la correlación entre el voto como resultado directo de la encuesta y la estimación publicada por el CIS es, en esta legislatura, del 93% para el PP y del 94% para el PSOE. La estimación va contando, en esencia, la misma historia que cuentan los ciudadanos que responden a las preguntas. En el periodo 1996-2004 la correlación entre respuestas a la encuesta y predicciones del CIS fue del 89% para el PP y del 75% para el PSOE.  Aun sin conocer las recetas, si solo lleva un 75% de ingredientes naturales y no se sabe si el resto es agua…

¿De qué depende la cocina? Dejando aparte el toque personal, puede decirse que hay al menos tres grandes cuestiones que un encuestador tiene que resolver para poder publicar una estimación. La primera es la “representatividad” de los datos de la muestra de acuerdo con características conocidas de la población, incluyendo el comportamiento electoral en el pasado (el recuerdo de voto). Si, como suele suceder en España y en casi todos los países occidentales, las respuestas de la muestra están sesgadas hacia el gobierno y/o hacia la izquierda, esto puede corregirse con ponderaciones. La segunda es la probabilidad real de que vote quienes dicen que van a hacerlo. En casi todas las encuestas, casi todo el mundo dice que piensa votar (el resultado puede ser de más del 90%), seguramente porque votar se considera moralmente obligatorio. Sabemos que muchas de esas personas, tal vez tantas como un 20%, en realidad se abstienen. Esto puede corregirse para tener en cuenta, sobre todo, las respuestas “creíbles”.  En tercer lugar hay mucha gente que no quiere o no sabe decir a quién piensa votar  (los “indecisos”), por lo que es necesario suponer qué harán.  A pesar de algunas apariencias, lo tercero suele ser lo menos complicado, salvo en elecciones en las que haya mucho cambio durante la campaña electoral.

La escasa información que se recoge en lo que se denomina “ficha técnica” sirve para hacerse una idea del tipo de encuesta que se nos ofrece, pero nada más. Para explicar más cosas, los institutos pueden producir informes y la prensa remitir a ellos (ya hay algunos casos).

¿Se puede ser más transparente? Se debe. En Gran Bretaña  y en Estados Unidos los institutos están obligados, por un acuerdo profesional suscrito por todos ellos, a explicar cómo resuelven los tres problemas anteriores, es decir, a explicar, al menos a grandes rasgos, su “cocina”. En Estados Unidos, además, los principales institutos depositan las matrices de datos en el Roper Center para que puedan ser reanalizados. Cualquiera puede obtenerlos, pagando algo, y sacar sus propias conclusiones, aunque sea a tiro pasado. En Europa continental la situación es menos brillante. Las excepciones más celebradas por los estudiosos son las encuestas públicas del CIS y las encuestas del segundo canal de la televisión alemana (el Politbarometer), cuyos datos se depositan en repositorios públicos con toda la documentación técnica. Sin embargo, no se explican los detalles de la estimación, cosa que al menos al CIS le costaría poco hacer, siquiera en trazo grueso.

¿Qué encuestas son mejores? En una palabra, como es lógico, las que cuestan más dinero. No es que haya que exagerar, el presupuesto del INE sería absurdo, por lo excesivo, para estudiar la opinión ciudadana -algo para lo que incrementar la precisión pierde valor muy rápidamente- pero tampoco cabe duda de que el presupuesto de las encuestas públicas del CIS da para más que el de las encuestas habituales de los institutos privados. En todo caso, para saberlo con certeza habría que poder compararlas. Sabemos, por ejemplo, que las encuestas del CIS suelen sobre-representar a la izquierda, o que a veces contienen más parados de los que sería perfectamente representativo. Lo sabemos porque los datos son de dominio público, pero no sabemos cuál es la situación de otras encuestas. Todo indica que tendrán iguales o mayores problemas, pero están velados.

El CIS puede ser el único instituto del mundo que ha empezado a difundir la matriz de datos de una encuesta electoral antes del día de las elecciones. Si repiten la hazaña esta semana, y cruzo los dedos, cualquier persona con un poco de formación en el tema puede hacer su propia predicción y difundirla, qué se yo, en Twitter.  Anímense.