A 6 meses de la primera vuelta, con voto voluntario y abstenciones mayores al 50% del padrón electoral, es inverosímil que, más allá de la metodología utilizada, una encuesta sea predictiva de la elección, en primera o segunda vuelta. Para más abundamiento, los análisis de los encuestados con mayor probabilidad de voto (“likely voters”) aún son muy recientes y poco conclusivos, haciendo aún más complejo predecir conductas electorales.
Estamos en año electoral y las encuestas son pan caliente para los medios, que las transforman en contenidos de alta significación política, pero en ningún caso definitivas, del escenario electoral final.
No es objetivo de esta columna criticar la manera en que los medios difunden las encuestas de opinión, ni menos defender el negocio en el que estamos. Sí pretendemos aportar distinciones, puntos de vista para la discusión y límites al alcance de los resultados de estas.
Veamos, a 6 meses de la primera vuelta, con voto voluntario y abstenciones mayores al 50% del padrón electoral, es inverosímil que, más allá de la metodología utilizada, una encuesta sea predictiva de la elección, en primera o segunda vuelta. Para más abundamiento, los análisis de los encuestados con mayor probabilidad de voto (“likely voters”) aún son muy recientes y poco conclusivos, haciendo aún más complejo predecir conductas electorales. Dificultad, esta última, que se agudiza por elementos propios del doble estándar de nuestra cultura, que lleva a que un porcentaje amplio y aleatorio de encuestados (20 o más por ciento) señale haber votado en elecciones anteriores sin haberlo hecho, o que la mayoría de los encuestados manifieste una probabilidad de 90% o más de concurrir a las urnas en la próxima elección presidencial.
En fin, cualquiera sea el método para estimar a los likely voters en las encuestas,todos sobrestiman la participación electoral pasada y, muy probablemente, la futura.
Como si fuera poco, una dificultad adicional es la falta de identificación con los partidos políticos y la pérdida de sentido, para la ciudadanía, de clivajes que históricamente apoyaban las predicciones, como el eje izquierda-derecha.
En ese contexto, y antes de entrar en las distintas metodologías de recolección de los datos, si por un momento confiamos en la metodología, la rigurosidad y la independencia de la empresa encuestadora, ¿qué nos están diciendo las encuestas “electorales”? Lo que ellas nos muestran no son más que disposiciones, actitudes y sentimientos ciudadanos respecto de candidatos a Presidente. Tal como si fueran rostros publicitarios o estrellas del deporte, los candidatos logran mayor o menor adhesión en las encuestas en tanto figuras que proyectan ciertos valores, ideales o capacidades particulares –posicionamiento– en la población. Eso y solo eso: percepciones y disposiciones, en ningún caso proyecciones definitivas sobre conducta electoral.
Desde nuestra perspectiva, las dificultades que hoy impone el voto voluntario a las encuestas electorales no invalidan lo que estas van reflejando sobre el contexto, el tiempo y ánimo político del país, pero sí ponen un límite a las conclusiones en términos de proyecciones electorales.
Ahora vamos a los aspectos técnicos de las encuestas; el tamaño importa, pero no tanto. Que una encuesta sea representativa de la población, depende de varios factores, principalmente, el número de casos (la muestra), el procedimiento de selección (cómo se eligen los encuestados) y la calidad del marco muestral (el universo efectivo de posibles encuestados).
Las muestras pueden ser razonablemente representativas a partir de cierto tamaño mínimo (alrededor de 400 casos), sin importar cuán grande sea la población de donde se saca la muestra. No obstante, cuando buscamos conocer el escenario en una elección muy reñida (estilo Lavín-Lagos en 2000 o Trump-Clinton recientemente), la necesidad de precisión puede ser tan grande que solo una muestra gigantesca puede responder a ella.
Por otra parte, una muestra es representativa cuando la distribución de los encuestados en ella es similar a la de las variables en la población estudiada. Si en la población hay 50% de hombres y 50% de mujeres, esperaremos que en una muestra elegida al azar se den proporciones similares.Habitualmente, las encuestas de opinión no buscan solo representar globalmente el universo que estudian, sino que también pretenden conocer los resultados por sexo, edad, nivel socioeconómico y zona. Por esta razón, se recurre a muestras bastante mayores que el tamaño mínimo.
Si bien es improbable que una muestra reproduzca exactamente la distribución poblacional, es bastante probable que no se desvíe demasiado de ella. La estimación del rango de esa desviación es lo que se llama “error muestral”.
Para que podamos estimar el error muestral, deben cumplirse algunas condiciones: la selección debe ser aleatoria (al azar) o sistemática (un intervalo fijo), y todos los casos deben tener la misma probabilidad de selección.
En el caso de las encuestas por intercepción en puntos de afluencia de público (por ejemplo, a la salida del metro), se puede aplicar selección sistemática (entrevistar 1 de cada X personas que pasan por un punto fijo), pero ello no asegura una probabilidad uniforme de selección, porque quienes transitan habitualmente por ese lugar tienen una probabilidad mayor que quienes solo pasan ocasionalmente (y hay quienes nunca pasan por ahí). Por esta razón, las encuestas por intercepción no son probabilísticas, es decir, no puede estimarse su error muestral.
Lo que se busca con la selección aleatoria es sortear a los individuos de la población como si estuvieran en una tómbola; para ello, debemos contar con un registro de lo que vamos a sortear y eso es el marco muestral: los mapas censales de las manzanas del país, el directorio telefónico o el catastro de direcciones de correo electrónico de un determinado grupo. En el caso de los estudios por intercepción en la calle, no hay marco muestral disponible, pues la población no se distribuye de manera geográficamente uniforme. En cambio, tienen la ventaja de acceder de manera inmediata a los encuestados. La encuesta semanal que realiza Cadem utiliza en parte esta metodología, combinándola con encuestas telefónicas.
En el caso de los estudios en hogares, como la encuesta semestral del CEP, la selección de los entrevistados es más compleja. Involucra habitualmente 3 etapas de sorteo tanto aleatorio como sistemático (manzana – hogar – entrevistado) y, por la dificultad de ubicar a los encuestados, requiere un plazo más largo de ejecución, a fin de minimizar la tasa de reemplazo. Estos son los estudios que llamamos “probabilísticos”, en los cuales el error muestral puede estimarse y con bastante precisión, si bien a menudo se omiten otros factores que lo incrementan, como el efecto de estratificar de manera no proporcional.
A pesar de esta ventaja de las encuestas en hogares, hay dificultades prácticas que impiden cumplir con el ideal: la diferente densidad de las manzanas altera la probabilidad de selección de hogares e individuos, así como la inaccesibilidad a departamentos, condominios y barrios exclusivos o peligrosos para la seguridad de los encuestadores; por último, la similitud entre viviendas de una misma manzana (correlación intraclase) agrega otra fuente de error difícil de estimar. Una dificultad adicional de las encuestas en hogares es que el marco muestral de las encuestas en hogares es el censo poblacional, que está desactualizado por el fracaso del Censo 2012.
En estudios telefónicos como la encuesta mensual de GFK Adimark, la selección es más simple, pero el marco muestral suele componerse de números fijos y celulares, lo cual implica que una persona que tenga registrado más de un número, tiene mayor probabilidad de ser encuestada. Adicionalmente, existen otras dificultades, como la baja disposición a responder llamados de teléfonos desconocidos, la restricción de tiempo por cada encuesta y la imposibilidad de usar estímulos visuales (por ejemplo, fotos de figuras públicas). Por lo tanto, esta clase de encuesta no es probabilística y no puede estimarse su error muestral, pero se toma como referencia el que correspondería a la muestra “si fuera probabilística”.
Los estudios web sobre paneles online, como la encuesta mensual de Criteria Research, solo abarcan, en rigor, a la población del panel, que son usuarios de Internet reclutados por la empresa que administra dicho panel. El panel es el marco muestral. A diferencia de las otras encuestas, que solo cuentan con la buena voluntad del entrevistado, estos paneles se reclutan invitando a participar en un sistema de incentivos (loyalty panel). Aun en un país de alta penetración de Internet como Chile, la composición de un panel, por grande que sea, es distinta de la población general: principalmente, más joven y de mayor nivel socioeconómico. En consecuencia, una encuesta sobre ese panel debe corregir ese sesgo estratificando la muestra y aplicando factores de ponderación (las encuestas a segmentos sobrerrepresentados en el panel, deben pesar menos).
Pese a esta corrección, que es la misma que aplican las encuestas por cuotas en hogares y telefónicas, subsisten dos limitaciones para las encuestas sobre panel online. La más obvia es que quienes no son usuarios de Internet, además de tener nula probabilidad de selección en la muestra, suelen poseer características distintas (por ejemplo, estar menos informados), independientemente de su edad y nivel socioeconómico, lo que significa que los resultados de una encuesta de opinión sobrestimarán las tendencias de corte más “moderno” (pero, a la vez, podrían anticiparlas).
La otra es que el panel no es representativo de los segmentos que escasean en él (viejos y pobres), debido a la brecha digital, porque lo más probable es que los participantes que logre reclutar en esas categorías sean atípicos. Sin embargo, es razonable suponer que los resultados converjan con los de otras encuestas para los grupos jóvenes y adultos y de sectores medios y altos. Estas dificultades se irán resolviendo a medida que conozcamos mejor el sesgo digital, pero sobre todo a medida que la brecha digital se vaya cerrando y nos acerquemos a una penetración universal de Internet.
Una ventaja de la encuesta a un panel online es que no requiere la mediación de un encuestador, lo cual favorece la sinceridad del encuestado respecto de temas valóricos y políticos, tendiendo a responder como si estuviera en una urna ciega, en lugar de dar respuestas de cortesía o de caballo ganador.
Por último, una encuesta realizada por Twitter selecciona espontáneamente a los seguidores (y seguidores de seguidores) que tienen más afinidad con el tema de la encuesta. Eso le da una representatividad solo un poco mayor que la de encuestar a gente que uno conoce.
Todas las técnicas de encuesta tienen sus dificultades, limitaciones y puntos ciegos. Las encuestas sobre paneles online, como en su momento las encuestas telefónicas, llegaron para quedarse, tal como ha pasado en los países desarrollados con altas penetraciones de Internet. Es importante comparar sistemáticamente los resultados de distintas técnicas para llegar a identificar, comprender y, eventualmente, cuantificar y corregir los sesgos. La convergencia entre estos resultados no solo dependerá de la correcta aplicación de las técnicas, sino también de las características del fenómeno que estudiamos, que está lejos de ser históricamente inmutable.
Denos su opinión