Postado por OLB em 01/07/22
Joyce Luz, João Feres Jr.
Quem aqui se lembra do episódio polêmico que marcou as eleições para a prefeitura de São Paulo em 1985? Naquele ano, Fernando Henrique Cardoso e Jânio Quadros disputavam a cadeira de prefeito da maior capital brasileira. As pesquisas de intenção de votos na época apontavam que Fernando Henrique seria o candidato vitorioso da disputa. Convencido por tais resultados, o até então candidato posou para fotos na cadeira de prefeito um dia antes da realização do pleito. Para sua infelicidade, contudo, Jânio Quadros venceu a eleição e ainda desinfectou a cadeira, na qual passaria os próximos três anos sentado, em resposta à provocação de seu oponente.
Esse episódio foi apenas um, entre tantos outros, em que os resultados das pesquisas de intenção de votos divergiram dos resultados das urnas. Nas eleições de 2018, um dia antes da realização do primeiro turno, Ibope e Datafolha divulgaram os resultados de suas pesquisas para presidente. No Ibope, o candidato Jair Bolsonaro (PSL à época) tinha 36% dos votos e Haddad (do PT) aparecia com 22%. Já o Datafolha trazia o atual presidente com 40% das intenções de voto e o petista com 25%. Mas o que se constatou na apuração final das urnas foi Bolsonaro com 46,03% e Haddad com 29,28% dos votos. Dessa vez os institutos de pesquisa acertaram o vencedor, mas erraram as previsões por valores muito superiores às margens de erro que declaram em seus relatórios de pesquisa.
Há dias atrás, a jornalista Mônica Bergamo noticiou que a corretora XP Investimentos, que vinha realizando pesquisas de intenção de voto para presidente periodicamente, cancelou a divulgação dos resultados de pesquisa já registrada no TSE devido à forte pressão de bolsonaristas. Os resultados mostravam o candidato petista muito à frente na preferência dos eleitores, inclusive quando os entrevistados foram inquiridos sobre a honestidade dos candidatos [1].
Ano eleitoral e as pesquisas que medem as intenções de voto voltam a ganhar espaço na mídia. Semanalmente nos deparamos com matérias sobre pesquisas apontando que candidato A tem x% das intenções de voto, candidato B tem y%, C tem z%, e por aí vai. Quão precisas são essas pesquisas? O quanto elas realmente transmitem a percepção dos eleitores? Por que nos deparamos com pesquisas que apresentam resultados frequentemente diferentes? Essas são algumas das inquietações que os eleitores e o público em geral têm quando se deparam com essas informações.
Para além da corrida eleitoral deste ano, na última semana de maio os senadores voltaram a discutir o Projeto de Lei Complementar (PLP) 112/21, também conhecido como novo código eleitoral — já aprovado pelos deputados federais, ainda em setembro do ano passado. Dentre as várias mudanças propostas no código, está previsto que os institutos de pesquisas passem a informar o percentual de acertos das pesquisas realizadas pela empresa nas últimas cinco eleições. Se a proposta for aprovada no Senado, as regras já passariam a valer para as pesquisas que estão sendo realizadas este ano.
Com este cenário em vista e sabendo que a quantidade de pesquisas tende a aumentar, quanto mais próxima fica a data de realização das eleições, o Observatório do Legislativo Brasileiro (OLB) organizou alguns pontos e dicas importantes para que os eleitores saibam interpretar os resultados das pesquisas de intenção de votos.
Pesquisas de intenção de votos são importantes elementos de informação em cenários marcados pela incerteza e pela polarização eleitoral. No Brasil, há quase 5 meses da realização das eleições, ainda não sabemos ao certo quais serão os candidatos à Presidência da República. Só nos últimos dois meses assistimos à desistência de duas importantes figuras políticas que concorreriam ao cargo, Sérgio Moro e João Dória. E ainda não está consolidada a chamada terceira via, que se autodefine como opção à polarização entre petistas e bolsonaristas. Nesse panorama, as pesquisas nos ajudam a entender melhor a movimentação das preferências em diferentes e possíveis cenários eleitorais.
Mas é preciso pontuarmos aqui que os resultados das pesquisas, como abordamos na introdução, podem conter um bom grau de imprecisão. Para elucidar melhor essa questão, as figuras 1 e 2 apresentam os resultados das pesquisas de intenção de voto no segundo turno das eleições presidenciais de 2022, para o cenário Lula X Bolsonaro. Cada ponto colorido do gráfico representa a porcentagem de intenção de votos para os candidatos divulgada por diferentes institutos de pesquisa.
Destaca-se como exemplo as intenções de voto para o candidato Lula, reportada pelas pesquisas de abril deste ano. Enquanto o Poder Data e o instituto Ideia apontam que Lula teria entre 47% e 48% das intenções de voto para presidente, a Genial Quaest e o IPESPE registram uma intenção de 55% e 53,5%, respectivamente. A diferença entre os resultados das pesquisas, para o mês de abril, varia de 6 a 8 pontos, valores estes muito acima da margem de erro esperada de 2 ou 3 pontos percentuais, para cima ou para baixo. Em outras palavras, dada a grande variação dos resultados e a margem de erro declarada pelos institutos de pesquisa, somos forçados a concluir que é impossível que todos estejam certos em suas estimativas.
O mesmo acontece com os resultados reportados para o candidato Jair Bolsonaro. Enquanto o IPESPE divulgou em suas pesquisas do mês de abril que o candidato teria 33,5% das preferências dos eleitores brasileiros, o instituto Ideia trouxe Bolsonaro com 39%. A diferença entre os resultados reportados ultrapassa 5 pontos, ou seja, mais uma vez ultrapassa a margem de erro declarada.
Essas diferenças entre os institutos e resultados divulgados, no entanto, indicam que as pesquisas de intenção de votos são ruins ou que não são confiáveis? Não! Tais diferenças nos mostram que devemos ficar atentos às informações complementares que os institutos são obrigados a divulgar a cada nova rodada de pesquisas. O OLB separou aqui 5 pontos importantes de serem levados em conta no momento da leitura e interpretação dos resultados das pesquisas.
Resultados divergentes entre as pesquisas e entre o resultado real das eleições podem, muitas vezes, ser explicados pela margem de erro. Como o intervalo de confiança, a margem de erro é uma das estatísticas mais importantes dos resultados de uma pesquisa eleitoral. Sua interpretação é, também, bastante simples. Tomemos como exemplo as pesquisas de intenção de voto realizadas pelo instituto PoderData no mês de abril para o segundo turno das eleições de 2022.
Conforme os gráficos 1 e 2, o instituto apontou que o candidato Lula tinha 47% das intenções de voto, contra 38% de Bolsonaro. O PoderData, por sua vez, utiliza uma margem de erro de 3 pontos para mais ou para menos. Logo, devemos interpretar que se a pesquisa tivesse sido realizada com base em toda a população brasileira, e não apenas com base em uma amostra, a intenção de votos que esperaríamos encontrar para o candidato Lula estaria entre 44% e 50%, ao passo que o candidato Jair Bolsonaro estaria entre 35% e 41% das intenções de voto.
Pesquisas nas quais a população inteira é consultada sobre suas intenções de voto não existem. A dificuldade de tempo e aplicação dos questionários, bem como a dificuldade financeira imposta, fazem com que os institutos de pesquisa recorram, então, à seleção de amostras da população para aplicarem seus questionários e extraírem seus resultados. Com a seleção de amostras, o uso da margem de erro torna-se obrigatório. Isso porque, a margem de erro é a estatística responsável por capturar as eventuais diferenças e erros aleatórios que possam existir entre a amostra selecionada e a população real.
Com a finalidade de diminuir a diferença entre os resultados das pesquisas dos institutos, bem como entre elas e o resultado real das eleições, o Tribunal Superior Eleitoral (TSE) passou a adotar a Resolução 23.364/2011. Dentre as principais mudanças da legislação está a determinação de que os institutos de pesquisa devem informar ao tribunal a margem de erro de suas pesquisas antes de irem a campo fazer as entrevistas.
Matematicamente, quanto maior a margem de erro de uma pesquisa, menor será a confiança de que os resultados extraídos da amostra estejam próximos aos valores reais observados na população. Contudo, ainda que os institutos de pesquisa brasileiros apresentem margens de erro diferentes entre si, como mostra o gráfico 1, a diferença de resultados entre elas supera, em alguns casos, as margens de erro reportadas. É o caso, por exemplo, das últimas pesquisas divulgadas pelo DataFolha e pelo PoderData. Enquanto o DataFolha divulgou que o candidato Lula teria 58% das intenções de voto no segundo turno, podendo este valor variar entre 54% e 60%, com a margem de erro de 2 pontos, o PoderData estimou que Lula teria 50% dos votos, variando entre 47% e 53%, com a margem de erro de 3 pontos. Como não há intersecção entre os intervalos, é pouco provável que as duas pesquisas correspondam às preferências reais da população.
Apesar da maior transparência imposta pela legislação do TSE, a exigência de os institutos de pesquisa terem de registrar a margem de erro pré-estabelecida antes de ir a campo é um problema. Em termos práticos, toda e qualquer dificuldade encontrada durante a realização das entrevistas não é capturada pela margem de erro reportada e usada para o cálculo dos resultados. Além disso, como abordaremos adiante, os erros de uma pesquisa dependem muito dos métodos de seleção e abordagem dos entrevistados.
Do ponto de vista da ciência da estatística, o cálculo da margem de erro de uma pesquisa só é possível quando a amostragem é probabilística. Neste tipo de seleção, todos os participantes têm as mesmas chances de serem escolhidos para compor a amostra. Como nenhum instituto brasileiro faz pesquisa eleitoral com amostragem probabilística dos participantes, as margens de erro informadas obrigatoriamente pelos institutos ao TSE não têm rigor estatístico. Isso não quer dizer que os resultados obtidos nas pesquisas não possam se aproximar da real distribuição de preferências eleitorais da população, mas que não há parâmetros científicos estritos para julgar os resultados a não ser a comparação final com os resultados das urnas, e mesmo esse é imperfeito.
A deficiência da margem de erro como parâmetro confiável de avaliação dos resultados das pesquisas faz aumentar a importância de os institutos divulgarem o processo de coleta e de composição de suas amostras. Isso porque, a depender do processo escolhido, a pesquisa pode deixar de fora dos dados, e das análises subsequentes, importantes parcelas da população.
Outra preocupação dos institutos de pesquisa com relação às amostras selecionadas deve ser o componente da estratificação. No Brasil, questões de território, bem como questões sociais atreladas à raça, gênero, escolaridade, renda, etc. importam para a composição de uma amostra que seja a mais fiel possível ao perfil da população.
É por este motivo que muitos institutos de pesquisas se preocupam com o que chamamos estratificação. As grandes empresas, como o IPEC (antigo Ibope), Datafolha, IPESPE e Quaest, utilizam, por exemplo, a amostragem aleatória estratificada por cotas. Primeiro, há a divisão da quantidade de entrevistados pelos municípios e regiões do país, para em seguida, ser realizada as devidas divisões por renda, idade, escolaridade, cor/raça ou gênero, de forma a reproduzir as proporções da população para as categorias selecionadas. Em termos práticos, a estratificação por cotas significa fazer, por exemplo, que se numa cidade a população feminina é de 60% e a masculina é de 40%, a amostra selecionada deverá ter a mesma proporção de mulheres e homens na pesquisa.
A técnica de abordagem da amostra selecionada também interfere, e muito, nos resultados das pesquisas. A depender da técnica escolhida, parcelas específicas da sociedade podem ser subrepresentadas ou mesmo excluídas das análises. Pesquisas feitas por telefone, por exemplo, tendem a deixar de fora a parcela da população que é mais pobre e não possui telefone ou que, muitas vezes, tem mais dificuldade para compreender os questionamentos, interagir com robôs ou mesmo responder aos questionamentos por esse meio. Por outro lado, nas pesquisas realizadas em domicílios, entrevistadores podem enfrentar dificuldades de acesso. Por exemplo, parte da classe alta brasileira mora em condomínios de alto-padrão que não permitem a entrada de “desconhecidos”. Da mesma forma, moradores de comunidades também podem deixar de ter suas opiniões coletadas por conta do difícil acesso às periferias.
Todos esses fatores precisam ser levados em conta na hora da análise e da interpretação dos resultados das pesquisas. Abaixo, colocamos no quadro 1 um resumo das principais técnicas de coleta das amostras, seus principais pontos positivos e negativos e os institutos de pesquisas que costumam aplicá-las.
Técnica de Coleta | Explicação | Pontos Positivos | Pontos Negativos | Institutos que usam |
---|---|---|---|---|
Ponto de Fluxo | Entrevistados são abordados em pontos específicos a cidade. | Processo de coleta é mais rápido do que a pesquisa em domicílio | Possível ausência de entrevistados que possam representar grupos específicos; problemas de viés associado ao entrevistado querer responder ao questionário sem necessariamente ter sido escolhido/ abordado pelo entrevistador. | DataFolha e Ideia |
Telefone | Entrevistas são realizadas por telefone, às vezes por robôs. | Menor custo e mais fácil do indivíduo aceitar ser entrevistado. | Exclusão da parcela da sociedade que não tem telefone, geralmente a população mais pobre; exclusão daqueles que não atendem as chamadas. | IPESPE, Futura, Ideia, Paraná Pesquisas e PoderData |
Domiciliar | Entrevistas são realizadas em domicílio. | Maior probabilidade de entrevistas com indivíduos que precisam fazer parte da amostra. | Maior custo; exclusão de determinadas parcelas da população. Exemplos: ricos que moram em condomínios que não permitem a entrada de entrevistadores e pobres que moram em localidades de difícil acesso. | IPEC, MDA, Paraná Pesquisas e Quaest |
Fonte: OLB
É preciso aqui ressaltar que em todas essas técnicas ainda podemos ter o problema associado ao viés do entrevistador. Não são raros os casos em que os entrevistadores tentam, de alguma forma, interferir ou interferir na resposta dos indivíduos. No último mês, por exemplo, a empresa de pesquisa Genial Quaest relatou que cinco entrevistas realizadas por um integrante de sua equipe de pesquisa foram descartadas, após a suspeita de que as normas de neutralidade na aplicação dos questionários não foram cumpridas. Esse é um caso raro de publicação desse problema, que a maioria dos institutos simplesmente não relata.
As pesquisas de opinião também podem apresentar importantes diferenças em seus resultados a depender do modo como o questionário é construído. A simples ordem de apresentação das perguntas pode alterar a resposta do participante. Por exemplo, há diferença entre coletar a intenção de voto do entrevistado sem lhe oferecer lista de nomes de candidatos, chamada intenção de voto espontânea, e coletar sua intenção a partir de uma lista predeterminada de candidatos, denominada intenção de voto estimulada.
As perguntas sobre intenção espontânea acabam por exigir que os respondentes tenham conhecimento prévio dos possíveis candidatos e isso nem sempre acontece. Muitos brasileiros e brasileiras desconhecem quem são os candidatos até as vésperas das eleições. Quando questionados pelas pesquisas, tais eleitores, muitas vezes, podem fornecer nomes de políticos que não necessariamente são candidatos ou podem fornecer nomes mais célebres, ou mais divulgados pela mídia — o que nem sempre pode corresponder a sua real intenção de voto.
Quando se pretende medir a intenção de voto estimulada e a pesquisa é realizada pessoalmente (ponto de fluxo e domiciliares), o modelo geralmente adotado para a pergunta é o uso de um disco circular, como mostra a figura 3. Neste disco, todos os nomes dos candidatos ocupam espaços iguais, aumentado a probabilidade de que o entrevistado visualize todos os nomes. Datafolha e IPEC costumam adotar essa técnica.
Já nas pesquisas realizadas por telefone, com a impossibilidade de apresentação de uma lista de candidatos ou de um disco, os institutos de pesquisa optam por ler os nomes de forma aleatória ou em rodízio a cada entrevista. Os respondentes, por sua vez, precisam, ainda, selecionar teclas de números específicos em seus telefones para informar as opções desejadas. Com esta técnica, por exemplo, os entrevistados podem ter dificuldade de se lembrar de todas as opções e acabar optando pela que mais memorizaram e não necessariamente pela que realmente desejavam escolher. Institutos como FSB e IPESPE adotam essa estratégia.
Ainda, é preciso aqui destacar que a depender de como são abordados ou das perguntas que antecedem as opções de voto, entrevistados podem optar por omitir suas reais preferências ou até mesmo escolher outras opções de resposta. Nas eleições de 2018, por exemplo, o instituto Vox Populi foi muito criticado por influenciar a escolha dos eleitores ao informar na pesquisa no texto da própria pergunta sobre intenção de voto, que Fernando Haddad (ex-candidato à Presidência da República) era o “Candidato do Lula”.
As pesquisas de intenção de votos não podem ser tomadas como preditivas dos resultados das eleições. As pesquisas retratam as intenções de voto para determinado candidato em determinado momento do tempo. Assim, se os resultados apresentados em um mês divergem dos resultados apresentados no mês seguinte, é preciso levar em conta a dinâmica dos acontecimentos políticos.
Por fim, como o próprio nome diz, pesquisas de intenções de voto medem as intenções dos eleitores que, por sua vez, podem mudar de opinião, levados por fatores que analistas e observadores nem sempre conhecem totalmente. Os questionários dessas pesquisas são, contudo, sempre limitados, por razões práticas e orçamentárias. Para além das intenções de voto e seu cruzamento com variáveis demográficas básicas como região de residência, idade, sexo, renda, escolaridade, ideologia/preferências pretéritas (nem sempre utilizadas) e raça (raramente utilizada) eles não são feitos com o fito de explorar questões contextuais do momento que possam estar influenciando as preferências.
Como toda atividade humana, as pesquisas de opinião estão sujeitas à malícia motivada por interesses particulares. Os resultados podem ser manipulados de várias maneiras, algumas delas comentadas acima, como na formação da amostra, na operação das entrevistas, na composição do questionário, etc, e também na divulgação dos dados. Esses podem ser divulgados em sua totalidade ou seletivamente, ou ainda totalmente ocultados. Mesmo a manipulação de resultados dentro da margem de erro, ou seja, por poucos pontos percentuais, pode ter grandes consequências para o resultado de uma eleição. Como prevenir que esses problemas aconteçam?
A única resposta possível, ao nosso ver, é mais e melhor regulação pública dessa atividade. As eleições são elemento fundamental da democracia representativa. Se seus resultados não são justos, ou seja, são distorcidos ou manipulados, todo o sistema democrático é colocado em risco. A regulação da atividade de pesquisa eleitoral é, portanto, assunto de suma relevância. O TSE tem feito um esforço meritório para regular essa atividade, mas como o contexto político, comunicacional e os parâmetros tecnológicos estão em constante mudança, é preciso constante atualização.
É saudável que instituições e agentes com claros interesses políticos e financeiros no resultado eleitoral patrocinem e divulguem pesquisas? Os institutos de pesquisa podem ser contratados por administrações de políticos para os quais trabalharam no período de campanha? Os institutos deveriam atingir metas de acerto em relação aos resultados finais da eleição, ou seja, os que erram fragorosamente devem ser punidos? Essas são questões ainda não respondidas.