Capítulo 1 Introdução: O que é pesquisa quantitativa?

Objetivos do capítulo

  • Entender a relação entre teorias, conceitos e mensuração
  • Conhecer os tipos de variáveis (categóricas, ordinais, contínuas)
  • Diferenciar frame teórico de perguntas empíricas

1.1 Teorias e hipóteses

Em Ciência Política, teorias tipicamente envolvem postulados sobre como agentes — pessoas, partidos, instituições, estados — se comportam. Um modelo de competição eleitoral, por exemplo, postula que candidatos buscam maximizar votos; uma teoria de relações internacionais postula que estados buscam segurança. Esses postulados comportamentais são o motor das teorias: deles derivam previsões empíricas testáveis. Toda teoria quantitativa em Ciência Política repousa sobre alguma premissa desse tipo, explícita ou implícita, e identificá-la é o primeiro passo para avaliar a teoria.

1.1.1 Frame teórico versus perguntas empíricas

O frame teórico é o conjunto de conceitos abstratos e relações postuladas (ex.: “competição política reduz corrupção”), enquanto a pergunta empírica traduz isso em algo testável com dados (ex.: “municípios com eleições mais competitivas apresentam menos irregularidades em licitações?”). A distinção é importante porque alunos frequentemente confundem “enquadramento teórico” com “pergunta de pesquisa”, ou acham que basta ter uma teoria para ter uma pergunta. Conceitos são do frame teórico; variáveis são da pergunta empírica.

1.2 Tipologias A

Collier, LaPorte & Seawright (2012) definem tipologias como “sistema organizado de tipos”. Exemplos clássicos de tiplogias: Weber: autoridade caristmática, tradicional e racional. Dahl: poliarquias, oligarquias comptitivas, hegemonias inclusivas e fechadas.

Table 1.1: Tipos de escala: estrutura básica e áreas de disputa. Adaptado de Collier, LaPorte e Seawright (2012, p. 218).
Tipo de escala Nível de informação Estatísticas admissíveis Definição de mensuração
Nominal Igual/não igual Contagem, moda, correlação de contingência Atribuição de numerais segundo regras
Ordem parcial Ordem entre algumas categorias, mas não todas Contagem, moda, correlação de contingência Atribuição de numerais segundo regras
Ordinal Ordem entre todas as categorias Mediana, percentis Atribuição de numerais segundo regras
Intervalar Intervalos iguais Média, desvio-padrão, correlação e regressão Mensuração como quantificação
Razão Zero significativo Média, desvio-padrão, correlação e regressão Mensuração como quantificação
Absoluta Contagem de entidades em uma categoria Média, desvio-padrão, correlação, algumas formas de regressão Mensuração como quantificação

1.3 Variáveis

1.3.1 Tipos de variáveis

1.3.2 Operacionalização de conceitos

Conceitos abstratos (democracia, corrupção, polarização) precisam ser traduzidos em variáveis mensuráveis. Um mesmo conceito pode ter múltiplas operacionalizações, cada uma capturando uma faceta diferente, e a escolha de operacionalização afeta os resultados.

O exemplo clássico é “democracia”. Existem dezenas de índices, e eles nem sempre concordam. Considere três dos mais usados:

  • Polity IV/V: escala de -10 (autocracia plena) a +10 (democracia plena), baseada em características institucionais como competitividade e abertura do recrutamento do Executivo.

  • V-Dem (Varieties of Democracy): índice de poliarquia que varia de 0 a 1, construído a partir de centenas de indicadores codificados por especialistas de cada país.

  • Boix, Miller e Rosato (BMR): classificação binária (0 = autocracia, 1 = democracia), baseada em contestação e participação.

Podemos organizar essas formas de medir democracia utilizando um quadro lógico proposto por Munck e Verkuilen (2002):

Estrutura lógica de conceitos. Adaptado de Munck e Verkuilen (2002, p. 13).

Figure 1.1: Estrutura lógica de conceitos. Adaptado de Munck e Verkuilen (2002, p. 13).

A Figura 1.1 mostra a estrutura lógica dos conceitos segundo Munck e Verkuilen (2002). O conceito de “democracia” é decomposto em atributos (contestação e participação), que por sua vez se desdobram em componentes mensuráveis — as “folhas” da árvore conceitual. Dois problemas comuns aparecem nessa decomposição: conflação (quando um componente é atribuído ao atributo errado) e redundância (quando componentes no mesmo nível se sobrepõem).

Vamos visualizar como essas três medidas descrevem a trajetória política do Brasil.

library(vdemdata)
library(tidyverse)

brasil <- vdem |>
  filter(country_name == "Brazil") |>
  select(year, v2x_polyarchy, e_p_polity, e_boix_regime) |>
  # Polity: remover códigos especiais (-66, -77, -88)
  mutate(e_p_polity = ifelse(e_p_polity < -10, NA, e_p_polity))

p1 <- ggplot(brasil, aes(x = year, y = v2x_polyarchy)) +
  geom_line(linewidth = 0.8) +
  labs(y = "V-Dem\n(poliarquia)", x = NULL) +
  scale_y_continuous(limits = c(0, 1)) +
  theme_minimal()

p2 <- ggplot(brasil, aes(x = year, y = e_p_polity)) +
  geom_line(linewidth = 0.8) +
  labs(y = "Polity IV", x = NULL) +
  scale_y_continuous(limits = c(-10, 10)) +
  theme_minimal()

p3 <- ggplot(brasil, aes(x = year, y = e_boix_regime)) +
  geom_step(linewidth = 0.8) +
  labs(y = "BMR\n(binário)", x = "Ano") +
  scale_y_continuous(breaks = c(0, 1), labels = c("Autocracia", "Democracia")) +
  theme_minimal()

library(patchwork)
p1 / p2 / p3
Três operacionalizações de democracia para o Brasil (1900–2024). Painel superior: índice de poliarquia do V-Dem (0 a 1). Painel central: Polity IV (-10 a +10). Painel inferior: classificação binária de Boix, Miller e Rosato.

Figure 1.2: Três operacionalizações de democracia para o Brasil (1900–2024). Painel superior: índice de poliarquia do V-Dem (0 a 1). Painel central: Polity IV (-10 a +10). Painel inferior: classificação binária de Boix, Miller e Rosato.

Note as diferenças. O índice V-Dem captura variação gradual — o Brasil não apenas transita entre democracia e autocracia, mas a qualidade da democracia varia ao longo do tempo, inclusive dentro de períodos democráticos. O Polity tende a ser mais discreto, com saltos abruptos. A classificação binária de BMR reduz toda essa variação a duas categorias: ou é democracia, ou não é.

Agora compare as medidas entre países. O gráfico abaixo mostra a relação entre o Polity e o V-Dem para todos os países em 2018.

mundo_2018 <- vdem |>
  filter(year == 2018) |>
  select(country_name, v2x_polyarchy, e_p_polity) |>
  filter(!is.na(v2x_polyarchy), !is.na(e_p_polity), e_p_polity >= -10)

ggplot(mundo_2018, aes(x = e_p_polity, y = v2x_polyarchy)) +
  geom_point(alpha = 0.5) +
  geom_smooth(method = "lm", se = FALSE, color = "steelblue", linewidth = 0.8) +
  labs(x = "Polity IV", y = "V-Dem (poliarquia)") +
  theme_minimal()
Relação entre Polity IV (eixo x) e V-Dem poliarquia (eixo y) para 163 países em 2018. A correlação é alta (r = 0.86), mas há casos de desacordo relevante.

Figure 1.3: Relação entre Polity IV (eixo x) e V-Dem poliarquia (eixo y) para 163 países em 2018. A correlação é alta (r = 0.86), mas há casos de desacordo relevante.

A correlação é alta (r = 0,86), mas não perfeita. Países com o mesmo escore no Polity podem ter índices V-Dem bem diferentes. Isso acontece porque cada índice enfatiza dimensões distintas do conceito de democracia. A escolha de operacionalização não é neutra — ela pode afetar os resultados de uma pesquisa.

1.3.2.1 EUA: o que o Polity não captura

Considere agora os Estados Unidos. O Polity atribui escore 10 (democracia plena) aos EUA desde 1829 — quando apenas homens brancos proprietários votavam. Mulheres só conquistaram o voto em 1920, e a população negra no Sul só teve acesso efetivo ao voto após o Voting Rights Act de 1965. O V-Dem registra essa trajetória: o índice de poliarquia parte de 0,34, salta para 0,51 com o sufrágio feminino e só ultrapassa 0,70 após os direitos civis.

eua <- vdem |>
  filter(country_name == "United States of America", year >= 1800) |>
  select(year, v2x_polyarchy, e_p_polity) |>
  mutate(e_p_polity = ifelse(e_p_polity < -10, NA, e_p_polity))

p_eua1 <- ggplot(eua, aes(x = year, y = v2x_polyarchy)) +
  geom_line(linewidth = 0.8) +
  labs(y = "V-Dem\n(poliarquia)", x = NULL) +
  scale_y_continuous(limits = c(0, 1)) +
  theme_minimal()

p_eua2 <- ggplot(eua, aes(x = year, y = e_p_polity)) +
  geom_line(linewidth = 0.8) +
  labs(y = "Polity IV", x = "Ano") +
  scale_y_continuous(limits = c(-10, 10)) +
  theme_minimal()

p_eua1 / p_eua2
EUA: Polity IV vs. V-Dem (poliarquia), 1800–2024. O Polity atinge o máximo em 1829; o V-Dem captura a expansão gradual da participação.

Figure 1.4: EUA: Polity IV vs. V-Dem (poliarquia), 1800–2024. O Polity atinge o máximo em 1829; o V-Dem captura a expansão gradual da participação.

A lição é clara: o Polity enfatiza contestação e competição entre elites, mas é pouco sensível à participação. Se a sua pergunta de pesquisa envolve inclusão política, o Polity pode ser uma operacionalização inadequada de “democracia”.

1.3.2.2 França: o que acontece quando um país é ocupado?

A França ilustra outro tipo de problema. Durante a ocupação nazista (1940–1944), o V-Dem registra uma queda abrupta da poliarquia para perto de zero. O Polity atribui códigos especiais (-66 para interrupção, -88 para transição), que não são valores na escala — e que precisam ser tratados como dados faltantes. A classificação binária de BMR simplesmente marca autocracia.

franca <- vdem |>
  filter(country_name == "France", year >= 1800) |>
  select(year, v2x_polyarchy, e_p_polity, e_boix_regime) |>
  mutate(e_p_polity = ifelse(e_p_polity < -10, NA, e_p_polity))

p_fr1 <- ggplot(franca, aes(x = year, y = v2x_polyarchy)) +
  geom_line(linewidth = 0.8) +
  labs(y = "V-Dem\n(poliarquia)", x = NULL) +
  scale_y_continuous(limits = c(0, 1)) +
  theme_minimal()

p_fr2 <- ggplot(franca, aes(x = year, y = e_p_polity)) +
  geom_line(linewidth = 0.8) +
  labs(y = "Polity IV", x = NULL) +
  scale_y_continuous(limits = c(-10, 10)) +
  theme_minimal()

p_fr3 <- ggplot(franca, aes(x = year, y = e_boix_regime)) +
  geom_step(linewidth = 0.8) +
  labs(y = "BMR\n(binário)", x = "Ano") +
  scale_y_continuous(breaks = c(0, 1), labels = c("Autocracia", "Democracia")) +
  theme_minimal()

p_fr1 / p_fr2 / p_fr3
França: três operacionalizações de democracia, 1800–2024. A ocupação nazista (1940–1944) aparece de forma diferente em cada medida.

Figure 1.5: França: três operacionalizações de democracia, 1800–2024. A ocupação nazista (1940–1944) aparece de forma diferente em cada medida.

Cada índice codifica a ocupação de forma diferente. Se o pesquisador não tratar os códigos especiais do Polity, pode introduzir erros graves nos dados. Isso mostra que operacionalizar um conceito não é apenas escolher um índice — é também entender como ele foi construído e quais decisões de codificação estão embutidas nos números.

1.3.2.3 Reino Unido: quem são os “cidadãos”?

O Reino Unido é classificado como democracia por BMR a partir de 1885, e recebe Polity 10 a partir de 1928. Mas a expansão do sufrágio foi lenta: o Reform Act de 1832 estendeu o voto a cerca de 14% dos homens adultos; o de 1867 ampliou para a classe trabalhadora urbana; o de 1884 incluiu trabalhadores rurais; mulheres acima de 30 anos votaram a partir de 1918, e o sufrágio universal só veio em 1928.

uk <- vdem |>
  filter(country_name == "United Kingdom", year >= 1800) |>
  select(year, v2x_polyarchy, e_p_polity, e_boix_regime) |>
  mutate(e_p_polity = ifelse(e_p_polity < -10, NA, e_p_polity))

p_uk1 <- ggplot(uk, aes(x = year, y = v2x_polyarchy)) +
  geom_line(linewidth = 0.8) +
  labs(y = "V-Dem\n(poliarquia)", x = NULL) +
  scale_y_continuous(limits = c(0, 1)) +
  theme_minimal()

p_uk2 <- ggplot(uk, aes(x = year, y = e_p_polity)) +
  geom_line(linewidth = 0.8) +
  labs(y = "Polity IV", x = NULL) +
  scale_y_continuous(limits = c(-10, 10)) +
  theme_minimal()

p_uk3 <- ggplot(uk, aes(x = year, y = e_boix_regime)) +
  geom_step(linewidth = 0.8) +
  labs(y = "BMR\n(binário)", x = "Ano") +
  scale_y_continuous(breaks = c(0, 1), labels = c("Autocracia", "Democracia")) +
  theme_minimal()

p_uk1 / p_uk2 / p_uk3
Reino Unido: três operacionalizações de democracia, 1800–2024. A expansão gradual do sufrágio aparece no V-Dem, mas menos no Polity e no BMR.

Figure 1.6: Reino Unido: três operacionalizações de democracia, 1800–2024. A expansão gradual do sufrágio aparece no V-Dem, mas menos no Polity e no BMR.

Há ainda uma questão mais fundamental: quem conta como cidadão? O Reino Unido governava um império. A Índia era colônia britânica, mas indianos não podiam votar nem disputar eleições para o parlamento em Westminster. Nenhum dos três índices captura isso — todos medem instituições domésticas, não o exercício de poder sobre populações coloniais. O mesmo problema aparece em escala menor: crianças, presos, pessoas interditadas judicialmente e imigrantes sem documentação são excluídos do eleitorado na maioria dos países, sem que isso afete os índices de democracia. A escolha de quem são os cidadãos relevantes já é, ela mesma, uma decisão de mensuração.

1.3.3 Tipologias: o que são, quando usar e quando evitar

Tipologias organizam variação qualitativa em categorias analiticamente úteis (ex.: regimes políticos de Linz, tipos de Estado de bem-estar de Esping-Andersen). Uma boa tipologia tem dimensões claras e teoricamente motivadas, categorias mutuamente exclusivas e coletivamente exaustivas, e utilidade empírica — isto é, os tipos se comportam de forma diferente em relação a algum outcome de interesse.

Por que não sair construindo tipologias? Porque tipologias sem fundamentação teórica viram exercícios taxonômicos estéreis. O critério deve ser: a tipologia ajuda a organizar a variação de forma que gere hipóteses testáveis ou ilumine mecanismos? Se não, ela é apenas uma tabela bonita. Há uma diferença entre tipologias como ponto de partida (para gerar hipóteses) e tipologias como ponto de chegada (resultado de análise empírica, como análise de clusters).

1.4 Mensuração

1.4.1 Validade e confiabilidade

1.5 Exercícios