Capítulo 14 Análise de Texto

Objetivos do capítulo

  • Compreender o paradigma text-as-data em Ciência Política
  • Realizar pré-processamento de textos (tokenização, remoção de stopwords, stemming)
  • Calcular frequências de termos e criar nuvens de palavras
  • Analisar dados textuais reais (discursos políticos, legislação)

14.1 Text-as-data em Ciência Política

14.2 Pré-processamento de textos

14.2.1 Tokenização

14.2.2 Stopwords

14.2.3 Stemming e lematização

14.3 Frequência de termos

14.3.1 Matriz documento-termo

14.3.2 TF-IDF

14.4 Visualização de textos

14.4.1 Nuvens de palavras

14.4.2 Frequências ao longo do tempo

14.5 Exemplo aplicado: discursos no plenário

14.6 Exercícios