Metodologia — Monitor Lab Informativo

Esta página descreve, sem jargão excessivo e sem tecnicismo desnecessário, como o Monitor funciona. É deliberadamente transparente: a credibilidade de um monitor de desinformação depende de poder ser auditado por qualquer leitor minimamente interessado.

1. O que o Monitor é

Uma ferramenta que observa grupos públicos de WhatsApp — aqueles cujo link de entrada foi deliberadamente tornado público pelos administradores — e tenta responder três perguntas:

  1. O que está circulando sobre temas de impacto institucional federal (STF, Congresso, governo, economia, regulação de plataformas, ciclo eleitoral)?
  2. Com que intensidade e com que velocidade um conteúdo se espalha entre grupos?
  3. O que isso diz sobre o debate público brasileiro em determinado momento?

Os resultados alimentam o Substack Lab Informativo, um dashboard público e alertas em tempo real nas redes sociais.

2. O que o Monitor não é

  • Não é uma ferramenta de vigilância de pessoas. Não rastreamos indivíduos. Não cruzamos dados entre plataformas para identificar ninguém.
  • Não quebra criptografia. O WhatsApp é criptografado de ponta a ponta, e isso não muda com nada que façamos. O que observamos é exclusivamente o que já é aberto ao público por quem hospeda os grupos.
  • Não é ferramenta partidária. Monitoramos grupos de todo o espectro político. Os temas são institucionais, não ideológicos.
  • Não expõe mensagens privadas. Tudo que publicamos é agregado, e a identidade de usuários comuns nunca é revelada.

3. Como escolhemos os grupos

A baseline do Monitor é composta por cerca de 500 grupos públicos, curados manualmente a partir de:

  • Diretórios abertos de links de grupos na internet
  • Buscas em plataformas abertas (redes sociais, canais de mídia, sites)
  • Indicações de jornalistas, pesquisadores e analistas do debate institucional

Os critérios de inclusão são editoriais: o grupo precisa ter aderência a ao menos um dos seis pilares temáticos e ter atividade real (ao menos dez mensagens por dia, com pluralidade mínima de autores).

Grupos que não se encaixam — fandoms, grupos de bairro sem pauta institucional, compra e venda, conteúdo adulto, canais de desinformação coordenada de origem conhecida — ficam de fora. A lista de grupos não é divulgada publicamente, pelas mesmas razões pelas quais fontes jornalísticas não são expostas: monitoramento se torna impossível quando a lista vira alvo.

4. Como coletamos

Contas dedicadas ao Monitor — chamadas de coletores — entram nos grupos públicos selecionados e recebem as mensagens como qualquer outro membro. As mensagens são processadas em tempo real pelo nosso pipeline.

Três princípios regem a coleta:

  • Contas-coletoras são identificáveis. Não escondemos a natureza do que fazemos. O número coletor, se consultado, não envia mensagens, não responde a contatos, não participa de conversas. Ele apenas observa.
  • Nenhum dado pessoal bruto é armazenado. O número de telefone de cada autor é convertido imediatamente em um código criptográfico irreversível antes de chegar ao banco de dados.
  • Nada é publicado sem curadoria editorial. Nenhuma mensagem aparece automaticamente em qualquer saída pública do Monitor. Há sempre uma etapa de revisão humana.

5. Como classificamos

Cada mensagem coletada é classificada segundo duas dimensões:

  • Tema — um dos seis pilares: STF e judicialização, Congresso, Executivo, economia política, governança algorítmica, ciclo eleitoral. A classificação é feita automaticamente por modelo de linguagem e validada por amostragem manual.
  • Tipo — texto, imagem, vídeo, áudio, documento.

Textos recebem uma representação vetorial (embedding) que permite encontrar mensagens semanticamente similares entre grupos. Imagens e vídeos recebem um hash perceptual, que identifica a mesma peça mesmo quando cortada, re-comprimida ou legendada. Áudios são transcritos automaticamente. Essas técnicas permitem contar, com boa precisão, em quantos grupos uma mesma peça apareceu.

6. Como definimos o que é "viral"

Uma peça é considerada viral quando:

  1. Aparece em pelo menos 10 grupos distintos da baseline, ou
  2. Atinge velocidade superior a 5 grupos por hora em qualquer momento.

Esses números são calibrados com base nos primeiros 60 dias de operação e revisados trimestralmente. Thresholds muito baixos inflam o ranking; thresholds muito altos perdem sinal relevante.

7. Como decidimos o que publicar

Nem todo viral entra no dashboard, na newsletter ou nos alertas. Antes de qualquer publicação, uma peça passa por três filtros:

  1. Relevância temática. A peça dialoga com um dos seis pilares?
  2. Interesse público. A circulação revela algo sobre o debate institucional que o leitor tem razão editorial para acompanhar?
  3. Verificação mínima. A peça contém afirmações verificáveis? Se sim, foi conferida com fontes primárias antes de ser contextualizada?

Só o que passa pelos três filtros vira conteúdo público — e mesmo assim sempre acompanhado de nota editorial que contextualiza o que o leitor está vendo: se é uma peça verdadeira circulando fortemente, uma peça falsa circulando fortemente, uma narrativa emergente, um rumor, uma piada tornada política.

8. O que o Monitor não consegue ver

Transparência sobre o que sabemos implica transparência sobre o que não sabemos. Esta lista é importante:

  • O Monitor não observa grupos privados. A maior parte do tráfego do WhatsApp no Brasil acontece em grupos fechados, e isso fica fora do nosso escopo.
  • Nossa amostra é enviesada. Grupos públicos têm perfil distinto dos grupos privados médios. Eles tendem a ser mais mobilizados, mais politizados e menos representativos da conversa cotidiana.
  • A baseline muda. Grupos morrem, grupos novos são criados, administradores trocam. Rankings ao longo do tempo não são estritamente comparáveis entre períodos longos sem ajuste metodológico.
  • Classificação automática erra. Cerca de 5% a 10% das classificações temáticas são incorretas em amostragens. Ajustamos o modelo continuamente, mas o erro nunca será zero.
  • Não medimos intenção. Uma peça que circula muito pode ser repassada por concordância, discordância, ironia, indignação ou curiosidade. O Monitor mede circulação, não adesão.

9. Frequência de atualização

  • Dashboard: atualizado a cada 15 minutos.
  • Newsletter (Substack): edição semanal, publicada às segundas-feiras de manhã.
  • Alertas (X e LinkedIn): disparados em tempo real quando uma peça cruza o threshold de viralização.
  • Revisão metodológica pública: trimestral, publicada neste mesmo endereço.

10. Código, dados e auditoria

Trabalhamos com o compromisso de abrir progressivamente partes não-sensíveis do projeto:

  • Código do pipeline de classificação: a abrir em repositório público após o período de estabilização (Fase 3 do MVP).
  • Lista agregada e anonimizada de grupos: publicada em relatório trimestral, sem links individuais.
  • Amostras de clusters virais: exportáveis para pesquisadores acadêmicos mediante termo formal.

Jornalistas e pesquisadores interessados em auditar metodologicamente o Monitor podem solicitar acesso supervisionado pelo contato abaixo.

11. Equipe e financiamento

O Monitor Lab Informativo é operado por [nome do responsável editorial] dentro do Lab Informativo. Não recebe financiamento de partidos políticos, campanhas, governos ou plataformas de tecnologia.

Eventual financiamento por instituições de pesquisa, fundações ou leitores será declarado publicamente nesta página.

12. Referências e inspirações

O Monitor bebe de trabalhos anteriores que estabeleceram o que é possível, legítimo e útil no monitoramento de grupos públicos no Brasil:

  • Monitor de WhatsApp 2.0 — UFMG / UFMS / UFV, liderado por Fabrício Benevenuto. Referência acadêmica central.
  • Radar Aos Fatos — em parceria com a Twist Systems. Referência de metodologia jornalística.
  • ITS Rio — estudos pioneiros de coordenação em grupos políticos durante as eleições de 2018.
  • NetLab UFRJ — análise de redes e desinformação em ecossistemas digitais.

13. Contato

  • Pauta, correção, crítica: [email editorial]
  • Direitos de titular de dados (LGPD): [email do encarregado]
  • Pesquisa e parcerias: [email institucional]

Esta metodologia é um documento vivo. Última atualização: [data]. Histórico de versões em /metodologia/historico.