Detecção de Narrativas Ligadas à Disseminação de Discursos de Ódio no Português Brasileiro através do uso de indicares linguísticos

Nome do Projeto

Ênfase

Pesquisa

Data inicial - Data final

01/10/2024 - 31/12/2026

Unidade de Origem

Centro de Desenvolvimento Tecnológico

Coordenador Atual

BRENDA SALENAVE SANTANA

Área CNPq

Ciências Exatas e da Terra

Resumo

do discurso de ódio, especialmente em fóruns frequentados por incels no Brasil. Com a expansão das plataformas digitais, o volume de conteúdo gerado pelos usuários aumentou significativamente, criando tanto oportunidades quanto desafios, especialmente na detecção de discursos prejudiciais. Apesar dos avanços no Processamento de Linguagem Natural (PLN), a detecção de discurso de ódio em português ainda é subdesenvolvida em comparação com o inglês. Este projeto propõe abordar essa lacuna utilizando técnicas computacionais de extração de narrativas, com foco na identificação de discursos de ódio em fóruns online. Usando um pipeline estruturado, o estudo realizará o pré-processamento e análise de dados textuais, identificará os principais componentes das narrativas e avaliará seu papel na disseminação da intolerância. O objetivo é desenvolver uma compreensão abrangente de como o discurso de ódio se manifesta nos espaços virtuais, levando a estratégias mais eficazes de detecção e mitigação. Além disso, a pesquisa busca integrar o ensino, a extensão e a pesquisa, promovendo ações que conectem a universidade e a comunidade na busca por soluções para os desafios sociais que enfrentamos.

Objetivo Geral

Buscando endereçar as problemáticas levantadas, este projeto de pesquisa tem por finalidade promover o estudo e desenvolvimento de técnicas para auxiliar a mitigar a cultura de violência online que vem se instaurando e trazendo implicações que refletem em nosso cotidiano através de discursos de ódio disseminados em fóruns. Dessa forma, visando prover soluções computacionais de maior efetividade em detectar e mitigar este tipo de conteúdo, este projeto está organizado de modo a alcançar alguns objetivos-chave.

Justificativa

O cenário em que vivemos está sobrecarregado de dados (GRUS, 2015; FU et al., 2020; MATTHES et al., 2020). Nas últimas décadas, a tecnologia da informação passou por uma enorme evolução, com expressiva adoção de redes sociais online e plataformas de mídia social. A tendência simbiótica em curso em relação ao aumento do consumo de informações eletrônicas e produção de dados por usuários finais que usam esses sistemas eletrônicos implica na análise de dados como uma área próspera de pesquisa e desenvolvimento contínuos, com novos recursos sendo criados diariamente, incluindo dados estruturados (organizados em formatos tabulares, como bancos de dados relacionais) e dados não estruturados (como texto livre, áudio e vídeo). Por meio dessa contínua mudança de paradigma de comunicação entre as pessoas, a Internet proporcionou um amplo espaço para divulgação de conteúdo. A difusão da opinião em uma sociedade determina o resultado das eleições, o sucesso dos produtos e a influência dos movimentos políticos ou sociais (BERENBRINK et al., 2022). E na Internet, onde qualquer usuário pode transmitir qualquer mensagem e atingir milhões de usuários em um curto espaço de tempo, não é diferente, o volume de conteúdo gerado por usuários aumentou significativamente. Assim, a comunicação online permitiu que a informação chegasse a pessoas e audiências que antes eram inacessíveis. Essa democratização tem sido responsável por mudanças significativas em nossa cultura (SILVA et al., 2016). Por exemplo, abriu novos canais para produção e compartilhamento de conteúdo com inúmeras plataformas e recursos e é uma ferramenta poderosa para diversas formas de expressão.

Apesar da crescente popularização de canais pessoais para divulgação de conteúdo, as interações virtuais ainda são fortemente dependentes de texto e, embora suas inúmeras vantagens, o anonimato por vezes associado, leva à adoção de estilos de comunicação mais agressivos e odiosos em diversas situações (SANTANA; FREITAS, 2024). De modo geral, tem-se que a linguagem humana possui nuances únicas de sentido que ocorrem em contextos específicos (SANTANA; VANIN, 2020). De acordo com Fortuna e Nunes (2018), por um lado, tem-se que, as pessoas estão mais dispostas a expressar publicamente suas opiniões, levando assim à disseminação do discurso de ódio; pelo outro, as pessoas são mais propensas a buscar um comportamento agressivo na Web e nas redes sociais, principalmente devido à privacidade desses ecossistemas. Conforme afirma Sousa (2019), este tipo de discurso surge em um espaço veloz e incontrolável e costuma causar graves danos aos seus alvos. O Brasil, o Marco Civil da Internet já prevê que o uso de a internet no país tem como princípio a "garantia da liberdade de expressão, comunicação e manifestação do pensamento, nos termos da Constituição Federal", constituição que garante a livre expressão da atividade intelectual, artística, científica e de comunicação, independente de censura ou licença. No entanto, há espaço para discussão sobre os limites dessa liberdade, muitas vezes vista como irrestrita. Conforme afirmado por Popper (2012), uma sociedade aberta deve ser intolerante à intolerância.

Nesta proposta, discurso de ódio é definido como: Uma linguagem, ou uma expressão indicativa de um tipo de comportamento linguístico, deliberadamente intencional, que ataca ou diminui através da segregação ou explicitação de preconceitos negativos sobre pessoas ou grupos com base em características específicas, como aparência física, religião, descendência, origem nacional ou étnica, orientação sexual, identidade de gênero ou outra que reduza seu valor e dignidade perante a sociedade, ameace e promova sua insegurança e, nos casos mais extremos, convoque a violência e o extermínio; uma linguagem que pode ocorrer com diferentes estilos linguísticos, mesmo em formas sutis ou quando o humor é usado.

Ao lidar com a literatura relacionada ao discurso de ódio, diferentes termos surgem com limites confusos (por exemplo, discurso perigoso, discurso tóxico, discurso de ódio, discurso intolerante e outros) (JAHAN; OUSSALAH, 2021a). No entanto, embora semelhantes, esses conceitos diferem entre si. É possível observar semelhança entre algumas das características de tais conceitos. Considerando tais semelhanças, em Santana (2023) entende-se que as características macro podem ser organizadas em cinco grandes conjuntos (Desumanização; Acusação em Espelho; Quebra de Contratos Sociais de Integridade ou Pureza; Questionamento da Lealdade em Grupo; e a Construção de Figuras de Oposição), que incluem outras características específicas.

Um grande desafio na detecção de linguagem intolerante em Processamento de Linguagem Natural (PLN) é a falta de conjuntos de dados rotulados e as limitações de métodos multilinguísticos em aplicações práticas (AHMAD et al., 2019). No entanto, apesar dos esforços já existentes, a detecção de discurso de ódio em português fica muito atrás da detecção desse mesmo tipo de discurso em inglês (JAHAN; OUSSALAH, 2021b), por exemplo. A manifestação deste tipo discursos de intolerância é ainda mais crítico em ambientes frequentados por incels, abreviação de celibatários involuntários (do inglês involuntary celibates - incel). Conforme exposto no trabalho de Blommaert (2017), alguns desses indivíduos tendem a se envolver na disseminação de várias formas de discurso de ódio – em particular, o racismo e a misoginia – e recorrentemente adotam um novo vocabulário ao fazê-lo.

Ainda que dados textuais sejam classificados como dados não estruturados, existe neste tipo de conteúdo uma certa estrutura gramatical e semântica. Ao se observar manifestações de discursos intolerantes, por exemplo, existem características singulares que caracterizam o que chamamos de indicadores linguísticos, os quais representam características expressas por meio da linguagem que reúnem e indicam um comportamento em comum. Como referido, grande parte desse conteúdo é comunicado por meio de linguagem natural contendo narrativas, onde estas se referem a histórias envolvendo múltiplos atores e eventos, ocorrendo em variados locais de acordo com uma linha do tempo (SANTANA et al., 2023). Narrativas estão presentes em diversas formas de expressão humana e podem ser compreendidas como uma forma fundamental de comunicação entre as pessoas (SANTANA et al., 2023). Assim, a extração de narrativas a partir do uso de dados textuais surge como uma abordagem capaz de ser utilizada para explorar a fundo a manifestação de discursos de ódio.

O uso de indicadores linguísticos pode então ser visto como uma abordagem para detecção de narrativas de discursos intolerantes no meio virtual (SANTANA, 2023). A detecção automatizada de discursos de ódio, por si só, é uma tarefa bastante desafiadora e, conforme exposto, com avanços ainda escaços na língua portuguesa. Há o entendimento geral de que para propor e desenvolver práticas de mitigação destes discursos, é necessário investigar também as situações em que ocorrem, isto é, a narrativa na qual estão envolvidos. Entretanto, a compreensão computacional da história subjacente de uma narrativa, pode ser uma tarefa bastante complexa tanto para os linguistas quanto para a linguística computacional como um todo. A área de extração de narrativas a partir de dados textuais é uma área em ascensão no PLN (RANADE et al., 2022; SANTANA et al., 2023; NORAMBUENA et al., 2023).

Neste projeto, é proposta a aplicação de metodologias advindas da tarefa computacional de extração de narrativas, como forma de analisar e explorar a manifestação de discursos de ódio em fóruns de modo a elaborar uma base para o desenvolvimento de métodos de detecção e mitigação destes conteúdos a partir de um entendimento abrangente do fenômeno. Para tanto, essa pesquisa é baseada no uso de um pipeline de extração de narrativas, proposto em Santana et al. (2023), como metologia para o estudo e construção de narrativas de ódio em ambientes virtuais. O pipeline a ser utilizado para desempenhar essa tarefa de extração de narrativas é composto por sub-tarefas voltadas ao pré-processamento e análise, identificação e extração de componentes, vinculação de componentes, representação e avaliação. Através do uso de tal abordagem como parte de nossa metodologia, é proposto então um estudo de caráter exploratório do discurso de ódio em fóruns brasileiros frequentados por incels.

Em atenção ao princípio da indissociabilidade entre ensino, extensão e pesquisa, essa proposta busca realizar ações que promovam a troca de saberes entre os diferentes segmentos da universidade e da comunidade externa, constituindo processos de ensino-aprendizagem e mobilizando problemáticas que impulsionam a pesquisa acadêmica e a busca de resolução dos
desafios que enfrentamos enquanto sociedade.

Metodologia

Os objetivos deste projeto o caracterizam como uma pesquisa descritiva, explicativa e de design (WAZLAWICK, 2020), pois ela visa oferecer uma investigação aprofundada a caracterização do discurso de ódio que orienta a formulação de hipóteses, ao mesmo tempo em que observa, registra e analisa a relação entre elementos considerados indicadores deste tipo de discurso e os elementos narrativos extraídos que os compõe, buscando suas causas e explicações (pesquisa descritiva e explicativa). Do ponto de vista de pesquisa de design (ou de projeto), este projeto visa uma tentativa de determinar a melhor ferramenta para realizar os objetivos propostos, investigando como seria a ferramenta ideal para o cenário de propósito.

Devido aos seus objetivos, o projeto tem um caráter tanto bibliográfico quanto de uma pesquisa de levantamento no que diz respeito aos seus procedimentos técnicos (WAZLAWICK, 2020). A pesquisa bibliográfica será realizada por meio de uma revisão sistemática da literatura para identificar características individuais do discurso de ódio, particularidades da detecção deste tipo de conteúdo considerando o português brasileiro, bem como métodos e abordagens para sua detecção. A partir da análise dessa bibliografia, o projeto propõe um meta-modelo e respectivos modelos de detecção de discursos de ódio a serem desenvolvidos visando compreender a estrutura do ambiente de coleta e observação dos dados. Assim, propõe-se recorrer a dados disponibilizados pelo Reddit1 , para construção de um conjunto de dados inicial que atenda as necessidades deste estudo. Esta abordagem tem como base trabalhos relacionados que se propuseram a desenvolver abordagens de detecção de discurso de ódio em outros idiomas em ambientes frequentados por incels (FARRELL et al., 2020; MOLLAS et al., 2022). São previstas também avaliações dos modelos junto a linguistas especializados neste tópico, bem como levantamentos feitos via questionário para aferição dos limites do que é considerado limite de ódio junto a comunidade em geral. Esta avaliação deverá ser realizada com prévia aprovação do comitê de ética via Plataforma Brasil, para coletar dados demográficos e de avaliações anônimas, que permitam a avaliação da aplicação dos modelos de linguagem a serem desenvolvidos com base na bibliografia por meio de análises quantitativas e qualitativas (WAZLAWICK, 2020).

A natureza aplicada deste projeto de pesquisa permite gerar conhecimentos para auxiliar e direcionar futuras pesquisas e aplicações práticas relacionadas à detecção de discursos de ódio em português (WAZLAWICK, 2020), uma vez que propõe o desenvolvimento de um metamodelo e respectivos modelos de linguagem adaptados com base no estado da arte ao mesmo tempo em que analisa particularidades da tarefa de detecção de discursos de ódio em português em ambientes virtuais de fóruns de incels. Para evitar as limitações das regras linguísticas discutidas acima, pretendemos utilizar métodos de aprendizado de máquina para a determinação da orientação de sentimento expressa nos textos opinativos. A metodologia proposta baseia-se em Transformers, mais especificamente, nos modelos BERT (acrônimo para Bidirectional Encoder Representations from Transformers) (DEVLIN et al., 2018) , Sabiá (grande modelo de linguagem proposto para a língua portuguesa) (PIRES et al., 2023) e Albertina2 . Estes modelos foram escolhidos, pois modelos baseados na arquitetura Transformers (VASWANI et al., 2017), como BERT e Sabiá, tem apresentado desempenho estado da arte nas mais diversas tarefas de Processamento da Língua Natural (GILLIOZ et al., 2020).

Indicadores, Metas e Resultados

Quanto aos resultados e impactos, dentro da área de Computação, em termos formação de recursos humanos de produção bibliográfica, neste projeto, estão previstas as orientações de trabalhos de iniciação científica associados às áreas cobertas pelo escopo do projeto. Serão submetidos para publicação artigos em anais ou periódicos/revistas, tendo como foco periódicos/revistas avaliados
com Qualis B1 ou superior para alunos de graduação e com Qualis A4 ou superior para alunos de pós-graduação, onde cada um será o primeiro autor do tema relacionado à sua área de contribuição dentro do projeto –, devido à originalidade da pesquisa, que, dentre outros, se refere ao uso de tecnologias do estado da arte para prover soluções em áreas de grande interesse social. A publicação em seminários técnicos na área também é esperada principalmente na fase inicial.

Também em relação a contribuição científica e tecnológica, estão previstos workshops, cursos, a implantação de protótipos desenvolvidos e a transferência de conhecimento para a comunidade, a serem explorados através do desenvolvimento de potenciais atividades de extensão. O projeto tem potencial para ocasionar pedidos de registro de software relativos às soluções de inovação em detecção de discurso de ódio com foco no português brasileiro.

Equipe do Projeto

Nome	CH Semanal	Data inicial	Data final
BRENDA SALENAVE SANTANA	6
FERNANDA POLGA SOUZA
GABRIEL KUSTER DE AZEVEDO
SILVANA DIAS FURTADO
TATIANA AIRES TAVARES	2