Ir direto ao conteúdo

Como 3,5 milhões de livros descrevem homens e mulheres

Estudo usou inteligência artificial para analisar obras em língua inglesa e identificou as diferenças na forma como personagens femininos e masculinos são adjetivados

 

Um estudo de pesquisadores de universidades americanas e da Universidade de Copenhague, na Dinamarca, analisou milhões de livros para quantificar a diferença na linguagem usada para descrever homens e mulheres nas obras.

Os acadêmicos utilizaram o aprendizado de máquina, técnica da inteligência artificial pela qual um sistema aprende informações e executa uma tarefa, para analisar 3,5 milhões de livros em língua inglesa, de ficção e não-ficção, publicados entre 1900 e 2008.

O estudo apontou que as palavras usadas para caracterizar mulheres estão muito mais ligadas à aparência do que as que caracterizam homens – normalmente relacionadas ao comportamento ou a qualidades pessoais.

Termos negativos associados ao corpo ou à aparência aparecem com cinco vezes mais frequência quando ligados a substantivos femininos. Adjetivos positivos ou neutros ligados ao corpo ou à aparência são duas vezes mais comuns na descrição de figuras femininas.

A novidade da pesquisa é, principalmente, o seu escopo. Linguistas já haviam observado o componente de gênero da linguagem em bases de dados menores. Atualmente, cientistas da computação podem utilizar algoritmos para lidar com uma quantidade enorme de dados  —  no caso, foram 11 bilhões de palavras. “Confirmamos uma percepção generalizada em um nível estatístico”, disse Isabelle Augenstein, professora da Universidade de Copenhague que participou do estudo.

Quais os termos mais frequentes

Mulheres

positivos: beautiful (bonita); lovely (bela); chaste (casta); gorgeous (linda); fertile (fértil); beauteous (formosa); sexy; classy (classuda); exquisite (requintada); vivacious (vivaz); vibrant (vibrante).

negativos: battered (agredida); untreated (sem tratamento); barren (estéril); shrewish (briguenta); sheltered (protegida); heartbroken (de coração partido); unmarried (solteira); undernourished (subnutrida); underweight (abaixo do peso); uncomplaining (resignada).

Homens

positivos: just (justo); sound (seguro); righteous (correto); rational (racional); peaceable (pacífico); prodigious (prodigioso); brave (corajoso); paramount (fundamental); reliable (confiável); sinless (sem pecado); honorable (honrado).

negativos: unsuitable (inadequado); unreliable (não confiável); lawless (sem lei); inseparable (inseparável); brutish (bruto); idle (indolente); unarmed (desarmado); wounded (ferido); bigoted (preconceituoso); unjust (injusto); brutal (brutal).

Linguagem, gênero e inteligência artificial

Além de demonstrar as predileções de autores na hora de descrever personagens femininos e masculinos ao longo dos anos, o trabalho feito pela inteligência artificial do estudo ilustra o risco que de usar algoritmos  alimentados por bancos de dados com conteúdos que trazem estereótipos e preconceitos de gênero.

Augenstein afirma que os algoritmos identificam padrões, a partir dos quais adotam uma informação como “verdade”. Se a linguagem for enviesada, isso pode gerar resultados tendenciosos na hora de executar uma tarefa.

À medida que o uso desse tipo de tecnologia se torna mais disseminada, a atenção a esse tipo de viés identificado pelo estudo ganha uma importância maior.

A pesquisadora exemplifica que essa associações podem influenciar, por exemplo, quem é escolhido para uma vaga de emprego quando empresas fazem uso de sistemas de tecnologia da informação para selecionar currículos.

Esse tipo de falha afeta também os resultados de buscadores como o Google, que podem reproduzir preconceitos. Na tentativa de corrigir um problema dessa natureza, a empresa alterou o algoritmo de seu mecanismo de busca em julho de 2019 para que sites pornográficos deixassem de constar entre os resultados principais de pesquisas pelo termo “lésbica”.

Todos os conteúdos publicados no Nexo têm assinatura de seus autores. Para saber mais sobre eles e o processo de edição dos conteúdos do jornal, consulte as páginas Nossa equipe e Padrões editoriais. Percebeu um erro no conteúdo? Entre em contato. O Nexo faz parte do Trust Project.

Mais recentes

Você ainda tem 2 conteúdos grátis neste mês.

Informação com clareza, equilíbrio e qualidade.
Apoie o jornalismo independente. Junte-se ao Nexo!