Ir direto ao conteúdo

De onde vem a informação da Wikipédia, segundo ela mesma

Levantamento organizado pela enciclopédia on-line mapeou a origem das referências científicas feitas por seus usuários-editores

Fundada em 2001, a Wikipédia se autodenomina a maior enciclopédia on-line gratuita do mundo. Para sustentar esse título, o site conta com o apoio da comunidade: estima-se que as quase 45 milhões de páginas tenham sido criadas por pelo menos 200 mil editores voluntários. Todo o conteúdo disponível em seus bancos de dados pode ser questionado, revisado e modificado após discussões em fóruns públicos, acessíveis a seus mais de 33 milhões de usuários.

Cada vez que alguém inclui uma nova informação, é necessário que especifique o local de onde a tirou. A principal forma de validar os conteúdos, ou seja, comprovar que aquilo que está escrito em cada artigo corresponde à verdade, se dá por meio da citação de fontes oficiais.

Usando como referência livros e artigos científicos, por exemplo, editores voluntários da Wikipédia mostram o caminho que percorreram durante sua pesquisa, até a elaboração do texto final. Quem utiliza a Wikipédia como fonte de informação, dessa forma, consegue entender melhor a procedência de cada informação, e julgar por conta própria se aquilo é confiável ou não, e o contexto em que cada trecho foi utilizado.

É natural que textos que passaram pela revisão de cientistas e obras publicadas por editoras tenham mais prestígio do que uma notícia de jornal, por exemplo. Por conta desse cuidado prévio, a chance de que contenham um equívoco é menor do que em materiais que não foram feitos por especialistas.

20 mil

É a quantidade de novos artigos que a Wikipédia recebe por mês, em média

A fim de entender a quantidade de referências a fontes desse tipo em suas páginas, a Wikimedia Foundation, que gerencia a Wikipédia, realizou um levantamento de seu próprio conteúdo, semelhante a um que já havia feito em 2015.

No dia 1º de março de 2018, foram escolhidos para análise um total de 15.693.732 artigos, escritos em 297 línguas diferentes. Todos têm em comum o fato de conterem citações retiradas de obras que constam em quatro dos principais bancos de identificação:

  • Principais bancos digitais de literatura da área médica e biomédica

  • Banco que cria um padrão para identificação de documentos disponíveis on-line. Pode conter artigos, livros, capítulos de livros, jornais e revistas científicas

  • International Standard Book Number (ISBN)Sistema internacional para classificação numérica de livros, que separa as obras por título, autor, país, editora e edição
  • ArXivServiço on-line que reúne artigos em áreas como física, matemática, ciência da computação, biologia quantitativa, estatística, engenharia elétrica e economia

A maioria das citações, independentemente da linguagem em que são feitas, são retiradas de livros. Isso é notado principalmente em alemão, língua em que referências desse tipo representam 87% do total. Outros  padrões foram notados, como o fato de artigos em árabe citarem um número maior de publicações acadêmicas (doi) se comparado ao montante de livros.

Foto: Reprodução/Wikipédia
Gráfico que mostra a origem das citações, divididas por linguagem
Gráfico que mostra a origem das citações, divididas por linguagem
 

Entre os mais de 997 mil artigos escritos em português, há quase 300 mil referências a obras científicas dos bancos analisados. Assim, como a maioria dos idiomas, os livros também ganham maior atenção, representando 74,8% das citações.

“Primeiramente, o levantamento nos permite analisar, de forma quantitativa, de onde vem a informação da Wikipédia. Entender a procedência da informação reproduzida pelos usuários da Wikipédia também nos permite identificar quais são as lacunas - tipos de fontes, linguagens e perspectivas - que não estão sendo representadas, o que pode ajudar a comunidade a focar seus esforços em melhorar a cobertura dessas áreas.”

Comentário da Wikipédia, em seu blog, sobre o levantamento

A ampla maioria das fontes é citada em até 500 artigos da Wikipédia. 4,5 milhões aparecem na lista de referências de um artigo uma única vez e apenas 9 publicações ultrapassam a marca das 10 mil citações. O top 10 de obras mais citadas é composto apenas por livros de referência e artigos científicos que descrevem coleções, como você pode ver abaixo.

  1. Mapa atualizado da classificação climática de Köppen-Geiger: 2.830.341 citações (doi)
  2. Prevendo propriedades hidrofóbicas (lipofílicas) de moléculas orgânicas pequenas usando métodos de fragmentação: uma análise dos métodos AlogP e ClogP: 21.350 citações (doi)
  3. O status, qualidade e expansão do projeto cDNA do NIH: a coleção de genes de mamíferos (MGC): 20.247 citações (doi)
  4. O atlas de galáxias de “de Vaucouleurs”:  19.068 citações (ISBN)
  5. O catálogo completo NGC e o catálogo IC de nebulosas e aglomerados estelares por J. L. E. Dryer: 19.060 citações (ISBN)
  6. Galáxias e como observá-las: 19.058 citações (ISBN)
  7. Uma história resumida da Romênia: 15.597 citações (ISBN)
  8. Catálogo de peixes da Academia de Ciências da Califórnia: 11.980 citações (ISBN)
  9. Dicionário de nomes de asteróides: 10.651 citações (ISBN)
  10. Composição nacional e religiosa da população da Croácia, 1880-1991: por assentamentos: 8.230 citações (ISBN)

Em entrevista à revista Wired, os autores do estudo campeão em referências, feito em 2007, revelaram não fazer ideia do porquê o “Mapa atualizado da classificação climática de Köppen-Geiger” ter sido citado mais de 2,8 milhões de vezes. Como destaca a revista americana, o clima, campo de estudo da pesquisa que lidera o ranking, é área de interesse desde a biologia até a sociologia, o que pode ter estimulado o fato de um mapa completo do tipo ser muito citado.

De acordo com a Wikipédia, o número exagerado de citações acumulado por algumas das publicações - a primeira, sobretudo - não é obra apenas de usuários comuns. Para chegar a esse número de referências, foram utilizados bots e ferramentas automáticas, que revisaram os artigos e incluíram a referida fonte quando possível. Só em fevereiro de 2018, editores voluntários, anônimos e bots treinados editaram artigos 39 milhões de vezes.

Quão confiável é a Wikipédia hoje

Um aspecto principal que impede que a Wikipédia seja tomada como fonte primária para pesquisas é exatamente essa possibilidade de alteração do conteúdo. Por ser colaborativa e de livre acesso, é muito fácil que qualquer usuário faça mudanças, que nem sempre são mediadas a tempo por moderadores. Muitas das edições, assim, podem ser maliciosas, conspiratórias ou, simplesmente, equivocadas, prejudicando o uso da ferramenta.

Para minimizar esses efeitos, algumas medidas já foram adotadas, como a proibição de determinadas fontes consideradas imprecisas, por exemplo. Há um esforço por parte dos editores de garantir que as referências utilizadas sejam confiáveis, e comuniquem as informações da forma mais neutra possível.

Por conta desse esforço constante, a relevância do site como enciclopédia vem sendo aprimorada nos últimos anos, destacando-se em relação a outras plataformas do gênero.

Em dezembro de 2005, um estudo feito pela revista Nature comparou uma amostra de artigos da Wikipédia e entradas da Encyclopædia Britannica. A ideia era avaliar quanto ambas as fontes eram precisas em seus conteúdos. Há pouco mais de 12 anos, o desempenho de ambas foi considerado semelhante. A Wikipédia ficou atrás apenas no número médio de “incorreções factuais, omissões e afirmações falsas”. Enquanto artigos da Britannica continham 3 informações equivocadas, seus artigos chegavam a um total de 4 incoerências.

Em 2008, uma pesquisa classificou a precisão da Wikipédia como 80%. Outras fontes oficiais atingiram taxa entre 95% e 96%.

Entre os anos de 2008 e 2012, a qualidade de conteúdos da Wikipédia na área médica, sobretudo, ganhou destaque graças à maior contribuição por parte de profissionais da área. Diversos textos dos campos de patologia, toxicologia, oncologia e psiquiatria foram comparados, em diferentes momentos, a artigos revisados por pares - ou seja, aprovados pela comunidade científica.

Ainda assim, é importante que artigos da Wikipédia não sejam fontes finais de pesquisa, e sim, pontos de partida para quem busca entender mais de um assunto. Você pode ter algumas dicas sobre como fazer bom uso da enciclopédia on-line nesta série de links e textos, reunida pela Universidade Nacional da Irlanda.

NOTA DE ESCLARECIMENTO: Na versão original deste texto, utilizava-se a expressão "linguagens" em referência às 297 línguas existentes na Wikipédia. A alteração do termo foi feita às 13h26 do dia 07/05.

Todos os conteúdos publicados no Nexo têm assinatura de seus autores. Para saber mais sobre eles e o processo de edição dos conteúdos do jornal, consulte as páginas Nossa equipe e Padrões editoriais. Percebeu um erro no conteúdo? Entre em contato. O Nexo faz parte do Trust Project.

Já é assinante?

Entre aqui

Continue sua leitura

Para acessar este conteúdo, inscreva-se abaixo no Boletim Coronavírus, uma newsletter diária do Nexo: