Similaridade de textos: qual é o percentual aceitável?

 

Turnitin é um serviço de verificação de originalidade e prevenção de plágio que analisa documentos textuais quanto a erros de citação ou cópia inadequada. Quando você envia seu artigo ou trabalho, o Turnitin o compara ao texto em seu enorme banco de dados de trabalhos dos alunos, sites, livros, artigos, etc. Desde 2017, a Universidade de São Paulo mantém o serviço acessível à sua comunidade, por meio da Agência USP de Gestão da Informação Acadêmica (AGUIA). Esta matéria é uma compilação de algumas orientações disponíveis na Central de Ajuda do Turnitin [1], [2] e [3].

Os documentos enviados ao Turnitin podem ser comparados com bilhões de documentos na Internet, dados arquivados na Internet que não estão mais disponíveis na web ativa, um depósito local de trabalhos anteriormente enviados e um conjunto de coleções de periódicos de assinatura e outras publicações. Eles podem ser comparados com qualquer um ou com todos esses depósitos, conforme a configuração específica da verificação dos documentos.

O documento de comparação é chamado de Relatório de similaridades. Esse documento detalha o texto correspondente ou similar entre um envio feito ao Turnitin e os documentos com os quais ele foi comparado. O Turnitin não identifica o plágio e sim a similaridade de textos.

A pontuação de similaridade é apenas uma porcentagem do material que corresponde às fontes disponíveis nos bancos de dados do Turnitin, incluindo a Internet. 

Relatórios de similaridades

O Relatório de similaridades fornece um resumo das áreas de texto correspondentes ou similares encontradas em um documento enviado. Quando um Relatório de similaridades estiver disponível para visualização, haverá um ícone na coluna Similaridade da página do portfólio da aula do aluno. Os Relatórios de similaridades que não foram gerados até a conclusão exibirão o processamento de texto na coluna Similaridade da página do portfólio da aula do aluno.

Quanto mais alta a porcentagem, maior a quantidade de texto do envio que corresponde às informações nos depósitos do Turnitin. A faixa da porcentagem vai de 0% a 100%. A porcentagem é gerada pela quantidade de texto similar ou correspondente em comparação com o número total de palavras no envio.

O documento mostrado no Relatório de similaridades contém as imagens e gráficos incluídos no documento original.

Observação: os documentos substituídos ou reenviados não podem gerar um novo Relatório de similaridades por um total de 24 horas. Esse atraso é automático e permite que os reenvios sejam gerados corretamente, sem correspondência com o rascunho anterior.

Como interpretar o Relatório de similaridades

O Turnitin não verifica plágio em um trabalho. Em vez disso, verifica o documento em relação ao banco de dados de documentos e, se em algum caso sua escrita for similar ou corresponder a uma das nossas fontes, será marcada para a revisão. O banco de dados do Turnitin inclui bilhões de páginas web: o conteúdo atual e arquivado da Internet, um depósito de trabalhos que os alunos enviaram ao Turnitin no passado e uma coleção de documentos, que compreende milhares de periódicos, jornais e publicações.

É perfeitamente natural que um trabalho corresponda a algum dos documentos em nossos bancos de dados. Se você usou citações e fez a referência corretamente, haverá casos em que encontraremos uma correspondência. O Índice de Pontuação de Similaridade (SSI) simplesmente avisa o professor sobre áreas problemáticas no seu documento; ele o usará como uma ferramenta em um processo mais amplo, a fim de determinar se a correspondência é ou não aceitável.

O Turnitin não verifica plágio em um trecho de trabalho. Em vez disso, ele verifica o trabalho de um usuário em relação ao extenso banco de dados. Se forem encontradas instâncias em que a escrita de um usuário seja semelhante ou corresponda a uma origem, isso será sinalizado para sua análise na visão geral de correspondências.

O banco de dados inclui bilhões de páginas da Web: tanto conteúdo atual quanto arquivado da Internet, um repositório de trabalhos que os alunos enviaram ao Turnitin no passado e uma coleção de documentos, que compreende milhares de jornais, diários e publicações.

A cor da pontuação de similaridade em  Meus Arquivos baseia-se na quantidade de texto correspondente em um documento.

O que indicam as cores da pontuação de semelhança?

A faixa percentual é 0% a 100% com os possíveis índices de similaridade abaixo:

Índice de semelhança

A cor do ícone do relatório é vinculada a uma das cinco camadas do Índice de semelhança. Ela é baseada na quantidade de texto correspondente encontrado pela comparação com o depósito. As possíveis faixas de porcentagem do Índice de semelhança são vinculadas a uma cor correspondente:

  • azul (nenhuma palavra correspondente)

  • verde (índice de semelhança de uma palavra correspondente-24%)

  • amarelo (índice de semelhança de 25-49%)

  • laranja (índice de semelhança de 50-74%)

  • vermelho (índice de semelhança de 75-100%)

O índice geral de semelhança e a escala de cores correspondentes dos ícones fornecem uma indicação básica de quantas informações contidas em um envio específico correspondem a outras fontes no depósito do Turnitin. Esse número é um montante bruto da comparação feita com os depósitos selecionados para o trabalho ao qual o envio foi feito. Citações diretas ou áreas de bibliografia do documento não são excluídas automaticamente. A decisão de excluir permanentemente ou desconsiderar as correspondências com esses tipos de texto em um documento é tomada exclusivamente pelo professor da aula.

Aviso: esses índices não refletem, de maneira alguma, a avaliação do Turnitin sobre um documento conter material plagiado ou material usado indevidamente. O Relatório de similaridades é uma ferramenta que os professores usam para localizar mais facilmente os textos correspondentes ou similares ao texto de um trabalho enviado. A determinação e o julgamento da citação adequada e do plágio cabem exclusivamente ao professor e à instituição aos quais o trabalho foi enviado. As dúvidas referentes à definição de plágio usada na instituição devem ser encaminhadas ao professor da aula ou a um membro adequado do pessoal institucional.

As citações e a bibliografia de um documento podem ser excluídas da pontuação de semelhança.

Cenários de pontuação de semelhança

Uma pontuação de similaridade alta nem sempre sugere que uma peça de escrita foi plagiada, assim como uma pontuação de similaridade baixa nem sempre indica que nenhum plágio ocorreu. Considere os seguintes cenários:

  1. Enviar um documento de tamanho considerável poderia resultar em uma pontuação de similaridade de 0% com um relatório que ainda contenha correspondências. Isso ocorre porque a pontuação de similaridade foi arredondada para 0%, em vez de ser exatamente 0%.
  1. Você pode ter enviado vários rascunhos do mesmo documento ao repositório particular da sua instituição, o que significa que o rascunho final resultou em uma pontuação de 100%. Para evitar esse problema, recomendamos que você envie apenas o rascunho final ao repositório particular.
  2. Um indivíduo da sua instituição conseguiu adquirir uma cópia do seu documento. Ele(a) envia esse documento ao repositório particular da instituição e recebe uma pontuação de similaridade de 25%. Você envia seu documento original uma semana depois ao repositório particular, mas recebe uma pontuação de similaridade 100%.

Exemplos do Índice de semelhança

Por exemplo, você pode ter enviado um documento ao Turnitin no passado. Se você incluiu o seu nome nesse envio, é totalmente possível que, se o seu professor optou por não excluir as correspondências pequenas, ele será realçado no seu Relatório de similaridades.

Outro exemplo pode ser um aluno que copia e cola um trecho do texto em seu documento, devido a uma falta de conhecimento sobre o tópico que ele está discutindo. O seu Índice de semelhança pode ser de 10%.

No entanto, isso pode ser comparado com outro aluno que tem um conhecimento sólido para elaborar o documento e sabe o suficiente para reunir informações de várias fontes e citar e referência corretamente. O seu Índice de semelhança pode ser de 12%.

Será mostrado que os dois alunos têm correspondências com o nosso banco de dados. No entanto, um deles copiou diretamente de um site, enquanto o outro cita adequadamente as fontes usadas.

———————————————————

Determinar um percentual ideal de similaridade de texto não é possível, tendo em vista a necessidade de analisar caso a caso.

———————————————————–

Você pode encontrar mais informações sobre a citação das fontes usadas aqui: http://www.plagiarism.org/citing-sources/cite-sources

Abrindo o Relatório de similaridades

Os Relatórios de similaridade são normalmente concluídos dentro de 10 a 15 minutos após os envios. Esse tempo de geração do relatório pode variar, de acordo com os níveis extremos de uso que podem ocorrer durante certos períodos do ano letivo ou resultantes de envios muito grandes.

Se o professor configurar a preferência de visualização do Relatório de similaridades para permitir que os alunos acessem os relatórios, o ícone Relatório de similaridades permitirá que o usuário abra o relatório.

O ícone Relatório de similaridades mostra uma porcentagem e uma cor correspondente, que mostram em um índice a posição dessa porcentagem em termos de conteúdo correspondente. Essa porcentagem é o Índice de semelhança.

Fontes do depósito

O Turnitin utiliza vários tipos de depósitos ao gerar os Relatórios de similaridades. Atualmente, existem três tipos de depósitos:

  • depósito da Internet – bilhões de páginas web ativas e arquivadas na Internet. As fontes da Internet indicam a data de download no Relatório de similaridades do Turnitin se a correspondência não for encontrada no download mais recente do conteúdo deste site

  • periódicos – um depósito de conteúdo frequentemente atualizado de revistas, periódicos e publicações profissionais

  • depósito de documentos de alunos – um depósito de documentos anteriormente enviados por usuários do Turnitin

  • depósito de documentos da instituição – uma coleção de documentos enviados ao depósito da instituição

Observação: se uma área do texto do envio corresponder a uma fonte no depósito de documentos de alunos no Turnitin, ele será listado como trabalhos de alunos. A Comparação direta com a fonte não está disponível para os alunos encontrarem uma correspondência com documentos de outros alunos.

== REFERÊNCIAS ==

[1] TURNITIN. Guias de uso: abertura do relatório de similaridade. Oakland, s.d. Disponível em: https://help.turnitin.com/pt-br/feedback-studio/aluno/abertura-do-relatorio-de-similaridade.htm Acesso em: 03 jul. 2020.

[2] TURNITIN. Guias de uso: Interpretação da pontuação de semelhança. Oakland, s.d. Disponível em:https://help.turnitin.com/pt-br/simcheck/web-based/administrador/o-relatorio-de-similaridade/interpretacao-da-pontuacao-de-semelhanca.htm Acesso em: 03 jul. 2020.

[3] TURNITIN. Top 15 Misconceptions About Turnitin. Turnitin Blog, 2013. Disponível em: https://www.turnitin.com/blog/top-15-misconceptions-about-turnitin Acesso em: 03 jul. 2020.