Como os verificadores de plágio detectam a paráfrase?

como-os-verificadores-de-plágio-detectam-paráfraseando
()

O plágio envolve receber crédito pelas ideias, palavras ou imagens de outra pessoa, uma prática considerada Antiético em ambientes acadêmicos e profissionais. Isso pode passar despercebido pelos alunos que podem reformular acidentalmente as palavras de outra pessoa sem a devida atribuição. Como as aspas não são usadas quando algo é parafraseado, isso pode facilmente escapar do alcance de um revisor e passar para a versão final. No entanto, isso não é totalmente inatingível, especialmente porque hoje em dia os verificadores de plágio detectam paráfrases com mais eficiência.

Detectar paráfrases pode ser uma tarefa desafiadora, pois envolve identificar semelhanças e diferenças entre os textos. Nas seções subsequentes, nos aprofundaremos em uma discussão abrangente sobre métodos e técnicas comuns empregados para discernir instâncias de paráfrase.

Como os verificadores de plágio detectam paráfrases: métodos adequados explorados

No cenário educacional de hoje, os verificadores de plágio tornaram-se cada vez mais avançados, indo além de apenas sinalizar texto copiado para também detectar conteúdo parafraseado. Este artigo explora os métodos que permitem que essas ferramentas identifiquem efetivamente a paráfrase.

verificadores de plágio-detectam-paráfraseando

1. Correspondência de strings

Este método envolve a comparação de textos em nível de caractere ou palavra para identificar correspondências exatas. Um alto grau de semelhança nas sequências de caracteres ou na escolha de palavras entre dois textos pode sinalizar uma paráfrase. Essas ferramentas empregam algoritmos complexos que podem até considerar o significado contextual das palavras, tornando cada vez mais difícil que material plagiado e parafraseado passe despercebido.

2. Semelhança de cosseno

A similaridade de cosseno é um dos métodos pelos quais os verificadores de plágio detectam paráfrases. Mede a semelhança entre dois textos com base no ângulo entre suas representações vetoriais em um espaço de alta dimensão. Ao representar textos como vetores de frequências de palavras ou incorporações, essas ferramentas podem calcular a pontuação de similaridade de cosseno para refinar ainda mais sua capacidade de detectar conteúdo parafraseado.

3. Modelos de alinhamento de palavras

Esses modelos alinham palavras ou frases entre dois textos para identificar suas correspondências. Ao comparar os segmentos alinhados, você pode detectar paráfrases com base nas semelhanças e diferenças nas sequências correspondentes.

4. Análise semântica

Essa abordagem envolve a análise do significado e do contexto de palavras e frases em textos. Técnicas como análise semântica latente (LSA), incorporação de palavras (como Word2Vec ou GloVe) ou modelos de aprendizado profundo como BERT podem capturar relações semânticas entre palavras e identificar paráfrases com base na semelhança de suas representações semânticas.

5. Aprendizado de máquina

Algoritmos de aprendizado de máquina supervisionados podem ser treinados em conjuntos de dados rotulados de pares de textos parafraseados e não parafraseados. Esses modelos podem aprender padrões e recursos que distinguem paráfrases e podem ser usados ​​para classificar novas instâncias de texto como parafraseadas ou não.

6. Análise de N-gramas

N-gramas são grupos de palavras próximas umas das outras. Ao verificar a frequência com que esses grupos aparecem em textos diferentes e compará-los, você poderá encontrar frases ou sequências semelhantes. Se houver muitos padrões semelhantes, isso pode significar que o texto pode ter sido parafraseado.

7. Detecção quase duplicada

A última maneira pela qual os verificadores de plágio detectam a paráfrase de maneira eficaz.

Algoritmos de detecção quase duplicados são frequentemente empregados na detecção de paráfrases para identificar segmentos de texto que apresentam um alto grau de similaridade ou são quase idênticos. Esses algoritmos são criados especificamente para reconhecer conteúdo parafraseado por meio da comparação de similaridade de texto em um nível detalhado.

Qual método geralmente é usado pelo software de prevenção de plágio?

As soluções tecnológicas utilizadas por serviços profissionais de prevenção de plágio normalmente dependem da análise de n-gramas. Ao aproveitar a tecnologia baseada em n-gramas, esses serviços alcançam uma taxa de precisão notavelmente alta. Esta é uma das melhores maneiras pelas quais os verificadores de plágio detectam paráfrases, permitindo a identificação e destaque de palavras exatas que foram reescritas.

Mecânica de como os verificadores de plágio detectam paráfrases

Os serviços de prevenção de plágio geralmente empregam a técnica de impressão digital para comparar documentos. Isso envolve extrair os n-gramas necessários dos documentos a serem verificados e compará-los com os n-gramas de todos os documentos em seus bancos de dados.

alunos-lendo-como-fazer-verificadores-de-plágio-detectar-parafrasear

Exemplo

Digamos que haja uma frase: « Le mont Olympe é a mais alta montanha da Grécia. »

A n-gramas (por exemplo, 3 gramas) desta frase será:

  • Le Mont Olympe
  • monte Olympe est
  • Olympe é o
  • é o mais
  • la plus haute
  • montanha mais alta
  • alta montanha de
  • montagne de grèce

Caso 1. Substituição

Se a palavra for substituída por outra palavra, ainda assim algumas das n-gramas correspondência e é possível detectar a substituição da palavra por meio de análises adicionais.

Frase alterada:  "O montagne Olympe é a mais alta montanha de Peloponeso. '

3 gramas originais3 gramas de texto alterado
Le Mont Olympe
monte Olympe est
Olympe é o
é o mais
la plus haute
montanha mais alta
alta montanha de
montagne de grèce
Le montagne Olimpo
montagne Olympe está
Olympe é o
é o mais
la plus haute
montanha mais alta
alta montanha de
Montanha de Peloponeso

Caso 2. Mudou a ordem das palavras (ou frases, parágrafos)

Quando a ordem da frase é alterada, ainda há uma correspondência de 3 gramas para que seja possível detectar a alteração.

Frase alterada: « La plus haute montagne de Grèce é Le mont Olympe. »

3 gramas originais3 gramas de texto alterado
Le Mont Olympe
monte Olympe est
Olympe é o
é o mais
la plus haute
montanha mais alta
alta montanha de
montagne de grèce
La plus haute
montanha mais alta
alta montanha de
montagne de grèce
da Grécia está
Grécia é Le
est Le mont
Le Mont Olympe

Caso 3. Novas palavras adicionadas

Quando as novas palavras são adicionadas, ainda existem alguns 3 gramas que correspondem para que seja possível detectar a alteração.

Frase alterada: « O Monte Olympe está de longe la plus haute montagne da Grécia. »

3 gramas originais3 gramas de texto alterado
Le Mont Olympe
monte Olympe est
Olympe é o
é o mais
la plus haute
montanha mais alta
alta montanha de
montagne de grèce
Le Mont Olympe
monte Olympe est
Olympe é de
é de longe
distante
lombo a mais
la plus haute
montanha mais alta
alta montanha de
montagne de grèce

Caso 4. Excluiu algumas palavras

Quando a palavra é removida, ainda existem alguns 3 gramas que correspondem para que seja possível detectar a alteração.

Frase alterada: « L'Olympe é a mais alta montanha da Grécia. »

3 gramas originais3 gramas de texto alterado
Le Mont Olympe
monte Olympe est
Olympe é o
é o mais
la plus haute
montanha mais alta
alta montanha de
montagne de grèce
L'Olympe est la
é o mais
la plus haute
montanha mais alta
alta montanha de
montagne de grèce

Exemplo do mundo real

Após a conclusão da verificação em um documento real, as seções parafraseadas são frequentemente identificadas por marcações interrompidas. Essas interrupções, denotando palavras alteradas, são destacadas para aumentar a visibilidade e a distinção.

Abaixo, você encontrará um exemplo de um documento real.

  • O primeiro trecho vem de um arquivo que foi verificado usando o OXSICO serviço de prevenção de plágio:
  • O segundo trecho é do documento fonte original:
relatório de plágio

Após uma análise mais profunda, é evidente que a parte selecionada do documento foi parafraseada fazendo as seguintes alterações:

Texto originalTexto parafraseadoAlterações
apoia a inovação também se caracteriza apóia a inovação além de definidaSubstituição
conhecimento econômico e social, sistemas eficientes consciência econômica e social, organização eficienteSubstituição
propostas (ideias)recomendaçãoSubstituição, exclusão
AtitudesposturasSubstituição
sucessovencedorSubstituição
processo (Perenc, Holub-Ivanprocesso cognitivo (Perenc, Holub – IvanAdição
pró-inovaçãofavorávelSubstituição
criando um clima: criar uma condiçãoSubstituição
favorávelprósperoSubstituição
desenvolvendo conhecimentoconsciência de desenvolvimentoSubstituição

Conclusão

O plágio, frequentemente não detectado em casos de paráfrase, continua a ser uma preocupação significativa no meio académico. Os avanços tecnológicos equiparam os verificadores de plágio com a capacidade de identificar com eficácia o conteúdo parafraseado. Especificamente, os verificadores de plágio detectam paráfrases por meio de vários métodos, como correspondência de strings, similaridade de cosseno e análise de n-gramas. Notavelmente, a análise de n-gramas se destaca pela sua alta taxa de precisão. Esses avanços reduzem substancialmente a probabilidade de material plagiado e parafraseado não ser detectado, aumentando assim a integridade acadêmica.

Quão útil foi esta postagem?

Clique em uma estrela para avaliá-la!

Classificação média / 5. Contagem de votos:

Nenhum voto até agora! Seja o primeiro a avaliar esta postagem.

Lamentamos que este post não tenha sido útil para você!

Vamos melhorar este post!

Diga-nos como podemos melhorar esta postagem?