O plágio envolve receber crédito pelas ideias, palavras ou imagens de outra pessoa, uma prática considerada Antiético em ambientes acadêmicos e profissionais. Isso pode passar despercebido pelos alunos que podem reformular acidentalmente as palavras de outra pessoa sem a devida atribuição. Como as aspas não são usadas quando algo é parafraseado, isso pode facilmente escapar do alcance de um revisor e passar para a versão final. No entanto, isso não é totalmente inatingível, especialmente porque hoje em dia os verificadores de plágio detectam paráfrases com mais eficiência.
Detectar paráfrases pode ser uma tarefa desafiadora, pois envolve identificar semelhanças e diferenças entre os textos. Nas seções subsequentes, nos aprofundaremos em uma discussão abrangente sobre métodos e técnicas comuns empregados para discernir instâncias de paráfrase.
Como os verificadores de plágio detectam paráfrases: métodos adequados explorados
No cenário educacional de hoje, os verificadores de plágio tornaram-se cada vez mais avançados, indo além de apenas sinalizar texto copiado para também detectar conteúdo parafraseado. Este artigo explora os métodos que permitem que essas ferramentas identifiquem efetivamente a paráfrase.
1. Correspondência de strings
Este método envolve a comparação de textos em nível de caractere ou palavra para identificar correspondências exatas. Um alto grau de semelhança nas sequências de caracteres ou na escolha de palavras entre dois textos pode sinalizar uma paráfrase. Essas ferramentas empregam algoritmos complexos que podem até considerar o significado contextual das palavras, tornando cada vez mais difícil que material plagiado e parafraseado passe despercebido.
2. Semelhança de cosseno
A similaridade de cosseno é um dos métodos pelos quais os verificadores de plágio detectam paráfrases. Mede a semelhança entre dois textos com base no ângulo entre suas representações vetoriais em um espaço de alta dimensão. Ao representar textos como vetores de frequências de palavras ou incorporações, essas ferramentas podem calcular a pontuação de similaridade de cosseno para refinar ainda mais sua capacidade de detectar conteúdo parafraseado.
3. Modelos de alinhamento de palavras
Esses modelos alinham palavras ou frases entre dois textos para identificar suas correspondências. Ao comparar os segmentos alinhados, você pode detectar paráfrases com base nas semelhanças e diferenças nas sequências correspondentes.
4. Análise semântica
Essa abordagem envolve a análise do significado e do contexto de palavras e frases em textos. Técnicas como análise semântica latente (LSA), incorporação de palavras (como Word2Vec ou GloVe) ou modelos de aprendizado profundo como BERT podem capturar relações semânticas entre palavras e identificar paráfrases com base na semelhança de suas representações semânticas.
5. Aprendizado de máquina
Algoritmos de aprendizado de máquina supervisionados podem ser treinados em conjuntos de dados rotulados de pares de textos parafraseados e não parafraseados. Esses modelos podem aprender padrões e recursos que distinguem paráfrases e podem ser usados para classificar novas instâncias de texto como parafraseadas ou não.
6. Análise de N-gramas
N-gramas são grupos de palavras próximas umas das outras. Ao verificar a frequência com que esses grupos aparecem em textos diferentes e compará-los, você poderá encontrar frases ou sequências semelhantes. Se houver muitos padrões semelhantes, isso pode significar que o texto pode ter sido parafraseado.
7. Detecção quase duplicada
A última maneira pela qual os verificadores de plágio detectam a paráfrase de maneira eficaz.
Algoritmos de detecção quase duplicados são frequentemente empregados na detecção de paráfrases para identificar segmentos de texto que apresentam um alto grau de similaridade ou são quase idênticos. Esses algoritmos são criados especificamente para reconhecer conteúdo parafraseado por meio da comparação de similaridade de texto em um nível detalhado.
Qual método geralmente é usado pelo software de prevenção de plágio?
As soluções tecnológicas utilizadas por serviços profissionais de prevenção de plágio normalmente dependem da análise de n-gramas. Ao aproveitar a tecnologia baseada em n-gramas, esses serviços alcançam uma taxa de precisão notavelmente alta. Esta é uma das melhores maneiras pelas quais os verificadores de plágio detectam paráfrases, permitindo a identificação e destaque de palavras exatas que foram reescritas.
Mecânica de como os verificadores de plágio detectam paráfrases
Os serviços de prevenção de plágio geralmente empregam a técnica de impressão digital para comparar documentos. Isso envolve extrair os n-gramas necessários dos documentos a serem verificados e compará-los com os n-gramas de todos os documentos em seus bancos de dados.
Exemplo
Digamos que haja uma frase: « Le mont Olympe é a mais alta montanha da Grécia. »
O n-gramas (por exemplo, 3 gramas) desta frase será:
- Le Mont Olympe
- monte Olympe est
- Olympe é o
- é o mais
- la plus haute
- montanha mais alta
- alta montanha de
- montagne de grèce
Caso 1. Substituição
Se a palavra for substituída por outra palavra, ainda assim algumas das n-gramas correspondência e é possível detectar a substituição da palavra por meio de análises adicionais.
Frase alterada: "O montagne Olympe é a mais alta montanha de Peloponeso. '
3 gramas originais | 3 gramas de texto alterado |
Le Mont Olympe monte Olympe est Olympe é o é o mais la plus haute montanha mais alta alta montanha de montagne de grèce | Le montagne Olimpo montagne Olympe está Olympe é o é o mais la plus haute montanha mais alta alta montanha de Montanha de Peloponeso |
Caso 2. Mudou a ordem das palavras (ou frases, parágrafos)
Quando a ordem da frase é alterada, ainda há uma correspondência de 3 gramas para que seja possível detectar a alteração.
Frase alterada: « La plus haute montagne de Grèce é Le mont Olympe. »
3 gramas originais | 3 gramas de texto alterado |
Le Mont Olympe monte Olympe est Olympe é o é o mais la plus haute montanha mais alta alta montanha de montagne de grèce | La plus haute montanha mais alta alta montanha de montagne de grèce da Grécia está Grécia é Le est Le mont Le Mont Olympe |
Caso 3. Novas palavras adicionadas
Quando as novas palavras são adicionadas, ainda existem alguns 3 gramas que correspondem para que seja possível detectar a alteração.
Frase alterada: « O Monte Olympe está de longe la plus haute montagne da Grécia. »
3 gramas originais | 3 gramas de texto alterado |
Le Mont Olympe monte Olympe est Olympe é o é o mais la plus haute montanha mais alta alta montanha de montagne de grèce | Le Mont Olympe monte Olympe est Olympe é de é de longe distante lombo a mais la plus haute montanha mais alta alta montanha de montagne de grèce |
Caso 4. Excluiu algumas palavras
Quando a palavra é removida, ainda existem alguns 3 gramas que correspondem para que seja possível detectar a alteração.
Frase alterada: « L'Olympe é a mais alta montanha da Grécia. »
3 gramas originais | 3 gramas de texto alterado |
Le Mont Olympe monte Olympe est Olympe é o é o mais la plus haute montanha mais alta alta montanha de montagne de grèce | L'Olympe est la é o mais la plus haute montanha mais alta alta montanha de montagne de grèce |
Exemplo do mundo real
Após a conclusão da verificação em um documento real, as seções parafraseadas são frequentemente identificadas por marcações interrompidas. Essas interrupções, denotando palavras alteradas, são destacadas para aumentar a visibilidade e a distinção.
Abaixo, você encontrará um exemplo de um documento real.
- O primeiro trecho vem de um arquivo que foi verificado usando o OXSICO serviço de prevenção de plágio:
- O segundo trecho é do documento fonte original:
Após uma análise mais profunda, é evidente que a parte selecionada do documento foi parafraseada fazendo as seguintes alterações:
Texto original | Texto parafraseado | Alterações |
apoia a inovação também se caracteriza | apóia a inovação além de definida | Substituição |
conhecimento econômico e social, sistemas eficientes | consciência econômica e social, organização eficiente | Substituição |
propostas (ideias) | recomendação | Substituição, exclusão |
Atitudes | posturas | Substituição |
sucesso | vencedor | Substituição |
processo (Perenc, Holub-Ivan | processo cognitivo (Perenc, Holub – Ivan | Adição |
pró-inovação | favorável | Substituição |
criando um clima | : criar uma condição | Substituição |
favorável | próspero | Substituição |
desenvolvendo conhecimento | consciência de desenvolvimento | Substituição |
Conclusão
O plágio, frequentemente não detectado em casos de paráfrase, continua a ser uma preocupação significativa no meio académico. Os avanços tecnológicos equiparam os verificadores de plágio com a capacidade de identificar com eficácia o conteúdo parafraseado. Especificamente, os verificadores de plágio detectam paráfrases por meio de vários métodos, como correspondência de strings, similaridade de cosseno e análise de n-gramas. Notavelmente, a análise de n-gramas se destaca pela sua alta taxa de precisão. Esses avanços reduzem substancialmente a probabilidade de material plagiado e parafraseado não ser detectado, aumentando assim a integridade acadêmica. |