Plagiatul implică atragerea creditului pentru ideile, cuvintele sau imaginile altcuiva, o practică considerată ne-etic în medii academice și profesionale. Poate trece neobservat de studenți care pot reformula din greșeală cuvintele altcuiva fără o atribuire adecvată. Deoarece ghilimelele nu sunt folosite atunci când ceva este parafrazat, poate scăpa cu ușurință de strânsoarea unui corector și poate continua în versiunea finală. Cu toate acestea, nu este complet de nerealizat, mai ales că verificatorii de plagiat detectează parafrazarea mai eficient în zilele noastre.
Detectarea parafrazării poate fi o sarcină dificilă, deoarece implică identificarea asemănărilor și diferențelor dintre texte. În secțiunile următoare, vom aprofunda într-o discuție cuprinzătoare despre metodele și tehnicile comune folosite pentru a discerne cazurile de parafrazare.
Cum detectează verificatoarele de plagiat parafrazarea: metode adecvate explorate
În peisajul educațional de astăzi, verificatoarele de plagiat au devenit din ce în ce mai avansate, depășind doar semnalarea textului copiat pentru a detecta și conținutul parafrazat. Acest articol explorează metodele care permit acestor instrumente să identifice eficient parafrazarea.
1. Potrivirea șirurilor
Această metodă implică compararea textelor la nivel de caracter sau cuvânt pentru a identifica potrivirile exacte. Un grad ridicat de similitudine în secvențele de caractere sau alegerile de cuvinte între două texte ar putea semnala parafrazarea. Aceste instrumente folosesc algoritmi complecși care pot lua în considerare chiar și sensul contextual al cuvintelor, ceea ce face din ce în ce mai dificil ca materialul plagiat, parafrazat, să rămână nedetectat.
2. Asemănarea cosinusului
Similitudinea cosinus este una dintre metodele prin care verificatorii de plagiat detectează parafrazarea. Măsoară asemănarea dintre două texte pe baza unghiului dintre reprezentările lor vectoriale într-un spațiu de dimensiuni mari. Reprezentând textele ca vectori ai frecvențelor de cuvinte sau înglobărilor, aceste instrumente pot calcula scorul de similaritate cosinus pentru a-și rafina și mai mult capacitatea de a detecta conținutul parafrazat.
3. Modele de aliniere a cuvintelor
Aceste modele aliniază cuvinte sau fraze între două texte pentru a identifica corespondențele acestora. Comparând segmentele aliniate, puteți detecta parafrazarea pe baza asemănărilor și diferențelor dintre secvențele potrivite.
4. Analiza semantică
Această abordare implică analiza sensului și contextului cuvintelor și frazelor din texte. Tehnici precum analiza semantică latentă (LSA), încorporarea cuvintelor (cum ar fi Word2Vec sau GloVe) sau modelele de învățare profundă precum BERT pot surprinde relațiile semantice dintre cuvinte și pot identifica parafrazarea pe baza asemănării reprezentărilor lor semantice.
5. Învățarea în mașină
Algoritmii de învățare automată supravegheați pot fi antrenați pe seturi de date etichetate de perechi de texte parafrazate și neparafrazate. Aceste modele pot învăța modele și caracteristici care disting parafrazele și pot fi folosite pentru a clasifica noi instanțe de text ca parafrazate sau nu.
6. Analiza N-gramelor
N-gramele sunt grupuri de cuvinte care sunt unul lângă celălalt. Când verificați cât de des apar aceste grupuri în texte diferite și le comparați, puteți găsi fraze sau secvențe similare. Dacă există multe modele similare, ar putea însemna că textul ar fi fost parafrazat.
7. Detectare aproape duplicat
Ultima modalitate prin care verificatorii de plagiat detectează eficient parafrazarea.
Algoritmii de detectare aproape duplicat sunt folosiți frecvent în detectarea parafrazării pentru a identifica segmentele de text care prezintă un grad ridicat de similitudine sau care sunt aproape identice. Acești algoritmi sunt special creați pentru a recunoaște conținutul parafrazat prin compararea similarității textului la un nivel detaliat.
Ce metodă este utilizată de obicei de software-ul de prevenire a plagiatului?
Soluțiile tehnologice utilizate de serviciile profesionale de prevenire a plagiatului se bazează de obicei pe analiza n-gram. Prin utilizarea tehnologiei bazate pe n-grame, aceste servicii ating o rată de precizie remarcabil de mare. Acesta este unul dintre cele mai bune moduri prin care verificatorii de plagiat detectează parafrazarea, permițând identificarea și evidențierea cuvintelor exacte care au fost rescrise.
Mecanica modului în care verificatorii de plagiat detectează parafrazarea
Serviciile de prevenire a plagiatului folosesc de obicei tehnica de amprentare pentru a compara documentele. Aceasta presupune extragerea n-gramelor necesare din documentele de verificat și compararea lor cu n-gramele tuturor documentelor din bazele lor de date.
Exemplu
Să spunem că există o propoziție: « Le mont Olympe este la plus haute montagne de Grèce. »
n-grame (de exemplu 3 grame) din această propoziție va fi:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- este cel mai mult
- la plus haute
- cel mai înalt munte
- haute montagne de
- montagne de Grèce
Cazul 1. Înlocuire
Dacă cuvântul este înlocuit cu celălalt cuvânt, totuși o parte din n-grame potrivește și este posibil să se detecteze înlocuirea cuvântului prin analize ulterioare.
Propoziție schimbată: "The munți Olympe est la plus haute montagne de Peloponez. »
Original 3 grame | 3 grame de text modificat |
Le mont Olympe mont Olympe est Olympe est la este cel mai mult la plus haute cel mai înalt munte haute montagne de montagne de Grèce | Le munți Olimp munți Olympe est Olympe est la este cel mai mult la plus haute cel mai înalt munte haute montagne de Montagne de Peloponez |
Cazul 2. S-a schimbat ordinea cuvintelor (sau a propozițiilor, a paragrafelor)
Când ordinea propoziției este schimbată, încă 3 grame se potrivesc, astfel încât este posibil să se detecteze schimbarea.
Propoziție schimbată: « La plus haute montagne de Grèce este Le mont Olympe. »
Original 3 grame | 3 grame de text modificat |
Le mont Olympe mont Olympe est Olympe est la este cel mai mult la plus haute cel mai înalt munte haute montagne de montagne de Grèce | La plus haute cel mai înalt munte haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Cazul 3. S-au adăugat cuvinte noi
Când se adaugă cuvintele noi, există încă câteva 3 grame care se potrivesc, astfel încât este posibil să detectați schimbarea.
Propoziție schimbată: « Le mont Olympe est de departe la plus haute montagne de Grèce. »
Original 3 grame | 3 grame de text modificat |
Le mont Olympe mont Olympe est Olympe est la este cel mai mult la plus haute cel mai înalt munte haute montagne de montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin departe loin la plus la plus haute cel mai înalt munte haute montagne de montagne de Grèce |
Cazul 4. S-au șters câteva cuvinte
Când cuvântul este eliminat, există încă câteva 3 grame care se potrivesc, astfel încât este posibil să detectați schimbarea.
Propoziție schimbată: « L'Olympe este la plus haute montagne de Grèce. »
Original 3 grame | 3 grame de text modificat |
Le mont Olympe mont Olympe est Olympe est la este cel mai mult la plus haute cel mai înalt munte haute montagne de montagne de Grèce | L'Olympe est la este cel mai mult la plus haute cel mai înalt munte haute montagne de montagne de Grèce |
Exemplu din lumea reală
După finalizarea verificării într-un document real, secțiunile parafrazate sunt adesea identificate prin marcaje întrerupte. Aceste întreruperi, care denotă cuvinte modificate, sunt evidențiate pentru a spori vizibilitatea și distincția.
Mai jos, veți găsi un exemplu de document real.
- Primul extras provine dintr-un fișier care a fost verificat folosind OXSICO serviciu de prevenire a plagiatului:
- Al doilea fragment este din documentul sursă original:
După o analiză mai profundă, este evident că partea selectată a documentului a fost parafrazată prin efectuarea următoarelor modificări:
Text original | Text parafrazat | Modificări |
sprijină inovația este de asemenea caracterizată | susține inovația este, în plus, definită | Înlocuire |
cunoștințe economice și sociale, sisteme eficiente | conștientizare economică și societală, organizare eficientă | Înlocuire |
propuneri (idei) | recomandare | Înlocuire, ștergere |
atitudini | posturi | Înlocuire |
succes | câştigător | Înlocuire |
proces (Perenc, Holub-Ivan | proces cognitiv (Perenc, Holub – Ivan | Plus |
pro-inovare | favorabil | Înlocuire |
crearea unui climat | : crearea unei condiții | Înlocuire |
favorabil | prosper | Înlocuire |
dezvoltarea cunoștințelor | conștientizarea dezvoltării | Înlocuire |
Concluzie
Plagiatul, frecvent nedetectat în cazurile de parafrazare, rămâne o preocupare semnificativă în mediul academic. Progresele tehnologice au echipat verificatorii de plagiat cu capacitatea de a identifica în mod eficient conținutul parafrazat. Mai exact, verificatoarele de plagiat detectează parafrazarea prin diverse metode, cum ar fi potrivirea șirurilor, asemănarea cosinusului și analiza n-gramelor. În special, analiza n-gramă se remarcă prin rata sa ridicată de precizie. Aceste progrese reduc substanțial probabilitatea ca materialele plagiate și parafrazate să nu fie detectate, sporind astfel integritatea academică. |