Kako kontrolori plagijata otkrivaju parafraziranje?

how-do-plagiarism-checkers-detect-parafrazing
()

Plagijat uključuje preuzimanje zasluga za tuđe ideje, riječi ili slike, što je praksa koja se razmatra neetično u akademskom i profesionalnom okruženju. To može proći nezapaženo od strane učenika koji slučajno mogu preformulisati tuđe riječi bez odgovarajućeg pripisivanja. Budući da se navodnici ne koriste kada se nešto parafrazira, lako može pobjeći od ruke lektora i preći u konačni nacrt. Međutim, to nije sasvim neostvarivo, pogotovo zato što kontrolori plagijata danas efikasnije detektuju parafraziranje.

Otkrivanje parafraziranja može biti izazovan zadatak, jer uključuje prepoznavanje sličnosti i razlika između tekstova. U narednim poglavljima ući ćemo u sveobuhvatnu raspravu o uobičajenim metodama i tehnikama koje se koriste za uočavanje slučajeva parafraziranja.

Kako kontrolori plagijata otkrivaju parafraziranje: istražene odgovarajuće metode

U današnjem obrazovnom okruženju, alati za provjeru plagijata postali su sve napredniji, nadilazeći samo označavanje kopiranog teksta do otkrivanja parafraziranog sadržaja. Ovaj članak istražuje metode koje omogućavaju ovim alatima da efikasno identifikuju parafraziranje.

plagijat-provjera-otkrivanje-parafraziranje

1. Podudaranje nizova

Ova metoda uključuje poređenje tekstova na nivou znakova ili riječi kako bi se utvrdila tačna podudaranja. Visok stepen sličnosti u sekvencama znakova ili izboru riječi između dva teksta mogao bi signalizirati parafraziranje. Ovi alati koriste složene algoritme koji čak mogu uzeti u obzir kontekstualno značenje riječi, što čini sve težim da plagirani, parafrazirani materijal ostane neotkriven.

2. Kosinusna sličnost

Kosinusna sličnost je jedna od metoda pomoću kojih kontrolori plagijata otkrivaju parafraziranje. On mjeri sličnost između dva teksta na osnovu ugla između njihovih vektorskih reprezentacija u visokodimenzionalnom prostoru. Predstavljajući tekstove kao vektore frekvencije riječi ili ugradnje, ovi alati mogu izračunati kosinusni rezultat sličnosti kako bi dodatno poboljšali svoju sposobnost otkrivanja parafraziranog sadržaja.

3. Modeli poravnanja riječi

Ovi modeli usklađuju riječi ili fraze između dva teksta kako bi identificirali njihovu korespondenciju. Upoređujući poravnate segmente, možete otkriti parafraziranje na osnovu sličnosti i razlika u podudarnim sekvencama.

4. Semantička analiza

Ovaj pristup uključuje analizu značenja i konteksta riječi i fraza u tekstovima. Tehnike poput latentne semantičke analize (LSA), ugrađivanja riječi (kao što su Word2Vec ili GloVe) ili modeli dubokog učenja kao što je BERT mogu uhvatiti semantičke odnose između riječi i identificirati parafraziranje na osnovu sličnosti njihovih semantičkih reprezentacija.

5. Mašinsko učenje

Nadzirani algoritmi mašinskog učenja mogu se trenirati na označenim skupovima podataka parafraziranih i neparafraziranih parova tekstova. Ovi modeli mogu naučiti obrasce i karakteristike koje razlikuju parafraze i mogu se koristiti za klasifikaciju novih instanci teksta kao parafraziranih ili ne.

6. Analiza N-grama

N-grami su grupe riječi koje se nalaze jedna pored druge. Kada provjerite koliko se često ove grupe pojavljuju u različitim tekstovima i uporedite ih, možete pronaći slične fraze ili sekvence. Ako postoji mnogo sličnih obrazaca, to bi moglo značiti da je tekst možda parafraziran.

7. Otkrivanje skoro duplikata

Posljednji način na koji provjere plagijata efikasno otkrivaju parafraziranje.

Algoritmi za detekciju skoro duplikata se često koriste u parafraziranju detekcije kako bi se precizirali segmenti teksta koji pokazuju visok stepen sličnosti ili su skoro identični. Ovi algoritmi su posebno napravljeni da prepoznaju parafrazirani sadržaj kroz poređenje sličnosti teksta na detaljnom nivou.

Koju metodu obično koristi softver za prevenciju plagijata?

Tehnološka rješenja koja koriste profesionalne službe za prevenciju plagijata obično se oslanjaju na n-gram analizu. Koristeći tehnologiju zasnovanu na n-gramu, ove usluge postižu izuzetno visoku stopu preciznosti. Ovo je jedan od najboljih načina na koji kontrolori plagijata otkrivaju parafraziranje, omogućavajući identifikaciju i isticanje tačnih riječi koje su prepisane.

Mehanizam načina na koji kontrolori plagijata otkrivaju parafraziranje

Službe za prevenciju plagijata obično koriste tehniku ​​otiska prsta za upoređivanje dokumenata. Ovo uključuje izdvajanje potrebnih n-grama iz dokumenata koji se verificiraju i njihovo poređenje sa n-gramima svih dokumenata u njihovim bazama podataka.

studenti-čitanje-kako-raditi-plagijat-provjere-otkrivati-parafrazirati

primjer

Recimo da postoji rečenica: « Le mont Olympe est la plus haute montagne de Grèce. »

The n-grama (na primjer 3 grama) ove rečenice će biti:

  • Le mont Olympe
  • mont Olympe est
  • Olympe est la
  • je najviše
  • la plus haute
  • najviša planina
  • haute montagne de
  • montagne de Grèce

Slučaj 1. Zamjena

Ako je riječ zamijenjena drugom riječju, još uvijek neka od n-grama podudaranje i moguće je detektirati zamjenu riječi daljom analizom.

Promijenjena rečenica:  "The planina Olympe est la plus haute montagne de Péloponnèse. »

Original 3 grama3 grama promijenjenog teksta
Le mont Olympe
mont Olympe est
Olympe est la
je najviše
la plus haute
najviša planina
haute montagne de
montagne de Grèce
Le planina Olimp
planina Olympe est
Olympe est la
je najviše
la plus haute
najviša planina
haute montagne de
Montagne de Péloponnèse

Slučaj 2. Promijenjen redoslijed riječi (ili rečenica, pasusa)

Kada se promijeni redoslijed rečenice, još uvijek se poklapaju nekih 3 grama tako da je moguće uočiti promjenu.

Promijenjena rečenica: « La plus haute montagne de Grèce est Le mont Olympe. »

Original 3 grama3 grama promijenjenog teksta
Le mont Olympe
mont Olympe est
Olympe est la
je najviše
la plus haute
najviša planina
haute montagne de
montagne de Grèce
La plus haute
najviša planina
haute montagne de
montagne de Grèce
de Grèce est
Grèce est Le
est Le mont
Le mont Olympe

Slučaj 3. Dodane nove riječi

Kada se dodaju nove riječi, još uvijek ima nekih 3 grama koji se podudaraju tako da je moguće otkriti promjenu.

Promijenjena rečenica: « Le mont Olympe est izdaleka la plus haute montagne de Grèce. »

Original 3 grama3 grama promijenjenog teksta
Le mont Olympe
mont Olympe est
Olympe est la
je najviše
la plus haute
najviša planina
haute montagne de
montagne de Grèce
Le mont Olympe
mont Olympe est
Olympe est de
est de loin
daleko
loin la plus
la plus haute
najviša planina
haute montagne de
montagne de Grèce

Slučaj 4. Izbrisane neke riječi

Kada se riječ ukloni, ima još nekih 3 grama koji se podudaraju tako da je moguće otkriti promjenu.

Promijenjena rečenica: « L'Olympe est la plus haute montagne de Grèce. »

Original 3 grama3 grama promijenjenog teksta
Le mont Olympe
mont Olympe est
Olympe est la
je najviše
la plus haute
najviša planina
haute montagne de
montagne de Grèce
L'Olympe est la
je najviše
la plus haute
najviša planina
haute montagne de
montagne de Grèce

Primjer iz stvarnog svijeta

Po završetku verifikacije u stvarnom dokumentu, parafrazirani delovi se često identifikuju kroz isprekidane oznake. Ovi prekidi, koji označavaju promijenjene riječi, su istaknuti kako bi se poboljšala vidljivost i razlikovanje.

U nastavku ćete pronaći primjer stvarnog dokumenta.

  • Prvi izvod dolazi iz datoteke koja je provjerena pomoću OXSICO služba za prevenciju plagijata:
  • Drugi izvod je iz originalnog izvornog dokumenta:
plagijat-prijava

Nakon dublje analize vidljivo je da je odabrani dio dokumenta parafraziran unošenjem sljedećih izmjena:

Izvorni tekstParafrazirani tekstpromjene
također je karakterizirana podrška inovacijama podržava inovacije je pored toga definisanzamjena
ekonomsko i socijalno znanje, efikasni sistemi ekonomska i društvena svijest, efikasna organizacijazamjena
prijedlozi (ideje)preporukaZamjena, brisanje
stavovipoložajizamjena
uspjehpobjednikzamjena
proces (Perenc, Holub-Ivankognitivni proces (Perenc, Holub – Ivandodatak
pro-inovacijapovoljanzamjena
stvaranje klime: stvaranje uslovazamjena
povoljanprosperitetnozamjena
razvijanje znanjarazvoj svijestizamjena

zaključak

Plagijat, koji se često ne otkriva u slučajevima parafraziranja, ostaje značajan problem u akademskoj zajednici. Tehnološki napredak je opremio uređaje za provjeru plagijata sposobnošću da efikasno identifikuju parafrazirani sadržaj. Konkretno, alati za provjeru plagijata otkrivaju parafraziranje kroz različite metode kao što su podudaranje nizova, kosinusna sličnost i analiza n-grama. Značajno je da se n-gram analiza ističe svojom visokom stopom preciznosti. Ova poboljšanja značajno smanjuju vjerovatnoću da plagirani i parafrazirani materijal ostane neotkriven, čime se povećava akademski integritet.

Koliko je ovaj post koristan?

Kliknite na zvezdu da biste je ocenili!

Prosečna ocena / 5. Broj glasova:

Za sada nema glasova! Budite prvi koji će ocijeniti ovaj post.

Žao nam je što vam ovaj post nije bio koristan!

Dopustite nam da poboljšamo ovaj post!

Recite nam kako možemo poboljšati ovaj post?