Plagijat uključuje preuzimanje zasluga za tuđe ideje, riječi ili slike, što se smatra praksom neetički u akademskim i profesionalnim okruženjima. To mogu proći nezapaženo od strane učenika koji mogu slučajno preformulirati tuđe riječi bez odgovarajućeg pripisivanja. Budući da se navodnici ne koriste kada se nešto parafrazira, to lako može izbjeći dohvat lektora i otići u konačni nacrt. Međutim, to nije posve neizvedivo, pogotovo zato što alati za provjeru plagijata u današnje vrijeme učinkovitije otkrivaju parafraziranje.
Otkrivanje parafraziranja može biti izazovan zadatak jer uključuje prepoznavanje sličnosti i razlika među tekstovima. U sljedećim odjeljcima zadubit ćemo se u opsežnu raspravu o uobičajenim metodama i tehnikama koje se koriste za razaznavanje slučajeva parafraziranja.
Kako alati za provjeru plagijata otkrivaju parafraziranje: istražene prikladne metode
U današnjem obrazovnom okruženju, alati za provjeru plagijata postali su sve napredniji, nadilazeći samo označavanje kopiranog teksta do otkrivanja parafraziranog sadržaja. Ovaj članak istražuje metode koje ovim alatima omogućuju učinkovito prepoznavanje parafraziranja.
1. Slaganje nizova
Ova metoda uključuje usporedbu tekstova na razini znakova ili riječi kako bi se odredila točna podudaranja. Visok stupanj sličnosti u nizu znakova ili odabiru riječi između dva teksta mogao bi signalizirati parafraziranje. Ovi alati koriste složene algoritme koji čak mogu uzeti u obzir kontekstualno značenje riječi, zbog čega je sve teže da plagirani, parafrazirani materijal ostane neotkriven.
2. Kosinusna sličnost
Kosinusna sličnost jedna je od metoda pomoću koje alati za provjeru plagijata otkrivaju parafraziranje. Mjeri sličnost između dva teksta na temelju kuta između njihovih vektorskih prikaza u visokodimenzionalnom prostoru. Predstavljajući tekstove kao vektore učestalosti riječi ili umetanja, ovi alati mogu izračunati ocjenu kosinusne sličnosti kako bi dodatno poboljšali svoju sposobnost otkrivanja parafraziranog sadržaja.
3. Modeli poravnanja riječi
Ovi modeli usklađuju riječi ili fraze između dva teksta kako bi identificirali njihovu korespondenciju. Uspoređujući poravnate segmente, možete otkriti parafraziranje na temelju sličnosti i razlika u podudarnim sekvencama.
4. Semantička analiza
Ovaj pristup uključuje analizu značenja i konteksta riječi i fraza u tekstovima. Tehnike poput latentne semantičke analize (LSA), ugrađivanja riječi (kao što su Word2Vec ili GloVe) ili modela dubokog učenja poput BERT-a mogu uhvatiti semantičke odnose između riječi i identificirati parafraziranje na temelju sličnosti njihovih semantičkih prikaza.
5. Strojno učenje
Nadzirani algoritmi strojnog učenja mogu se trenirati na označenim skupovima podataka parafraziranih i neparafraziranih parova tekstova. Ovi modeli mogu naučiti obrasce i značajke koje razlikuju parafraze i mogu se koristiti za klasificiranje novih instanci teksta kao parafraziranih ili ne.
6. Analiza N-grama
N-grami su skupine riječi koje su jedna do druge. Kada provjerite koliko se često te skupine pojavljuju u različitim tekstovima i usporedite ih, možete pronaći slične fraze ili nizove. Ako postoji mnogo sličnih obrazaca, to bi moglo značiti da je tekst možda parafraziran.
7. Otkrivanje skoro duplikata
Posljednji način na koji alati za provjeru plagijata učinkovito otkrivaju parafraziranje.
Algoritmi za otkrivanje gotovo duplikata često se koriste u otkrivanju parafraziranja kako bi se odredili segmenti teksta koji pokazuju visok stupanj sličnosti ili su gotovo identični. Ovi su algoritmi posebno izrađeni za prepoznavanje parafraziranog sadržaja kroz usporedbu sličnosti teksta na detaljnoj razini.
Koju metodu obično koristi softver za sprječavanje plagijata?
Tehnološka rješenja koja koriste profesionalne službe za sprječavanje plagijata obično se oslanjaju na analizu n-grama. Korištenjem tehnologije temeljene na n-gramima, ove usluge postižu nevjerojatno visoku stopu preciznosti. Ovo je jedan od najboljih načina na koji alati za provjeru plagijata otkrivaju parafraziranje, omogućujući prepoznavanje i isticanje točnih riječi koje su prepisane.
Mehanika kako alati za provjeru plagijata otkrivaju parafraziranje
Službe za sprječavanje plagijata obično koriste tehniku otiska prsta za usporedbu dokumenata. To uključuje izdvajanje potrebnih n-grama iz dokumenata koji se verificiraju i njihovu usporedbu s n-gramima svih dokumenata u njihovim bazama podataka.
Primjer
Recimo da postoji rečenica: « Le mont Olympe est la plus haute montagne de Grèce. »
Korištenje električnih romobila ističe n-grama (na primjer 3 grama) ove rečenice bit će:
- Mont Olympe
- mont Olympe est
- Olympe est la
- je najviše
- la plus haute
- najviša planina
- haute montagne de
- montagne de Grèce
Slučaj 1. Zamjena
Ako je riječ zamijenjena drugom riječi, još uvijek neke od n-grama podudaraju te je daljnjom analizom moguće otkriti zamjenu riječi.
Promijenjena rečenica: „The planine Olympe est la plus haute montagne de Peloponez, "
Original 3 grama | 3-grama promijenjenog teksta |
Mont Olympe mont Olympe est Olympe est la je najviše la plus haute najviša planina haute montagne de montagne de Grèce | Le planine Olimp planine Olympe est Olympe est la je najviše la plus haute najviša planina haute montagne de Montagne de Peloponez |
Slučaj 2. Promijenjen redoslijed riječi (ili rečenica, odlomaka)
Kada se promijeni redoslijed rečenice, ipak se poklapaju neka 3 grama pa je moguće detektirati promjenu.
Promijenjena rečenica: « La plus haute montagne de Grèce est Le mont Olympe. »
Original 3 grama | 3-grama promijenjenog teksta |
Mont Olympe mont Olympe est Olympe est la je najviše la plus haute najviša planina haute montagne de montagne de Grèce | La plus haute najviša planina haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Mont Olympe |
Slučaj 3. Dodane nove riječi
Kada se nove riječi dodaju, još uvijek postoje neka 3 grama koja se podudaraju tako da je moguće otkriti promjenu.
Promijenjena rečenica: « Le mont Olympe est izdaleka la plus haute montagne de Grèce. »
Original 3 grama | 3-grama promijenjenog teksta |
Mont Olympe mont Olympe est Olympe est la je najviše la plus haute najviša planina haute montagne de montagne de Grèce | Mont Olympe mont Olympe est Olympe est de est de loin daleko hrbat la plus la plus haute najviša planina haute montagne de montagne de Grèce |
Slučaj 4. Izbrisane neke riječi
Kada se riječ ukloni, još uvijek postoje neka 3 grama koja se podudaraju tako da je moguće otkriti promjenu.
Promijenjena rečenica: « L'Olympe est la plus haute montagne de Grèce. »
Original 3 grama | 3-grama promijenjenog teksta |
Mont Olympe mont Olympe est Olympe est la je najviše la plus haute najviša planina haute montagne de montagne de Grèce | L'Olympe est la je najviše la plus haute najviša planina haute montagne de montagne de Grèce |
Primjer iz stvarnog svijeta
Nakon završetka provjere u stvarnom dokumentu, parafrazirani dijelovi često se identificiraju kroz isprekidane oznake. Ovi prekidi, koji označavaju promijenjene riječi, istaknuti su kako bi se poboljšala vidljivost i razlikovanje.
U nastavku ćete pronaći primjer stvarnog dokumenta.
- Prvi izvadak dolazi iz datoteke koja je verificirana pomoću OXSICO služba za sprječavanje plagiranja:
- Drugi je izvadak iz izvornog dokumenta:
Nakon dublje analize vidljivo je da je odabrani dio dokumenta parafraziran uvođenjem sljedećih izmjena:
Izvorni tekst | Parafrazirani tekst | Promjene |
podržava inovacije je također karakteriziran | podupire inovacije osim što je definirano | Zamjena |
ekonomska i društvena znanja, učinkoviti sustavi | ekonomska i društvena svijest, učinkovita organizacija | Zamjena |
prijedlozi (ideje) | preporuka | Zamjena, brisanje |
stavovi | položaji | Zamjena |
uspjeh | pobjednik | Zamjena |
proces (Perenc, Holub-Ivan | kognitivni proces (Perenc, Holub – Ivan | Dodatak |
za inovacije | povoljan | Zamjena |
stvaranje klime | : stvaranje stanja | Zamjena |
povoljan | uspješan | Zamjena |
razvijanje znanja | razvoj svijesti | Zamjena |
Zaključak
Plagijat, koji se često ne otkrije u slučajevima parafraziranja, ostaje značajan problem u akademskoj zajednici. Tehnološki napredak opremio je uređaje za provjeru plagijata sposobnošću učinkovite identifikacije parafraziranog sadržaja. Konkretno, alati za provjeru plagijata otkrivaju parafraziranje različitim metodama kao što su podudaranje nizova, sličnost kosinusa i analiza n-grama. Značajno, analiza n-grama ističe se svojom visokom stopom preciznosti. Ova poboljšanja značajno smanjuju vjerojatnost da plagirani i parafrazirani materijal ostane neotkriven, čime se povećava akademski integritet. |