Kako preverjevalci plagiatorstva zaznajo parafraziranje?

how-do-plagiatorism-checkers-detect-paraphrazing
()

Plagiatorstvo vključuje pripisovanje zaslug za ideje, besede ali slike nekoga drugega, upoštevano prakso neetično v akademskem in poklicnem okolju. Učenci lahko ostanejo neopaženi, če lahko pomotoma preoblikujejo besede nekoga drugega brez ustreznega pripisa. Ker se narekovaji ne uporabljajo, ko je nekaj parafrazirano, lahko zlahka uide lektorju in gre v končni osnutek. Ni pa povsem nedosegljivo, še posebej, ker dandanes pregledovalci plagiatorstva učinkoviteje zaznavajo parafraziranje.

Odkrivanje parafraziranja je lahko zahtevna naloga, saj vključuje prepoznavanje podobnosti in razlik med besedili. V naslednjih razdelkih se bomo poglobili v obsežno razpravo o običajnih metodah in tehnikah, ki se uporabljajo za razločevanje primerov parafraziranja.

Kako preverjevalci plagiatorstva zaznajo parafraziranje: Raziskane primerne metode

V današnjem izobraževalnem prostoru postajajo pregledovalci plagiatorstva vedno bolj napredni, saj presegajo samo označevanje kopiranega besedila in zaznavajo tudi parafrazirano vsebino. Ta članek raziskuje metode, ki tem orodjem omogočajo učinkovito prepoznavanje parafraziranja.

plagiatorstvo-preverjevalci-odkrivanje-parafraziranje

1. Ujemanje nizov

Ta metoda vključuje primerjavo besedil na ravni znakov ali besed, da se določi natančna ujemanja. Visoka stopnja podobnosti v zaporedju znakov ali izbiri besed med dvema besediloma bi lahko pomenila parafraziranje. Ta orodja uporabljajo zapletene algoritme, ki lahko upoštevajo celo kontekstualni pomen besed, zaradi česar plagiatsko, parafrazirano gradivo vedno težje ostane neodkrito.

2. Kosinus podobnosti

Kosinusna podobnost je ena od metod, s katero preverjalci plagiatorstva zaznajo parafraziranje. Meri podobnost med dvema besediloma na podlagi kota med njunima vektorskima predstavitvama v visokodimenzionalnem prostoru. S predstavitvijo besedil kot vektorjev besednih frekvenc ali vdelav lahko ta orodja izračunajo rezultat kosinusne podobnosti, da dodatno izboljšajo svojo sposobnost zaznavanja parafrazirane vsebine.

3. Modeli za poravnavo besed

Ti modeli poravnajo besede ali besedne zveze med dvema besediloma, da prepoznajo njuno ujemanje. S primerjavo poravnanih segmentov lahko zaznate parafraziranje na podlagi podobnosti in razlik v ujemajočih se sekvencah.

4. Semantična analiza

Ta pristop vključuje analizo pomena in konteksta besed in fraz v besedilih. Tehnike, kot je latentna semantična analiza (LSA), vdelave besed (kot sta Word2Vec ali GloVe) ali modeli globokega učenja, kot je BERT, lahko zajamejo semantična razmerja med besedami in prepoznajo parafraziranje na podlagi podobnosti njihovih semantičnih predstavitev.

5. Strojno učenje

Nadzorovane algoritme strojnega učenja je mogoče učiti na označenih naborih podatkov parafraziranih in neparafraziranih parov besedil. Ti modeli se lahko naučijo vzorcev in funkcij, ki razlikujejo parafraze, in jih je mogoče uporabiti za razvrščanje novih primerkov besedila kot parafraziranih ali ne.

6. N-gramska analiza

N-grami so skupine besed, ki so ena poleg druge. Ko preverite, kako pogosto se te skupine pojavljajo v različnih besedilih in jih primerjate, lahko najdete podobne fraze ali zaporedja. Če obstaja veliko podobnih vzorcev, lahko to pomeni, da je bilo besedilo morda parafrazirano.

7. Zaznavanje skoraj dvojnikov

Zadnji način, na katerega preverjalniki plagiatorstva učinkovito zaznajo parafraziranje.

Algoritmi za zaznavanje skoraj dvojnikov se pogosto uporabljajo pri zaznavanju parafraziranja, da natančno določijo segmente besedila, ki kažejo visoko stopnjo podobnosti ali so skoraj enaki. Ti algoritmi so izdelani posebej za prepoznavanje parafrazirane vsebine s primerjavo podobnosti besedila na podrobni ravni.

Katero metodo običajno uporablja programska oprema za preprečevanje plagiatorstva?

Tehnološke rešitve, ki jih uporabljajo profesionalne službe za preprečevanje plagiatorstva, se običajno zanašajo na analizo n-gramov. Z uporabo tehnologije, ki temelji na n-gramih, te storitve dosegajo izjemno visoko stopnjo natančnosti. To je eden od najboljših načinov, kako preverjevalci plagiatorstva zaznajo parafraziranje, kar omogoča prepoznavanje in poudarjanje natančnih besed, ki so bile prepisane.

Mehanika, kako preverjevalci plagiatorstva zaznajo parafraziranje

Storitve za preprečevanje plagiatorstva običajno uporabljajo tehniko prstnih odtisov za primerjavo dokumentov. To vključuje pridobivanje potrebnih n-gramov iz dokumentov, ki jih je treba preveriti, in njihovo primerjavo z n-grami vseh dokumentov v njihovih zbirkah podatkov.

učenci-berejo-kako-preverjevalci-plagiatorstva-zaznajo-parafraziranje

Primer

Recimo, da obstaja stavek: « Le mont Olympe est la plus haute montagne de Grèce. »

O n-gramov (na primer 3 grame) tega stavka bo:

  • Le Mont Olympe
  • mont Olympe est
  • Olympe est la
  • je največ
  • la plus haute
  • najvišja gora
  • haute montagne de
  • montagne de Grèce

Primer 1. Zamenjava

Če je beseda zamenjana z drugo besedo, še vedno nekaj od n-gramov ujemanje in je z nadaljnjo analizo možno odkriti besedno zamenjavo.

Spremenjen stavek:  « Le Gore Olympe est la plus haute montagne de Peloponez. "

Original 3-gramski3-grami spremenjenega besedila
Le Mont Olympe
mont Olympe est
Olympe est la
je največ
la plus haute
najvišja gora
haute montagne de
montagne de Grèce
Le Gore Olympus
Gore Olympe est
Olympe est la
je največ
la plus haute
najvišja gora
haute montagne de
Montagne de Peloponez

Primer 2. Spremenjen vrstni red besed (ali stavkov, odstavkov)

Ko se vrstni red stavka spremeni, se nekaj 3-gramov še vedno ujema, tako da je mogoče zaznati spremembo.

Spremenjen stavek: « La plus haute montagne de Grèce est Le mont Olympe. »

Original 3-gramski3-grami spremenjenega besedila
Le Mont Olympe
mont Olympe est
Olympe est la
je največ
la plus haute
najvišja gora
haute montagne de
montagne de Grèce
La plus haute
najvišja gora
haute montagne de
montagne de Grèce
de Grèce est
Grèce est Le
est Le mont
Le Mont Olympe

Primer 3. Dodane nove besede

Ko so dodane nove besede, je še nekaj 3-gramov, ki se ujemajo, tako da je mogoče zaznati spremembo.

Spremenjen stavek: « Le mont Olympe est od daleč la plus haute montagne de Grèce. »

Original 3-gramski3-grami spremenjenega besedila
Le Mont Olympe
mont Olympe est
Olympe est la
je največ
la plus haute
najvišja gora
haute montagne de
montagne de Grèce
Le Mont Olympe
mont Olympe est
Olympe est de
est de loin
daleč stran
hrbet la plus
la plus haute
najvišja gora
haute montagne de
montagne de Grèce

Primer 4. Izbrisanih nekaj besed

Ko je beseda odstranjena, je še nekaj 3-gramov, ki se ujemajo, tako da je mogoče zaznati spremembo.

Spremenjen stavek: « L'Olympe est la plus haute montagne de Grèce. »

Original 3-gramski3-grami spremenjenega besedila
Le Mont Olympe
mont Olympe est
Olympe est la
je največ
la plus haute
najvišja gora
haute montagne de
montagne de Grèce
L'Olympe est la
je največ
la plus haute
najvišja gora
haute montagne de
montagne de Grèce

Primer iz resničnega sveta

Po zaključku preverjanja v dejanskem dokumentu so parafrazirani odseki pogosto prepoznani s prekinjenimi oznakami. Te prekinitve, ki označujejo spremenjene besede, so poudarjene, da izboljšajo vidnost in razlikovanje.

Spodaj boste našli primer dejanskega dokumenta.

  • Prvi odlomek je iz datoteke, ki je bila preverjena z uporabo OXSICO storitev za preprečevanje plagiatorstva:
  • Drugi odlomek je iz prvotnega izvornega dokumenta:
plagiat-prijava

Po poglobljeni analizi je razvidno, da je bil izbrani del dokumenta parafraziran z naslednjimi spremembami:

Izvirno besediloParafrazirano besediloSpremembe
podpira inovativnost podpira inovativnost, je poleg tega opredeljenaZamenjava
ekonomsko in družbeno znanje, učinkoviti sistemi ekonomska in družbena ozaveščenost, učinkovita organizacijaZamenjava
predlogi (ideje)priporočiloZamenjava, izbris
odnosdržeZamenjava
uspehZmagovalecZamenjava
proces (Perenc, Holub-Ivankognitivni proces (Perenc, Holub – IvanPoleg tega
za inovacijeugodnaZamenjava
ustvarjanje klime: ustvarjanje stanjaZamenjava
ugodnauspešnoZamenjava
razvijanje znanjarazvojna zavestZamenjava

zaključek

Plagiatorstvo, ki ga v primerih parafraziranja pogosto ne odkrijejo, ostaja velik problem v akademskem svetu. Tehnološki napredek je opremil preverjalce plagiatorstva z možnostjo učinkovitega prepoznavanja parafrazirane vsebine. Natančneje, preverjalniki plagiatorstva zaznajo parafraziranje z različnimi metodami, kot je ujemanje nizov, kosinusna podobnost in analiza n-gramov. Predvsem n-gramska analiza izstopa po visoki stopnji natančnosti. Ti napredki bistveno zmanjšajo verjetnost, da plagiat in parafrazirano gradivo ostane neodkrito, s čimer se poveča akademska integriteta.

Kako koristna je bila ta objava?

Kliknite na zvezdico, da jo ocenite!

Povprečna ocena / 5. Število glasov:

Zaenkrat še ni glasov! Bodi prvi, ki bo ocenil to objavo.

Žal nam je, da vam ta objava ni bila koristna!

Dovolite nam, da izboljšamo to objavo!

Povejte nam, kako lahko izboljšamo to objavo?