Kaip plagiato tikrintojai nustato perfrazavimą?

()

Plagiatas apima nuopelnų prisiėmimą už kažkieno idėjas, žodžius ar vaizdus – tai laikoma praktika neetiška akademinėje ir profesinėje aplinkoje. Jo gali nepastebėti studentai, kurie gali netyčia perfrazuoti kažkieno žodžius be tinkamo priskyrimo. Kadangi kabutės nenaudojamos, kai kažkas perfrazuojama, tai gali lengvai pabėgti nuo korektorių supratimo ir pereiti prie galutinio juodraščio. Tačiau tai nėra visiškai neįgyvendinama, juolab kad plagiato tikrintojai šiais laikais perfrazavimą aptinka efektyviau.

Aptikti perfrazavimą gali būti sudėtinga užduotis, nes reikia nustatyti tekstų panašumus ir skirtumus. Tolesniuose skyriuose mes pasinersime į išsamią diskusiją apie bendrus metodus ir metodus, naudojamus perfrazavimo atvejams nustatyti.

Kaip plagiato tikrintojai aptinka perfrazavimą: išnagrinėti tinkami metodai

Šiuolaikinėje švietimo aplinkoje plagijavimo tikrinimo priemonės tampa vis pažangesnės ir apima ne tik nukopijuoto teksto žymėjimą, bet ir perfrazuoto turinio aptikimą. Šiame straipsnyje nagrinėjami metodai, leidžiantys šiomis priemonėmis veiksmingai nustatyti perfrazavimą.

1. Stygų derinimas

Šis metodas apima tekstų palyginimą simbolių arba žodžių lygiu, kad būtų galima tiksliai nustatyti atitikmenis. Didelis dviejų tekstų simbolių sekų arba žodžių pasirinkimų panašumas gali reikšti perfrazavimą. Šiose priemonėse naudojami sudėtingi algoritmai, kurie netgi gali atsižvelgti į kontekstinę žodžių reikšmę, todėl nuplagijuotai perfrazuotai medžiagai tampa vis sunkiau nepastebėti.

2. Kosinuso panašumas

Kosinuso panašumas yra vienas iš metodų, kuriais plagiato tikrintojai nustato perfrazavimą. Jis matuoja dviejų tekstų panašumą pagal kampą tarp jų vektorinių vaizdų didelės dimensijos erdvėje. Pateikdami tekstus kaip žodžių dažnių ar įterpimų vektorius, šie įrankiai gali apskaičiuoti kosinuso panašumo balą, kad dar labiau patobulintų jų gebėjimą aptikti perfrazuotą turinį.

3. Žodžių lygiavimo modeliai

Šie modeliai sulygiuoja žodžius ar frazes tarp dviejų tekstų, kad nustatytų jų atitikmenis. Lygindami sulygiuotus segmentus, galite aptikti perfrazavimą pagal suderintų sekų panašumus ir skirtumus.

4. Semantinė analizė

Šis metodas apima žodžių ir frazių reikšmės ir konteksto analizę tekstuose. Tokios technologijos kaip latentinė semantinė analizė (LSA), žodžių įterpimas (pvz., Word2Vec arba GloVe) arba giluminio mokymosi modeliai, tokie kaip BERT, gali užfiksuoti semantinius žodžių ryšius ir nustatyti perfrazavimą pagal jų semantinių vaizdų panašumą.

5. Mašinos mokymas

Prižiūrimi mašininio mokymosi algoritmai gali būti mokomi naudojant pažymėtus perfrazuotų ir neperfrazuotų tekstų porų duomenų rinkinius. Šie modeliai gali išmokti šablonų ir ypatybių, išskiriančių parafrazes, ir gali būti naudojami klasifikuojant naujus teksto atvejus kaip perfrazuotus ar ne.

6. N-gramų analizė

N-gramos yra žodžių grupės, esančios viena šalia kitos. Patikrinus, kaip dažnai šios grupės atsiranda skirtinguose tekstuose ir jas palyginus, galima rasti panašių frazių ar sekų. Jei yra daug panašių modelių, tai gali reikšti, kad tekstas galėjo būti perfrazuotas.

7. Beveik pasikartojantis aptikimas

Paskutinis būdas, kuriuo plagiato tikrintojai efektyviai nustato perfrazavimą.

Beveik pasikartojantys aptikimo algoritmai dažnai naudojami perfrazuojant aptikimą, siekiant tiksliai nustatyti teksto segmentus, kurie yra labai panašūs arba yra beveik identiški. Šie algoritmai yra specialiai sukurti taip, kad atpažintų perfrazuotą turinį, palyginus teksto panašumą detaliu lygiu.

Kokį metodą dažniausiai naudoja plagiato prevencijos programinė įranga?

Profesionalių plagiato prevencijos tarnybų naudojami technologiniai sprendimai paprastai remiasi n-gramų analize. Naudojant n-gramų technologijas, šios paslaugos pasiekia nepaprastai didelį tikslumą. Tai vienas geriausių būdų, kaip plagijavimo tikrintuvai aptinka perfrazavimą, leidžiantį atpažinti ir paryškinti tikslius perrašytus žodžius.

Mechanika, kaip plagiato tikrintojai nustato perfrazavimą

Plagiato prevencijos tarnybos paprastai naudoja pirštų atspaudų ėmimo techniką, kad palygintų dokumentus. Tai apima reikiamų tikrintinų dokumentų n-gramų ištraukimą ir jų palyginimą su visų duomenų bazėse esančių dokumentų n-gramais.

mokiniai-skaito-kaip-plagiatą-tikrina-aptinka-perfrazuoja

Pavyzdys

Tarkime, kad yra sakinys: « Le mont Olympe est la plus haute montagne de Grace. »

Geriausios n-gramų (pavyzdžiui, 3 gramai) šio sakinio dalis bus:

  • Le Mont Olympe
  • Mont Olympe est
  • Olympe est la
  • yra labiausiai
  • la plus haute
  • aukščiausias kalnas
  • haute montagne de
  • Graikijos kalnas

1 atvejis. Pakeitimas

Jei žodis pakeičiamas kitu žodžiu, vis tiek kai kurie iš n-gramų atitiktį ir tolimesne analize galima aptikti žodžio pakeitimą.

Pakeistas sakinys:  « Le kalnai Olympe est la plus haute montagne de Peloponesas. "

Originalus 3 gramai3 gramai pakeisto teksto
Le Mont Olympe
Mont Olympe est
Olympe est la
yra labiausiai
la plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas
Le kalnai "Olympus"
kalnai Olympe est
Olympe est la
yra labiausiai
la plus haute
aukščiausias kalnas
haute montagne de
Montagne de Peloponesas

2 atvejis. Pakeista žodžių (arba sakinių, pastraipų) tvarka

Kai pakeičiama sakinio tvarka, vis tiek sutampa kai kurie 3 gramai, kad būtų galima aptikti pasikeitimą.

Pakeistas sakinys: « La plus haute montagne de Grace est Le Mont Olympe. »

Originalus 3 gramai3 gramai pakeisto teksto
Le Mont Olympe
Mont Olympe est
Olympe est la
yra labiausiai
la plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas
La plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas
de Grèce est
Graikija est Le
est Le mont
Le Mont Olympe

3 atvejis. Pridėta naujų žodžių

Kai pridedami nauji žodžiai, vis dar yra 3 gramai, kurie atitinka, kad būtų galima aptikti pasikeitimą.

Pakeistas sakinys: « Le mont Olympe est iš tolo la plus haute montagne de Grace. »

Originalus 3 gramai3 gramai pakeisto teksto
Le Mont Olympe
Mont Olympe est
Olympe est la
yra labiausiai
la plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas
Le Mont Olympe
Mont Olympe est
Olympe est de
est de loin
toli
nugarinė la plius
la plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas

4 atvejis. Išbraukti kai kurie žodžiai

Kai žodis pašalinamas, vis dar yra 3 gramai, kurie atitinka, todėl galima aptikti pokytį.

Pakeistas sakinys: „L'Olympe est la plus haute montagne de Grace. »

Originalus 3 gramai3 gramai pakeisto teksto
Le Mont Olympe
Mont Olympe est
Olympe est la
yra labiausiai
la plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas
L'Olympe est la
yra labiausiai
la plus haute
aukščiausias kalnas
haute montagne de
Graikijos kalnas

Realaus pasaulio pavyzdys

Pabaigus tikrinimą faktiniame dokumente, perfrazuoti skyriai dažnai atpažįstami per pertrauktus žymėjimus. Šie pertraukimai, žymintys pakeistus žodžius, yra paryškinti, siekiant pagerinti matomumą ir skirtumą.

Žemiau rasite tikrojo dokumento pavyzdį.

  • Pirmoji ištrauka yra iš failo, kuris buvo patikrintas naudojant OXSICO Plagiato prevencijos tarnyba:
  • Antroji ištrauka yra iš pirminio šaltinio dokumento:

Atlikus gilesnę analizę, akivaizdu, kad pasirinkta dokumento dalis buvo perfrazuota, atlikus šiuos pakeitimus:

Originalus tekstasPerfrazuotas tekstasPokyčiai
remia inovacijas taip pat būdingas naujovių atsarginės kopijos yra be to apibrėžtosPakeitimas
ekonominių ir socialinių žinių, efektyvių sistemų ekonominis ir visuomeninis sąmoningumas, efektyvi organizacijaPakeitimas
pasiūlymai (idėjos)rekomendacijaPakeitimas, ištrynimas
požiūrispozosPakeitimas
sėkmėnugalėtojasPakeitimas
procesas (Perenc, Holub-Ivanpažinimo procesas (Perenc, Holub – IvanPapildymas
už naujovespalankusPakeitimas
sukuriant klimatą: sąlygos sudarymasPakeitimas
palankusklestiPakeitimas
plėtoti žiniasvystymosi sąmoningumasPakeitimas

Išvada

Plagiatas, dažnai nepastebimas perfrazavimo atvejais, tebėra didelis susirūpinimas akademinėje bendruomenėje. Dėl technologijų pažangos plagijavimo tikrintuvai turi galimybę efektyviai atpažinti perfrazuotą turinį. Tiksliau, plagiato tikrintuvai aptinka perfrazavimą įvairiais metodais, pvz., eilučių atitikimu, kosinuso panašumu ir n-gramų analize. Pažymėtina, kad n-gramų analizė išsiskiria dideliu tikslumu. Šios pažangos iš esmės sumažina tikimybę, kad nuplagijuota ir perfrazuota medžiaga bus nepastebėta, taip padidinant akademinį vientisumą.

Kaip naudingas šis pranešimas?

Spustelėkite žvaigždę, kad įvertintumėte!

Vidutinis įvertinimas / 5. Balsų skaičius:

Kol kas nėra balsų! Būk pirmasis įvertinęs šį įrašą.

Apgailestaujame, kad šis pranešimas jums nebuvo naudingas!

Pagerinkime šį įrašą!

Papasakokite, kaip galime pagerinti šį įrašą?