Plagiatas apima nuopelnų prisiėmimą už kažkieno idėjas, žodžius ar vaizdus – tai laikoma praktika neetiška akademinėje ir profesinėje aplinkoje. Jo gali nepastebėti studentai, kurie gali netyčia perfrazuoti kažkieno žodžius be tinkamo priskyrimo. Kadangi kabutės nenaudojamos, kai kažkas perfrazuojama, tai gali lengvai pabėgti nuo korektorių supratimo ir pereiti prie galutinio juodraščio. Tačiau tai nėra visiškai neįgyvendinama, juolab kad plagiato tikrintojai šiais laikais perfrazavimą aptinka efektyviau.
Aptikti perfrazavimą gali būti sudėtinga užduotis, nes reikia nustatyti tekstų panašumus ir skirtumus. Tolesniuose skyriuose mes pasinersime į išsamią diskusiją apie bendrus metodus ir metodus, naudojamus perfrazavimo atvejams nustatyti.
Kaip plagiato tikrintojai aptinka perfrazavimą: išnagrinėti tinkami metodai
Šiuolaikinėje švietimo aplinkoje plagijavimo tikrinimo priemonės tampa vis pažangesnės ir apima ne tik nukopijuoto teksto žymėjimą, bet ir perfrazuoto turinio aptikimą. Šiame straipsnyje nagrinėjami metodai, leidžiantys šiomis priemonėmis veiksmingai nustatyti perfrazavimą.
1. Stygų derinimas
Šis metodas apima tekstų palyginimą simbolių arba žodžių lygiu, kad būtų galima tiksliai nustatyti atitikmenis. Didelis dviejų tekstų simbolių sekų arba žodžių pasirinkimų panašumas gali reikšti perfrazavimą. Šiose priemonėse naudojami sudėtingi algoritmai, kurie netgi gali atsižvelgti į kontekstinę žodžių reikšmę, todėl nuplagijuotai perfrazuotai medžiagai tampa vis sunkiau nepastebėti.
2. Kosinuso panašumas
Kosinuso panašumas yra vienas iš metodų, kuriais plagiato tikrintojai nustato perfrazavimą. Jis matuoja dviejų tekstų panašumą pagal kampą tarp jų vektorinių vaizdų didelės dimensijos erdvėje. Pateikdami tekstus kaip žodžių dažnių ar įterpimų vektorius, šie įrankiai gali apskaičiuoti kosinuso panašumo balą, kad dar labiau patobulintų jų gebėjimą aptikti perfrazuotą turinį.
3. Žodžių lygiavimo modeliai
Šie modeliai sulygiuoja žodžius ar frazes tarp dviejų tekstų, kad nustatytų jų atitikmenis. Lygindami sulygiuotus segmentus, galite aptikti perfrazavimą pagal suderintų sekų panašumus ir skirtumus.
4. Semantinė analizė
Šis metodas apima žodžių ir frazių reikšmės ir konteksto analizę tekstuose. Tokios technologijos kaip latentinė semantinė analizė (LSA), žodžių įterpimas (pvz., Word2Vec arba GloVe) arba giluminio mokymosi modeliai, tokie kaip BERT, gali užfiksuoti semantinius žodžių ryšius ir nustatyti perfrazavimą pagal jų semantinių vaizdų panašumą.
5. Mašinos mokymas
Prižiūrimi mašininio mokymosi algoritmai gali būti mokomi naudojant pažymėtus perfrazuotų ir neperfrazuotų tekstų porų duomenų rinkinius. Šie modeliai gali išmokti šablonų ir ypatybių, išskiriančių parafrazes, ir gali būti naudojami klasifikuojant naujus teksto atvejus kaip perfrazuotus ar ne.
6. N-gramų analizė
N-gramos yra žodžių grupės, esančios viena šalia kitos. Patikrinus, kaip dažnai šios grupės atsiranda skirtinguose tekstuose ir jas palyginus, galima rasti panašių frazių ar sekų. Jei yra daug panašių modelių, tai gali reikšti, kad tekstas galėjo būti perfrazuotas.
7. Beveik pasikartojantis aptikimas
Paskutinis būdas, kuriuo plagiato tikrintojai efektyviai nustato perfrazavimą.
Beveik pasikartojantys aptikimo algoritmai dažnai naudojami perfrazuojant aptikimą, siekiant tiksliai nustatyti teksto segmentus, kurie yra labai panašūs arba yra beveik identiški. Šie algoritmai yra specialiai sukurti taip, kad atpažintų perfrazuotą turinį, palyginus teksto panašumą detaliu lygiu.
Kokį metodą dažniausiai naudoja plagiato prevencijos programinė įranga?
Profesionalių plagiato prevencijos tarnybų naudojami technologiniai sprendimai paprastai remiasi n-gramų analize. Naudojant n-gramų technologijas, šios paslaugos pasiekia nepaprastai didelį tikslumą. Tai vienas geriausių būdų, kaip plagijavimo tikrintuvai aptinka perfrazavimą, leidžiantį atpažinti ir paryškinti tikslius perrašytus žodžius.
Mechanika, kaip plagiato tikrintojai nustato perfrazavimą
Plagiato prevencijos tarnybos paprastai naudoja pirštų atspaudų ėmimo techniką, kad palygintų dokumentus. Tai apima reikiamų tikrintinų dokumentų n-gramų ištraukimą ir jų palyginimą su visų duomenų bazėse esančių dokumentų n-gramais.
Pavyzdys
Tarkime, kad yra sakinys: « Le mont Olympe est la plus haute montagne de Grace. »
Geriausios n-gramų (pavyzdžiui, 3 gramai) šio sakinio dalis bus:
- Le Mont Olympe
- Mont Olympe est
- Olympe est la
- yra labiausiai
- la plus haute
- aukščiausias kalnas
- haute montagne de
- Graikijos kalnas
1 atvejis. Pakeitimas
Jei žodis pakeičiamas kitu žodžiu, vis tiek kai kurie iš n-gramų atitiktį ir tolimesne analize galima aptikti žodžio pakeitimą.
Pakeistas sakinys: « Le kalnai Olympe est la plus haute montagne de Peloponesas. "
Originalus 3 gramai | 3 gramai pakeisto teksto |
Le Mont Olympe Mont Olympe est Olympe est la yra labiausiai la plus haute aukščiausias kalnas haute montagne de Graikijos kalnas | Le kalnai "Olympus" kalnai Olympe est Olympe est la yra labiausiai la plus haute aukščiausias kalnas haute montagne de Montagne de Peloponesas |
2 atvejis. Pakeista žodžių (arba sakinių, pastraipų) tvarka
Kai pakeičiama sakinio tvarka, vis tiek sutampa kai kurie 3 gramai, kad būtų galima aptikti pasikeitimą.
Pakeistas sakinys: « La plus haute montagne de Grace est Le Mont Olympe. »
Originalus 3 gramai | 3 gramai pakeisto teksto |
Le Mont Olympe Mont Olympe est Olympe est la yra labiausiai la plus haute aukščiausias kalnas haute montagne de Graikijos kalnas | La plus haute aukščiausias kalnas haute montagne de Graikijos kalnas de Grèce est Graikija est Le est Le mont Le Mont Olympe |
3 atvejis. Pridėta naujų žodžių
Kai pridedami nauji žodžiai, vis dar yra 3 gramai, kurie atitinka, kad būtų galima aptikti pasikeitimą.
Pakeistas sakinys: « Le mont Olympe est iš tolo la plus haute montagne de Grace. »
Originalus 3 gramai | 3 gramai pakeisto teksto |
Le Mont Olympe Mont Olympe est Olympe est la yra labiausiai la plus haute aukščiausias kalnas haute montagne de Graikijos kalnas | Le Mont Olympe Mont Olympe est Olympe est de est de loin toli nugarinė la plius la plus haute aukščiausias kalnas haute montagne de Graikijos kalnas |
4 atvejis. Išbraukti kai kurie žodžiai
Kai žodis pašalinamas, vis dar yra 3 gramai, kurie atitinka, todėl galima aptikti pokytį.
Pakeistas sakinys: „L'Olympe est la plus haute montagne de Grace. »
Originalus 3 gramai | 3 gramai pakeisto teksto |
Le Mont Olympe Mont Olympe est Olympe est la yra labiausiai la plus haute aukščiausias kalnas haute montagne de Graikijos kalnas | L'Olympe est la yra labiausiai la plus haute aukščiausias kalnas haute montagne de Graikijos kalnas |
Realaus pasaulio pavyzdys
Pabaigus tikrinimą faktiniame dokumente, perfrazuoti skyriai dažnai atpažįstami per pertrauktus žymėjimus. Šie pertraukimai, žymintys pakeistus žodžius, yra paryškinti, siekiant pagerinti matomumą ir skirtumą.
Žemiau rasite tikrojo dokumento pavyzdį.
- Pirmoji ištrauka yra iš failo, kuris buvo patikrintas naudojant OXSICO Plagiato prevencijos tarnyba:
- Antroji ištrauka yra iš pirminio šaltinio dokumento:
Atlikus gilesnę analizę, akivaizdu, kad pasirinkta dokumento dalis buvo perfrazuota, atlikus šiuos pakeitimus:
Originalus tekstas | Perfrazuotas tekstas | Pokyčiai |
remia inovacijas taip pat būdingas | naujovių atsarginės kopijos yra be to apibrėžtos | Pakeitimas |
ekonominių ir socialinių žinių, efektyvių sistemų | ekonominis ir visuomeninis sąmoningumas, efektyvi organizacija | Pakeitimas |
pasiūlymai (idėjos) | rekomendacija | Pakeitimas, ištrynimas |
požiūris | pozos | Pakeitimas |
sėkmė | nugalėtojas | Pakeitimas |
procesas (Perenc, Holub-Ivan | pažinimo procesas (Perenc, Holub – Ivan | Papildymas |
už naujoves | palankus | Pakeitimas |
sukuriant klimatą | : sąlygos sudarymas | Pakeitimas |
palankus | klesti | Pakeitimas |
plėtoti žinias | vystymosi sąmoningumas | Pakeitimas |
Išvada
Plagiatas, dažnai nepastebimas perfrazavimo atvejais, tebėra didelis susirūpinimas akademinėje bendruomenėje. Dėl technologijų pažangos plagijavimo tikrintuvai turi galimybę efektyviai atpažinti perfrazuotą turinį. Tiksliau, plagiato tikrintuvai aptinka perfrazavimą įvairiais metodais, pvz., eilučių atitikimu, kosinuso panašumu ir n-gramų analize. Pažymėtina, kad n-gramų analizė išsiskiria dideliu tikslumu. Šios pažangos iš esmės sumažina tikimybę, kad nuplagijuota ir perfrazuota medžiaga bus nepastebėta, taip padidinant akademinį vientisumą. |