Plagiaat hõlmab kellegi teise ideede, sõnade või piltide eest au võtmist – see on tava ebaeetiline akadeemilises ja professionaalses keskkonnas. See võib jääda märkamatuks õpilastele, kes võivad kellegi teise sõnu kogemata ümber sõnastada ilma korraliku omistamiseta. Kuna millegi ümbersõnastamisel jutumärke ei kasutata, võib see kergesti korrektori haardest pääseda ja minna edasi lõplikku mustandisse. Siiski pole see täiesti võimatu, eriti kuna plagiaadikontrollid tuvastavad tänapäeval parafraseerimist tõhusamalt.
Parafraseerimise tuvastamine võib olla keeruline ülesanne, kuna see hõlmab tekstide sarnasuste ja erinevuste tuvastamist. Järgmistes osades käsitleme kõikehõlmavat arutelu tavapäraste meetodite ja tehnikate üle, mida kasutatakse ümbersõnastamise juhtude tuvastamiseks.
Kuidas plagiaadikontrollid parafraseerimist tuvastavad: uuriti sobivaid meetodeid
Tänasel haridusmaastikul on plagiaadikontroll muutunud üha arenenumaks, ulatudes kaugemale kopeeritud teksti märgistamisest ja ka ümbersõnastatud sisu tuvastamisest. Selles artiklis uuritakse meetodeid, mis võimaldavad neil tööriistadel parafraseerimist tõhusalt tuvastada.
1. Stringi sobitamine
See meetod hõlmab tekstide võrdlemist tähe- või sõnatasandil, et määrata täpsed vasted. Kahe teksti märgijadade või sõnavalikute suur sarnasus võib viidata ümberfraseerimisele. Need tööriistad kasutavad keerulisi algoritme, mis võivad isegi arvesse võtta sõnade kontekstuaalset tähendust, muutes plagiaadi ja parafraseeritud materjali avastamata jätmise üha raskemaks.
2. Koosinussarnasus
Koosinussarnasus on üks meetoditest, mille abil plagiaadi kontrollijad parafraseerimist tuvastavad. See mõõdab kahe teksti sarnasust, võttes aluseks nende vektoresitluse vahelise nurga suuremõõtmelises ruumis. Esitades tekste sõnade sageduste või manuste vektoritena, saavad need tööriistad arvutada koosinussarnasuse skoori, et veelgi täpsustada nende ümbersõnastatud sisu tuvastamise võimet.
3. Sõnade joondamise mudelid
Need mudelid joondavad sõnu või fraase kahe teksti vahel, et tuvastada nende vastavus. Joondatud segmente võrreldes saate tuvastada parafraseerimist, mis põhineb sobitatud jadade sarnasustel ja erinevustel.
4. Semantiline analüüs
See lähenemisviis hõlmab sõnade ja fraaside tähenduse ja konteksti analüüsimist tekstides. Sellised tehnikad nagu latentne semantiline analüüs (LSA), sõnade manustamine (nt Word2Vec või GloVe) või süvaõppemudelid, nagu BERT, suudavad tabada sõnade vahelisi semantilisi seoseid ja tuvastada ümberfraseerimist nende semantiliste esituste sarnasuse alusel.
5. Masinõpe
Järelevalvega masinõppe algoritme saab õpetada ümbersõnastatud ja parafraseerimata tekstipaaride märgistatud andmekogumitele. Need mudelid saavad õppida mustreid ja funktsioone, mis eristavad parafraase, ning neid saab kasutada uute tekstijuhtumite liigitamiseks parafraseerituks või mitte.
6. N-grammi analüüs
N-grammid on sõnarühmad, mis asuvad üksteise kõrval. Kui kontrollite, kui sageli need rühmad erinevates tekstides esinevad, ja võrdlete neid, võite leida sarnaseid fraase või järjestusi. Kui sarnaseid mustreid on palju, võib see tähendada, et tekst võidi ümber sõnastada.
7. Peaaegu duplikaattuvastus
Viimane viis, kuidas plagiaadikontrollid parafraseerimist tõhusalt tuvastavad.
Peaaegu dubleerivaid tuvastusalgoritme kasutatakse sageli parafraseerides tuvastamaks tekstisegmente, millel on suur sarnasus või mis on peaaegu identsed. Need algoritmid on spetsiaalselt loodud ümberfraseeritud sisu tuvastamiseks teksti sarnasuse võrdlemise kaudu üksikasjalikul tasemel.
Millist meetodit plagiaadi ennetamise tarkvara tavaliselt kasutab?
Professionaalsete plagiaaditõrjeteenuste kasutatavad tehnoloogilised lahendused põhinevad tavaliselt n-grammi analüüsil. N-grammipõhist tehnoloogiat kasutades saavutavad need teenused märkimisväärselt suure täpsuse. See on üks parimaid viise, kuidas plagiaadikontrollid tuvastavad ümbersõnastamist, võimaldades tuvastada ja esile tõsta täpseid ümberkirjutatud sõnu.
Mehaanika selle kohta, kuidas plagiaadikontrollid parafraseerimist tuvastavad
Plagiaadi ennetamise teenused kasutavad dokumentide võrdlemiseks tavaliselt sõrmejälgede võtmise tehnikat. See hõlmab kontrollitavatest dokumentidest vajalike n-grammide eraldamist ja nende võrdlemist kõigi nende andmebaasides olevate dokumentide n-grammidega.
Näide
Oletame, et seal on lause: «Le mont Olympe est la plus haute montagne de Grèce. »
. n-grammi (näiteks 3 grammi) sellest lausest on järgmine:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- on kõige
- la pluss haute
- kõrgeim mägi
- haute montagne de
- mägi de Grece
Juhtum 1. Asendamine
Kui sõna asendatakse teise sõnaga, jääb osa sellest siiski n-grammi vaste ja edasise analüüsi abil on võimalik tuvastada sõnaasendus.
Muudetud lause: " Mägi Olympe est la plus haute montagne de Peloponnesos. "
Originaal 3-grammine | 3 grammi muudetud teksti |
Le mont Olympe mont Olympe est Olympe est la on kõige la pluss haute kõrgeim mägi haute montagne de mägi de Grece | Le Mägi Olympus Mägi Olympe est Olympe est la on kõige la pluss haute kõrgeim mägi haute montagne de Montagne de Peloponnesos |
Juhtum 2. Sõnade (või lausete, lõikude) järjestuse muutmine
Kui lause järjekorda muudetakse, siis mingid 3-grammised ikka klapivad, nii et muutust on võimalik tuvastada.
Muudetud lause: « La plus haute montagne de Grèce est Le mont Olympe. »
Originaal 3-grammine | 3 grammi muudetud teksti |
Le mont Olympe mont Olympe est Olympe est la on kõige la pluss haute kõrgeim mägi haute montagne de mägi de Grece | La plus haute kõrgeim mägi haute montagne de mägi de Grece de Grèce est Grèce est Le est Le mont Le mont Olympe |
Juhtum 3. Lisatud uued sõnad
Kui uued sõnad on lisatud, on veel mõned 3 grammi, mis sobivad, nii et muutust on võimalik tuvastada.
Muudetud lause: « Le mont Olympe est kaugelt la pluss haute montagne de Grece. »
Originaal 3-grammine | 3 grammi muudetud teksti |
Le mont Olympe mont Olympe est Olympe est la on kõige la pluss haute kõrgeim mägi haute montagne de mägi de Grece | Le mont Olympe mont Olympe est Olympe est de est de loin kaugel nimme la pluss la pluss haute kõrgeim mägi haute montagne de mägi de Grece |
Juhtum 4. Kustutatud mõned sõnad
Kui sõna eemaldatakse, on veel mõned 3-grammised, mis sobivad, nii et muutust on võimalik tuvastada.
Muudetud lause: «L'Olympe est la plus haute montagne de Grece. »
Originaal 3-grammine | 3 grammi muudetud teksti |
Le mont Olympe mont Olympe est Olympe est la on kõige la pluss haute kõrgeim mägi haute montagne de mägi de Grece | L'Olympe est la on kõige la pluss haute kõrgeim mägi haute montagne de mägi de Grece |
Näide reaalsest maailmast
Tõendamise lõpetamisel tegelikus dokumendis tuvastatakse parafraseeritud lõigud sageli katkendlike märgistuste kaudu. Need katkestused, mis tähistavad muudetud sõnu, on nähtavuse ja eristamise parandamiseks esile tõstetud.
Altpoolt leiate tegeliku dokumendi näite.
- Esimene väljavõte pärineb failist, mis on kinnitatud rakendusega OXSICO Plagiaadi ennetamise teenus:
- Teine väljavõte on algsest algdokumendist:
Pärast põhjalikumat analüüsi on ilmne, et dokumendi valitud osa parafraseeriti järgmiste muudatustega:
Algtekst | Parafraseeritud tekst | Vaidluste lahendamine |
iseloomustab ka innovatsiooni toetab | innovatsiooni toetamine on lisaks määratletud | Asendamine |
majanduslikud ja sotsiaalsed teadmised, tõhusad süsteemid | majanduslik ja ühiskondlik teadlikkus, tõhus organisatsioon | Asendamine |
ettepanekud (ideed) | soovitus | Asendamine, kustutamine |
hoiakud | asendid | Asendamine |
edu | võitja | Asendamine |
protsess (Perenc, Holub-Ivan | kognitiivne protsess (Perenc, Holub – Ivan | Lisamine |
innovatsiooni pooldaja | soodne | Asendamine |
kliima loomine | : tingimuse loomine | Asendamine |
soodne | jõukas | Asendamine |
teadmiste arendamine | arenguteadlikkus | Asendamine |
Järeldus
Plagiaat, mida parafraseerimise puhul sageli ei avastata, on akadeemiliste ringkondade seas endiselt suur probleem. Tehnoloogia areng on varustanud plagiaadikontrollid võimalusega parafraseeritud sisu tõhusalt tuvastada. Täpsemalt tuvastavad plagiaadikontrollid parafraseerimist erinevate meetodite abil, nagu stringide sobitamine, koosinuse sarnasus ja n-grammi analüüs. Nimelt paistab n-grammi analüüs silma suure täpsuse poolest. Need edusammud vähendavad oluliselt tõenäosust, et plagiaat ja parafraseeritud materjal jääb avastamata, suurendades seeläbi akadeemilist terviklikkust. |