A plágium magában foglalja valaki más ötleteinek, szavainak vagy képeinek elismerését, ez a gyakorlat etikátlan tudományos és szakmai környezetben. A tanulók figyelmen kívül hagyhatják, akik véletlenül átfogalmazzák valaki más szavait megfelelő attribútum nélkül. Mivel nem használnak idézőjeleket, amikor valamit átfogalmaznak, könnyen kikerülhet a korrektor kezéből, és belekerülhet a végső piszkozatba. Ez azonban nem teljesen megvalósíthatatlan, főleg, hogy a plágiumellenőrzők manapság hatékonyabban észlelik a parafrázisokat.
A parafrázis felderítése nagy kihívást jelenthet, mivel magában foglalja a szövegek közötti hasonlóságok és különbségek azonosítását. A következő részekben a parafrazálás eseteinek felismerésére használt általános módszerekről és technikákról szóló átfogó vitába fogunk beleásni.
Hogyan észlelik a plágiumellenőrzők az átfogalmazást: Megfelelő módszerek feltárása
A mai oktatási környezetben a plágiumellenőrzők egyre fejlettebbek, és a másolt szövegek megjelölésén túlmenően az átfogalmazott tartalom észlelésén is túlmutatnak. Ez a cikk azokat a módszereket tárja fel, amelyek segítségével ezek az eszközök hatékonyan azonosíthatják a parafrazeálást.
1. String illesztés
Ez a módszer magában foglalja a szövegek karakter- vagy szószintű összehasonlítását a pontos egyezések meghatározásához. A két szöveg közötti karaktersorozatok vagy szóválasztások nagyfokú hasonlósága átfogalmazást jelezhet. Ezek az eszközök összetett algoritmusokat alkalmaznak, amelyek még a szavak kontextuális jelentését is figyelembe tudják venni, így egyre nehezebbé válik a plagizált, átfogalmazott anyagok észrevétlensége.
2. Koszinusz hasonlóság
A koszinusz-hasonlóság az egyik olyan módszer, amellyel a plágium-ellenőrzők a parafrázisokat észlelik. Két szöveg közötti hasonlóságot méri a nagydimenziós térben a vektoros ábrázolásaik közötti szög alapján. A szövegek szógyakoriság vagy beágyazás vektoraiként való megjelenítésével ezek az eszközök ki tudják számítani a koszinusz hasonlósági pontszámot, hogy tovább finomítsák az átfogalmazott tartalom észlelésének képességét.
3. Szóigazítási modellek
Ezek a modellek szavakat vagy kifejezéseket igazítanak két szöveg között, hogy azonosítsák azok megfelelését. Az igazított szegmensek összehasonlításával észlelheti a parafrázisokat az egyező szekvenciák hasonlóságai és különbségei alapján.
4. Szemantikai elemzés
Ez a megközelítés magában foglalja a szavak és kifejezések jelentésének és kontextusának elemzését a szövegekben. Az olyan technikák, mint a látens szemantikai elemzés (LSA), a szóbeágyazás (mint például a Word2Vec vagy a GloVe) vagy a mélytanulási modellek, mint a BERT, képesek megragadni a szavak közötti szemantikai kapcsolatokat, és azonosítani tudják a parafrázisokat a szemantikai reprezentációik hasonlósága alapján.
5. Gépi tanulás
A felügyelt gépi tanulási algoritmusok betaníthatók átfogalmazott és nem átfogalmazott szövegpárok címkézett adatkészletein. Ezek a modellek megtanulhatnak olyan mintákat és jellemzőket, amelyek megkülönböztetik a parafrázisokat, és felhasználhatók az új szövegpéldányok parafrázisként történő besorolására vagy sem.
6. N-gram elemzés
Az N-gramok olyan szavak csoportjai, amelyek közvetlenül egymás mellett helyezkednek el. Ha megnézi, milyen gyakran jelennek meg ezek a csoportok különböző szövegekben, és összehasonlítja őket, hasonló kifejezéseket vagy sorozatokat találhat. Ha sok hasonló minta van, az azt jelentheti, hogy a szöveget átfogalmazták.
7. Közel ismétlődő észlelés
Az utolsó módja annak, hogy a plágiumellenőrzők hatékonyan észleljék a parafrázisokat.
A szinte ismétlődő észlelési algoritmusokat gyakran alkalmazzák a parafrazáló észlelés során, hogy pontosan meghatározzák azokat a szövegszegmenseket, amelyek nagyfokú hasonlóságot mutatnak vagy csaknem azonosak. Ezeket az algoritmusokat kifejezetten úgy alakították ki, hogy felismerjék az átfogalmazott tartalmat a szöveg hasonlóságának részletes összehasonlítása révén.
Melyik módszert alkalmazzák általában a plágiummegelőzési szoftverek?
A professzionális plágiummegelőzési szolgálatok által használt technológiai megoldások jellemzően n-gram elemzésre támaszkodnak. Az n-gram alapú technológia kihasználásával ezek a szolgáltatások kiemelkedően nagy pontosságot érnek el. Ez az egyik legjobb módja a plágiumellenőrzőknek a parafrázisok észlelésére, lehetővé téve az átírt szavak pontos azonosítását és kiemelését.
A plágiumellenőrzők a parafrázisok észlelésének mechanikája
A plágiummegelőzési szolgáltatások általában ujjlenyomatvételi technikát alkalmaznak a dokumentumok összehasonlítására. Ez magában foglalja a szükséges n-grammok kinyerését az ellenőrizendő dokumentumokból, és összehasonlítják az adatbázisukban lévő összes dokumentum n-grammjaival.
Példa
Tegyük fel, hogy van egy mondat: « Le mont Olympe est la plus haute montagne de Grèce. »
A n-gramm (például 3 gramm) ebből a mondatból ez lesz:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- a legtöbb
- la plus haute
- legmagasabb hegy
- haute montagne de
- montagne de Grèce
1. eset. Csere
Ha a szót egy másik szó helyettesíti, akkor még mindig néhány n-gramm egyezik, és további elemzéssel kimutatható a szócsere.
Módosított mondat: „Az hegyek Olympe est la plus haute montagne de Peloponnészosz. »
Eredeti 3 grammos | 3 gramm megváltoztatott szöveg |
Le mont Olympe mont Olympe est Olympe est la a legtöbb la plus haute legmagasabb hegy haute montagne de montagne de Grèce | Le hegyek Olympus hegyek Olympe est Olympe est la a legtöbb la plus haute legmagasabb hegy haute montagne de Montagne de Peloponnészosz |
2. eset: A szavak (vagy mondatok, bekezdések) sorrendjének megváltoztatása
A mondat sorrendjének megváltoztatásakor néhány 3 gramm még mindig megegyezik, így a változás észlelhető.
Módosított mondat: « La plus haute montagne de Grèce est Le mont Olympe. »
Eredeti 3 grammos | 3 gramm megváltoztatott szöveg |
Le mont Olympe mont Olympe est Olympe est la a legtöbb la plus haute legmagasabb hegy haute montagne de montagne de Grèce | La plus haute legmagasabb hegy haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
3. eset. Új szavak hozzáadása
Az új szavak hozzáadásakor még mindig van néhány 3 gramm, ami megegyezik, így lehetséges a változás észlelése.
Módosított mondat: « Le mont Olympe est távolból la plus haute montagne de Grèce. »
Eredeti 3 grammos | 3 gramm megváltoztatott szöveg |
Le mont Olympe mont Olympe est Olympe est la a legtöbb la plus haute legmagasabb hegy haute montagne de montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin messze karaj la plusz la plus haute legmagasabb hegy haute montagne de montagne de Grèce |
4. eset. Néhány szót törölt
A szó eltávolítása után még mindig van néhány 3 gramm, amely megfelel, így lehetséges a változás észlelése.
Módosított mondat: « A L'Olympe est la plus haute montagne de Grèce. »
Eredeti 3 grammos | 3 gramm megváltoztatott szöveg |
Le mont Olympe mont Olympe est Olympe est la a legtöbb la plus haute legmagasabb hegy haute montagne de montagne de Grèce | L'Olympe est la a legtöbb la plus haute legmagasabb hegy haute montagne de montagne de Grèce |
Valós példa
A tényleges dokumentum ellenőrzésének befejezése után az átfogalmazott szakaszokat gyakran megszakított jelölések azonosítják. Ezek a megszakítások, amelyek a megváltozott szavakat jelölik, kiemelve vannak, hogy javítsák a láthatóságot és a megkülönböztetést.
Az alábbiakban egy tényleges dokumentum példáját találja.
- Az első kivonat egy fájlból származik, amelyet a OXSICO plágiummegelőzési szolgáltatás:
- A második részlet az eredeti forrásdokumentumból származik:
Mélyebb elemzés után nyilvánvaló, hogy a dokumentum kiválasztott részét a következő változtatásokkal átfogalmazták:
Eredeti szöveg | Parafrazált szöveg | Változások |
támogatja az innovációt is jellemzi | az innovációt támogatja | Csere |
gazdasági és társadalmi ismeretek, hatékony rendszerek | gazdasági és társadalmi tudatosság, hatékony szervezés | Csere |
javaslatok (ötletek) | ajánlást | Csere, törlés |
attitűdök | testhelyzetek | Csere |
siker | győztes | Csere |
folyamat (Perenc, Holub-Ivan | kognitív folyamat (Perenc, Holub – Ivan | Kiegészítés |
innovációpárti | kedvező | Csere |
klímát teremtve | : feltétel megteremtése | Csere |
kedvező | virágzó | Csere |
tudás fejlesztése | fejlesztési tudatosság | Csere |
Következtetés
A plágium, amelyet gyakran nem észlelnek átfogalmazás esetén, továbbra is jelentős aggodalomra ad okot a tudományos körökben. A technológiai fejlődés lehetővé tette a plágiumellenőrzők számára, hogy hatékonyan azonosítsák az átfogalmazott tartalmat. Pontosabban, a plágium-ellenőrzők különféle módszerekkel, például karakterlánc-illesztéssel, koszinusz-hasonlósággal és n-gram elemzéssel észlelik a parafrázist. Nevezetesen, az n-gram elemzés kiemelkedik nagy pontosságú sebességével. Ezek az előrelépések jelentősen csökkentik annak valószínűségét, hogy a plagizált és átfogalmazott anyagok észrevétlenül maradjanak, ezáltal fokozva a tudományos integritást. |