Plagjiatura përfshin marrjen e meritave për idetë, fjalët ose imazhet e dikujt tjetër, një praktikë e konsideruar joetike në mjedise akademike dhe profesionale. Mund të kalojë pa u vënë re nga studentët të cilët mund të riformulojnë rastësisht fjalët e dikujt tjetër pa atribuimin e duhur. Meqenëse thonjëzat nuk përdoren kur diçka parafrazohet, ajo mund t'i shpëtojë lehtësisht kapjes së një korrektuesi dhe të kalojë në draftin përfundimtar. Megjithatë, nuk është krejtësisht e paarritshme, veçanërisht pasi kontrolluesit e plagjiaturës zbulojnë parafrazimin në mënyrë më efikase në ditët e sotme.
Zbulimi i parafrazimit mund të jetë një detyrë sfiduese, pasi përfshin identifikimin e ngjashmërive dhe dallimeve midis teksteve. Në seksionet vijuese, ne do të thellojmë një diskutim gjithëpërfshirës rreth metodave dhe teknikave të zakonshme të përdorura për të dalluar rastet e parafrazimit.
Si e zbulojnë kontrolluesit e plagjiaturës parafrazimin: Hulumtohen metoda të përshtatshme
Në peizazhin e sotëm arsimor, kontrollet e plagjiaturës janë bërë gjithnjë e më të avancuara, duke shkuar përtej vetëm shënjimit të tekstit të kopjuar për të zbuluar gjithashtu përmbajtjen e parafrazuar. Ky artikull eksploron metodat që lejojnë këto mjete të identifikojnë në mënyrë efektive parafrazimin.
1. Përputhja e vargut
Kjo metodë përfshin krahasimin e teksteve në nivelin e karaktereve ose fjalëve për të përcaktuar saktë përputhjet. Një shkallë e lartë ngjashmërie në sekuencat e karaktereve ose zgjedhjet e fjalëve midis dy teksteve mund të sinjalizojë parafrazim. Këto mjete përdorin algoritme komplekse që mund të marrin në konsideratë edhe kuptimin kontekstual të fjalëve, duke e bërë gjithnjë e më të vështirë që materiali i plagjiaturës dhe i parafrazuar të mos zbulohet.
2. Ngjashmëria e kosinusit
Ngjashmëria e kosinusit është një nga metodat me të cilat kontrolluesit e plagjiaturës zbulojnë parafrazimin. Ai mat ngjashmërinë midis dy teksteve bazuar në këndin midis paraqitjeve të tyre vektoriale në një hapësirë me dimensione të larta. Duke i paraqitur tekstet si vektorë të frekuencave të fjalëve ose ngulitje, këto mjete mund të llogarisin rezultatin e ngjashmërisë së kosinusit për të përmirësuar më tej aftësinë e tyre për të zbuluar përmbajtjen e parafrazuar.
3. Modelet e rreshtimit të fjalëve
Këto modele rreshtojnë fjalët ose frazat midis dy teksteve për të identifikuar korrespondencën e tyre. Duke krahasuar segmentet e rreshtuara, mund të zbuloni parafrazimin bazuar në ngjashmëritë dhe dallimet në sekuencat e përputhura.
4. Analiza semantike
Kjo qasje përfshin analizimin e kuptimit dhe kontekstit të fjalëve dhe frazave në tekste. Teknikat si analiza semantike e fshehtë (LSA), futja e fjalëve (si Word2Vec ose GloVe), ose modelet e të mësuarit të thellë si BERT mund të kapin marrëdhënie semantike midis fjalëve dhe të identifikojnë parafrazimin bazuar në ngjashmërinë e paraqitjeve të tyre semantike.
5. Njohja e makinës
Algoritmet e mbikëqyrura të mësimit të makinerive mund të trajnohen në grupe të dhënash të etiketuara të çifteve të teksteve të parafrazuara dhe të paparafrazuara. Këto modele mund të mësojnë modele dhe veçori që dallojnë parafrazat dhe mund të përdoren për të klasifikuar shembuj të rinj të tekstit si të parafrazuar ose jo.
6. Analiza N-gram
N-gramët janë grupe fjalësh që janë afër njëra-tjetrës. Kur kontrolloni se sa shpesh shfaqen këto grupe në tekste të ndryshme dhe i krahasoni ato, mund të gjeni fraza ose sekuenca të ngjashme. Nëse ka shumë modele të ngjashme, mund të nënkuptojë se teksti mund të jetë parafrazuar.
7. Pranë zbulimit të dyfishtë
Mënyra e fundit që kontrolluesit e plagjiaturës zbulojnë parafrazimin në mënyrë efektive.
Algoritmet e zbulimit pothuajse të dyfishta përdoren shpesh në zbulimin e parafrazimit për të identifikuar segmentet e tekstit që shfaqin një shkallë të lartë ngjashmërie ose janë pothuajse identike. Këto algoritme janë krijuar posaçërisht për të njohur përmbajtjen e parafrazuar përmes krahasimit të ngjashmërisë së tekstit në një nivel të detajuar.
Cila metodë përdoret zakonisht nga programet për parandalimin e plagjiaturës?
Zgjidhjet teknologjike të përdorura nga shërbimet profesionale të parandalimit të plagjiaturës zakonisht mbështeten në analizën n-gram. Duke shfrytëzuar teknologjinë e bazuar në n-gram, këto shërbime arrijnë një shpejtësi jashtëzakonisht të lartë të saktësisë. Kjo është një nga mënyrat më të mira në të cilat kontrolluesit e plagjiaturës zbulojnë parafrazimin, duke mundësuar identifikimin dhe nënvizimin e fjalëve të sakta që janë rishkruar.
Mekanika se si kontrollorët e plagjiaturës zbulojnë parafrazimin
Shërbimet e parandalimit të plagjiaturës zakonisht përdorin teknikën e gjurmëve të gishtërinjve për të krahasuar dokumentet. Kjo përfshin nxjerrjen e n-gramëve të nevojshëm nga dokumentet që do të verifikohen dhe krahasimin e tyre me n-gramët e të gjitha dokumenteve në bazat e tyre të të dhënave.
Shembull
Le të themi se ka një fjali: « Le mont Olympe është plus mali i lartë i Greqisë. »
La n-gram (për shembull 3 gram) e kësaj fjalie do të jetë:
- Le mont Olympe
- Mont Olympe est
- Olympe est la
- është më e
- la plus haute
- mali më i lartë
- Haute Montagne de
- Montagne de Grèce
Rasti 1. Zëvendësimi
Nëse fjala zëvendësohet me fjalën tjetër, ende disa nga n-gram përputhen dhe është e mundur të zbulohet zëvendësimi i fjalës me analizë të mëtejshme.
Fjalia e ndryshuar: "The malet Olympe est la plus haute montagne de Peloponeze. »
Origjinale 3 gram | 3-gram tekst i ndryshuar |
Le mont Olympe Mont Olympe est Olympe est la është më e la plus haute mali më i lartë Haute Montagne de Montagne de Grèce | Le malet Olympe malet Olympe est Olympe est la është më e la plus haute mali më i lartë Haute Montagne de Montagne de Peloponeze |
Rasti 2. Ndryshoi renditjen e fjalëve (ose fjalive, paragrafëve)
Kur rendi i fjalisë ndryshohet, ende disa 3 gram përputhen, kështu që është e mundur të zbulohet ndryshimi.
Fjalia e ndryshuar: « La plus haute montagne de Grèce est Le mont Olympe. »
Origjinale 3 gram | 3-gram tekst i ndryshuar |
Le mont Olympe Mont Olympe est Olympe est la është më e la plus haute mali më i lartë Haute Montagne de Montagne de Grèce | La plus haute mali më i lartë Haute Montagne de Montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Rasti 3. Shtoi fjalë të reja
Kur shtohen fjalët e reja, ka ende disa 3 gram që përputhen, kështu që është e mundur të zbulohet ndryshimi.
Fjalia e ndryshuar: « Le mont Olympe est nga larg la plus Haute Montagne de Grèce. »
Origjinale 3 gram | 3-gram tekst i ndryshuar |
Le mont Olympe Mont Olympe est Olympe est la është më e la plus haute mali më i lartë Haute Montagne de Montagne de Grèce | Le mont Olympe Mont Olympe est Olympe est de est de loin shumë larg ijë la plus la plus haute mali më i lartë Haute Montagne de Montagne de Grèce |
Rasti 4. Fshihen disa fjalë
Kur fjala hiqet, ka ende disa 3 gramë që përputhen, kështu që është e mundur të zbulohet ndryshimi.
Fjalia e ndryshuar: «L'Olympe është plus montagne të lartë të Greqisë. »
Origjinale 3 gram | 3-gram tekst i ndryshuar |
Le mont Olympe Mont Olympe est Olympe est la është më e la plus haute mali më i lartë Haute Montagne de Montagne de Grèce | L'Olympe është la është më e la plus haute mali më i lartë Haute Montagne de Montagne de Grèce |
Shembull në botën reale
Pas përfundimit të verifikimit në një dokument aktual, seksionet e parafrazuara shpesh identifikohen përmes shenjave të ndërprera. Këto ndërprerje, që tregojnë fjalë të ndryshuara, theksohen për të rritur dukshmërinë dhe dallimin.
Më poshtë do të gjeni një shembull të një dokumenti aktual.
- Fragmenti i parë vjen nga një skedar që është verifikuar duke përdorur OXSICO Shërbimi për parandalimin e plagjiaturës:
- Fragmenti i dytë është nga dokumenti burimor origjinal:
Pas një analize më të thellë është evidente se pjesa e përzgjedhur e dokumentit është parafrazuar duke bërë ndryshimet e mëposhtme:
Teksti origjinal | Teksti i parafrazuar | Ndryshimet |
karakterizohet gjithashtu mbështet inovacionin | mbështetja e inovacionit është veç e përcaktuar | Zëvendësim |
njohuri ekonomike dhe sociale, sisteme efikase | ndërgjegjësimi ekonomik dhe shoqëror, organizimi efikas | Zëvendësim |
propozime (ide) | rekomandim | Zëvendësim, fshirje |
qëndrimet | postures | Zëvendësim |
sukses | fitues | Zëvendësim |
procesi (Perenc, Holub-Ivan | procesi njohës (Perenc, Holub - Ivan | Shtim |
pro inovacionit | i favorshëm | Zëvendësim |
duke krijuar një klimë | : krijimi i një kushti | Zëvendësim |
i favorshëm | i begatë | Zëvendësim |
zhvillimin e njohurive | ndërgjegjësimi për zhvillimin | Zëvendësim |
Përfundim
Plagjiatura, shpesh e pazbuluar në rastet e parafrazimit, mbetet një shqetësim i rëndësishëm në akademi. Përparimet teknologjike i kanë pajisur kontrolluesit e plagjiaturës me aftësinë për të identifikuar në mënyrë efektive përmbajtjen e parafrazuar. Në mënyrë të veçantë, kontrolluesit e plagjiaturës zbulojnë parafrazimin përmes metodave të ndryshme si përputhja e vargjeve, ngjashmëria e kosinusit dhe analiza n-gram. Veçanërisht, analiza n-gram dallohet për shkallën e saj të lartë të saktësisë. Këto përparime reduktojnë ndjeshëm mundësinë që materiali i plagjiaturës dhe i parafrazuar të mos zbulohet, duke rritur kështu integritetin akademik. |