Ritstuldur felur í sér að taka heiðurinn af hugmyndum, orðum eða myndum einhvers annars, sem er íhuguð venja siðlaus í fræðilegu og faglegu umhverfi. Það getur farið framhjá nemendum sem geta óvart umorðað orð einhvers annars án þess að tilgreina rétt. Þar sem gæsalappir eru ekki notaðar þegar eitthvað er umorðað getur það auðveldlega sloppið úr greipum prófarkalesara og haldið áfram í lokauppkastið. Hins vegar er það ekki með öllu óframkvæmanlegt, sérstaklega þar sem ritstuldarafgreiðslumenn greina umorðun á skilvirkari hátt nú á dögum.
Það getur verið krefjandi verkefni að greina orðabreytingar þar sem það felur í sér að greina líkindi og mun á milli texta. Í næstu köflum munum við kafa ofan í yfirgripsmikla umræðu um algengar aðferðir og aðferðir sem notaðar eru til að greina tilvik um frásögn.
Hvernig greinir ritstuldarprófanir umorðun: Hentugar aðferðir skoðaðar
Í fræðslulandslagi nútímans hafa ritstuldarprófanir orðið sífellt háþróaðari, og fara lengra en aðeins að merkja afritaðan texta til að greina umorðað efni. Þessi grein kannar aðferðirnar sem gera þessum verkfærum kleift að bera kennsl á umorðun á áhrifaríkan hátt.
1. Strengjasamsvörun
Þessi aðferð felur í sér að bera saman texta á staf- eða orðstigi til að finna nákvæma samsvörun. Mikil líkindi í stafaröðum eða orðavali milli tveggja texta gæti gefið til kynna umorðun. Þessi verkfæri nota flókin reiknirit sem geta jafnvel tekið tillit til samhengismerkingar orða, sem gerir það sífellt erfiðara fyrir ritstuldað, umorðað efni að verða óuppgötvuð.
2. Cosinus líkindi
Cosinus líkindi er ein af aðferðunum sem ritstuldarprófanir greina umorðun. Það mælir líkindi tveggja texta byggt á horninu á milli vektormynda þeirra í hávíddarrými. Með því að tákna texta sem vektora orðatíðni eða innfellingar geta þessi verkfæri reiknað út kósínuslíkingarstigið til að betrumbæta enn frekar getu sína til að greina umorðað efni.
3. Orðajöfnunarlíkön
Þessi líkön samræma orð eða orðasambönd á milli tveggja texta til að bera kennsl á samsvörun þeirra. Með því að bera saman samræmdu hlutana geturðu greint umorðun byggt á líkt og mismun í pöruðum röðum.
4. Merkingarfræðileg greining
Þessi nálgun felur í sér að greina merkingu og samhengi orða og orðasambanda í texta. Tækni eins og duld merkingargreining (LSA), innfelling orða (eins og Word2Vec eða GloVe), eða djúpnámslíkön eins og BERT geta fanga merkingarfræðileg tengsl milli orða og auðkennt umorðanir byggðar á líkt merkingarfræðilegri framsetningu þeirra.
5. Vélanám
Hægt er að þjálfa reiknirit fyrir umsjón vélanáms á merktum gagnasöfnum með umorðuðum og ekki umorðuðum textapörum. Þessi líkön geta lært mynstur og eiginleika sem aðgreina umorðanir og hægt er að nota þau til að flokka ný tilvik af texta sem umorðaðan eða ekki.
6. N-gramma greining
N-grömm eru orðaflokkar sem eru rétt við hlið. Þegar þú athugar hversu oft þessir hópar birtast í mismunandi texta og bera saman þá geturðu fundið svipaðar setningar eða runur. Ef það eru mörg svipuð mynstur gæti það þýtt að textinn gæti hafa verið umorðaður.
7. Nálægt tvítekið uppgötvun
Síðasta leiðin sem ritstuldarafgreiðslumenn greinir umorðun á áhrifaríkan hátt.
Nánast tvítekið uppgötvun reiknirit eru oft notuð til að umorða uppgötvun til að finna textahluta sem sýna mikla líkt eða eru næstum eins. Þessi reiknirit eru sérstaklega hönnuð til að bera kennsl á umorðað efni með því að bera saman textalíkt á nákvæmu stigi.
Hvaða aðferð er venjulega notuð af hugbúnaði til að koma í veg fyrir ritstuld?
Tæknilausnir sem notaðar eru af faglegum forvarnarþjónustum fyrir ritstuld byggja venjulega á n-gram greiningu. Með því að nýta n-gramma tækni, ná þessi þjónusta ótrúlega háu nákvæmni. Þetta er ein besta leiðin til að athuga ritstuldi að greina umorðun, sem gerir kleift að bera kennsl á og auðkenna nákvæm orð sem hafa verið endurskrifuð.
Vélfræði um hvernig ritstuldarafgreiðslumenn greinir umorðun
Forvarnir gegn ritstuldi nota venjulega fingrafaratækni til að bera saman skjöl. Í því felst að taka nauðsynleg n-grömm úr skjölunum sem á að sannreyna og bera þau saman við n-grömm allra skjala í gagnagrunnum þeirra.
Dæmi
Segjum að það sé setning: « Le mont Olympe est la plus haute montagne de Grèce. »
The n-grömm (td 3 grömm) þessarar setningar verður:
- Le mont Olympe
- Mont Olympe est
- Olympe est la
- er mest
- la plus haute
- hæsta fjall
- haute montagne de
- Montagne de Grèce
Mál 1. Skipti
Ef orðið er skipt út fyrir hitt orðið, enn eitthvað af n-grömm passa og það er hægt að greina orðaskiptin með frekari greiningu.
Breytt setning: "The fjöll Olympe est la plus haute montagne de Péloponnese. »
Upprunaleg 3-grömm | 3 grömm af breyttum texta |
Le mont Olympe Mont Olympe est Olympe est la er mest la plus haute hæsta fjall haute montagne de Montagne de Grèce | Le fjöll Olympus fjöll Olympe est Olympe est la er mest la plus haute hæsta fjall haute montagne de Montagne de Péloponnese |
Tilvik 2. Breytti röð orða (eða setninga, málsgreina)
Þegar röð setningarinnar er breytt passa samt einhver 3 grömm saman svo hægt sé að greina breytinguna.
Breytt setning: « La plus haute montagne de Grèce est Le mont Olympe. »
Upprunaleg 3-grömm | 3 grömm af breyttum texta |
Le mont Olympe Mont Olympe est Olympe est la er mest la plus haute hæsta fjall haute montagne de Montagne de Grèce | La plus haute hæsta fjall haute montagne de Montagne de Grèce de Grèce est Grikkland er Le est Le mont Le mont Olympe |
Tilfelli 3. Bætt við nýjum orðum
Þegar nýjum orðum er bætt við eru enn nokkur 3 grömm sem passa saman þannig að hægt er að greina breytinguna.
Breytt setning: « Le mont Olympe est úr fjarska la plus haute montagne de Grèce. »
Upprunaleg 3-grömm | 3 grömm af breyttum texta |
Le mont Olympe Mont Olympe est Olympe est la er mest la plus haute hæsta fjall haute montagne de Montagne de Grèce | Le mont Olympe Mont Olympe est Olympe est de est de loin langt í burtu loin la plús la plus haute hæsta fjall haute montagne de Montagne de Grèce |
Mál 4. Eytt nokkrum orðum
Þegar orðið er fjarlægt eru enn einhver 3 grömm sem passa saman svo það er hægt að greina breytinguna.
Breytt setning: « L'Olympe est la plus haute montagne de Grèce. »
Upprunaleg 3-grömm | 3 grömm af breyttum texta |
Le mont Olympe Mont Olympe est Olympe est la er mest la plus haute hæsta fjall haute montagne de Montagne de Grèce | L'Olympe est la er mest la plus haute hæsta fjall haute montagne de Montagne de Grèce |
Raunverulegt dæmi
Að lokinni sannprófun í raunverulegu skjali eru umorðaðir hlutar oft auðkenndir með truflunum merkingum. Þessar truflanir, sem tákna breytt orð, eru auðkenndar til að auka sýnileika og aðgreiningu.
Hér að neðan finnur þú dæmi um raunverulegt skjal.
- Fyrsta útdrátturinn kemur úr skrá sem hefur verið staðfest með því að nota OXSICO forvarnarþjónusta fyrir ritstuld:
- Annað brotið er úr upprunalegu heimildarskjalinu:
Eftir dýpri greiningu er ljóst að valinn hluti skjalsins var umorðaður með því að gera eftirfarandi breytingar:
Frumtexti | Umorðaður texti | Breytingar |
styður nýsköpun einkennist einnig | styður nýsköpun er að auki skilgreind | Skipti |
efnahagsleg og félagsleg þekking, skilvirk kerfi | hagkvæm og samfélagsleg vitund, skilvirkt skipulag | Skipti |
tillögur (hugmyndir) | meðmæli | Skipti, eyðing |
viðhorf | stellingum | Skipti |
árangur | Sigurvegarinn | Skipti |
ferli (Perenc, Holub-Ivan | vitsmunalegt ferli (Perenc, Holub – Ivan | Viðbót |
hlynntur nýsköpun | hagstæð | Skipti |
skapa loftslag | : að búa til skilyrði | Skipti |
hagstæð | velmegandi | Skipti |
þróa þekkingu | þróunarvitund | Skipti |
Niðurstaða
Ritstuldur, sem oft er ekki greindur í tilfellum um orðabreytingar, er enn umtalsvert áhyggjuefni í fræðasamfélaginu. Tækniframfarir hafa útbúið ritstuldarafl með getu til að bera kennsl á umorðað efni á áhrifaríkan hátt. Sérstaklega greinir ritstuldarafgreiðslumenn umorðun með ýmsum aðferðum eins og strengjasamsvörun, kósínuslíkingu og n-gram greiningu. Athyglisvert er að n-gram greining sker sig úr fyrir mikla nákvæmni. Þessar framfarir draga verulega úr líkum á að ritstuldað og umorðað efni verði óuppgötvað og eykur þar með fræðilega heilindi. |