Hvernig greina ritstuldarafgreiðslumenn umorðun?

hvernig-gera-ritstuldur-afgreiðslumenn-greina-umsögn
()

Ritstuldur felur í sér að taka heiðurinn af hugmyndum, orðum eða myndum einhvers annars, sem er íhuguð venja siðlaus í fræðilegu og faglegu umhverfi. Það getur farið framhjá nemendum sem geta óvart umorðað orð einhvers annars án þess að tilgreina rétt. Þar sem gæsalappir eru ekki notaðar þegar eitthvað er umorðað getur það auðveldlega sloppið úr greipum prófarkalesara og haldið áfram í lokauppkastið. Hins vegar er það ekki með öllu óframkvæmanlegt, sérstaklega þar sem ritstuldarafgreiðslumenn greina umorðun á skilvirkari hátt nú á dögum.

Það getur verið krefjandi verkefni að greina orðabreytingar þar sem það felur í sér að greina líkindi og mun á milli texta. Í næstu köflum munum við kafa ofan í yfirgripsmikla umræðu um algengar aðferðir og aðferðir sem notaðar eru til að greina tilvik um frásögn.

Hvernig greinir ritstuldarprófanir umorðun: Hentugar aðferðir skoðaðar

Í fræðslulandslagi nútímans hafa ritstuldarprófanir orðið sífellt háþróaðari, og fara lengra en aðeins að merkja afritaðan texta til að greina umorðað efni. Þessi grein kannar aðferðirnar sem gera þessum verkfærum kleift að bera kennsl á umorðun á áhrifaríkan hátt.

ritstuldur-afgreiðslumaður-uppgötva-orðasöfnun

1. Strengjasamsvörun

Þessi aðferð felur í sér að bera saman texta á staf- eða orðstigi til að finna nákvæma samsvörun. Mikil líkindi í stafaröðum eða orðavali milli tveggja texta gæti gefið til kynna umorðun. Þessi verkfæri nota flókin reiknirit sem geta jafnvel tekið tillit til samhengismerkingar orða, sem gerir það sífellt erfiðara fyrir ritstuldað, umorðað efni að verða óuppgötvuð.

2. Cosinus líkindi

Cosinus líkindi er ein af aðferðunum sem ritstuldarprófanir greina umorðun. Það mælir líkindi tveggja texta byggt á horninu á milli vektormynda þeirra í hávíddarrými. Með því að tákna texta sem vektora orðatíðni eða innfellingar geta þessi verkfæri reiknað út kósínuslíkingarstigið til að betrumbæta enn frekar getu sína til að greina umorðað efni.

3. Orðajöfnunarlíkön

Þessi líkön samræma orð eða orðasambönd á milli tveggja texta til að bera kennsl á samsvörun þeirra. Með því að bera saman samræmdu hlutana geturðu greint umorðun byggt á líkt og mismun í pöruðum röðum.

4. Merkingarfræðileg greining

Þessi nálgun felur í sér að greina merkingu og samhengi orða og orðasambanda í texta. Tækni eins og duld merkingargreining (LSA), innfelling orða (eins og Word2Vec eða GloVe), eða djúpnámslíkön eins og BERT geta fanga merkingarfræðileg tengsl milli orða og auðkennt umorðanir byggðar á líkt merkingarfræðilegri framsetningu þeirra.

5. Vélanám

Hægt er að þjálfa reiknirit fyrir umsjón vélanáms á merktum gagnasöfnum með umorðuðum og ekki umorðuðum textapörum. Þessi líkön geta lært mynstur og eiginleika sem aðgreina umorðanir og hægt er að nota þau til að flokka ný tilvik af texta sem umorðaðan eða ekki.

6. N-gramma greining

N-grömm eru orðaflokkar sem eru rétt við hlið. Þegar þú athugar hversu oft þessir hópar birtast í mismunandi texta og bera saman þá geturðu fundið svipaðar setningar eða runur. Ef það eru mörg svipuð mynstur gæti það þýtt að textinn gæti hafa verið umorðaður.

7. Nálægt tvítekið uppgötvun

Síðasta leiðin sem ritstuldarafgreiðslumenn greinir umorðun á áhrifaríkan hátt.

Nánast tvítekið uppgötvun reiknirit eru oft notuð til að umorða uppgötvun til að finna textahluta sem sýna mikla líkt eða eru næstum eins. Þessi reiknirit eru sérstaklega hönnuð til að bera kennsl á umorðað efni með því að bera saman textalíkt á nákvæmu stigi.

Hvaða aðferð er venjulega notuð af hugbúnaði til að koma í veg fyrir ritstuld?

Tæknilausnir sem notaðar eru af faglegum forvarnarþjónustum fyrir ritstuld byggja venjulega á n-gram greiningu. Með því að nýta n-gramma tækni, ná þessi þjónusta ótrúlega háu nákvæmni. Þetta er ein besta leiðin til að athuga ritstuldi að greina umorðun, sem gerir kleift að bera kennsl á og auðkenna nákvæm orð sem hafa verið endurskrifuð.

Vélfræði um hvernig ritstuldarafgreiðslumenn greinir umorðun

Forvarnir gegn ritstuldi nota venjulega fingrafaratækni til að bera saman skjöl. Í því felst að taka nauðsynleg n-grömm úr skjölunum sem á að sannreyna og bera þau saman við n-grömm allra skjala í gagnagrunnum þeirra.

nemendur-lesa-hvernig-gera-ritstuldar-athugunarmenn-greina-umsögn

Dæmi

Segjum að það sé setning: « Le mont Olympe est la plus haute montagne de Grèce. »

The n-grömm (td 3 grömm) þessarar setningar verður:

  • Le mont Olympe
  • Mont Olympe est
  • Olympe est la
  • er mest
  • la plus haute
  • hæsta fjall
  • haute montagne de
  • Montagne de Grèce

Mál 1. Skipti

Ef orðið er skipt út fyrir hitt orðið, enn eitthvað af n-grömm passa og það er hægt að greina orðaskiptin með frekari greiningu.

Breytt setning:  "The fjöll Olympe est la plus haute montagne de Péloponnese. »

Upprunaleg 3-grömm3 grömm af breyttum texta
Le mont Olympe
Mont Olympe est
Olympe est la
er mest
la plus haute
hæsta fjall
haute montagne de
Montagne de Grèce
Le fjöll Olympus
fjöll Olympe est
Olympe est la
er mest
la plus haute
hæsta fjall
haute montagne de
Montagne de Péloponnese

Tilvik 2. Breytti röð orða (eða setninga, málsgreina)

Þegar röð setningarinnar er breytt passa samt einhver 3 grömm saman svo hægt sé að greina breytinguna.

Breytt setning: « La plus haute montagne de Grèce est Le mont Olympe. »

Upprunaleg 3-grömm3 grömm af breyttum texta
Le mont Olympe
Mont Olympe est
Olympe est la
er mest
la plus haute
hæsta fjall
haute montagne de
Montagne de Grèce
La plus haute
hæsta fjall
haute montagne de
Montagne de Grèce
de Grèce est
Grikkland er Le
est Le mont
Le mont Olympe

Tilfelli 3. Bætt við nýjum orðum

Þegar nýjum orðum er bætt við eru enn nokkur 3 grömm sem passa saman þannig að hægt er að greina breytinguna.

Breytt setning: « Le mont Olympe est úr fjarska la plus haute montagne de Grèce. »

Upprunaleg 3-grömm3 grömm af breyttum texta
Le mont Olympe
Mont Olympe est
Olympe est la
er mest
la plus haute
hæsta fjall
haute montagne de
Montagne de Grèce
Le mont Olympe
Mont Olympe est
Olympe est de
est de loin
langt í burtu
loin la plús
la plus haute
hæsta fjall
haute montagne de
Montagne de Grèce

Mál 4. Eytt nokkrum orðum

Þegar orðið er fjarlægt eru enn einhver 3 grömm sem passa saman svo það er hægt að greina breytinguna.

Breytt setning: « L'Olympe est la plus haute montagne de Grèce. »

Upprunaleg 3-grömm3 grömm af breyttum texta
Le mont Olympe
Mont Olympe est
Olympe est la
er mest
la plus haute
hæsta fjall
haute montagne de
Montagne de Grèce
L'Olympe est la
er mest
la plus haute
hæsta fjall
haute montagne de
Montagne de Grèce

Raunverulegt dæmi

Að lokinni sannprófun í raunverulegu skjali eru umorðaðir hlutar oft auðkenndir með truflunum merkingum. Þessar truflanir, sem tákna breytt orð, eru auðkenndar til að auka sýnileika og aðgreiningu.

Hér að neðan finnur þú dæmi um raunverulegt skjal.

  • Fyrsta útdrátturinn kemur úr skrá sem hefur verið staðfest með því að nota OXSICO forvarnarþjónusta fyrir ritstuld:
  • Annað brotið er úr upprunalegu heimildarskjalinu:
ritstuldur-skýrsla

Eftir dýpri greiningu er ljóst að valinn hluti skjalsins var umorðaður með því að gera eftirfarandi breytingar:

FrumtextiUmorðaður textiBreytingar
styður nýsköpun einkennist einnig styður nýsköpun er að auki skilgreindSkipti
efnahagsleg og félagsleg þekking, skilvirk kerfi hagkvæm og samfélagsleg vitund, skilvirkt skipulagSkipti
tillögur (hugmyndir)meðmæliSkipti, eyðing
viðhorfstellingumSkipti
árangurSigurvegarinnSkipti
ferli (Perenc, Holub-Ivanvitsmunalegt ferli (Perenc, Holub – IvanViðbót
hlynntur nýsköpunhagstæðSkipti
skapa loftslag: að búa til skilyrðiSkipti
hagstæðvelmegandiSkipti
þróa þekkinguþróunarvitundSkipti

Niðurstaða

Ritstuldur, sem oft er ekki greindur í tilfellum um orðabreytingar, er enn umtalsvert áhyggjuefni í fræðasamfélaginu. Tækniframfarir hafa útbúið ritstuldarafl með getu til að bera kennsl á umorðað efni á áhrifaríkan hátt. Sérstaklega greinir ritstuldarafgreiðslumenn umorðun með ýmsum aðferðum eins og strengjasamsvörun, kósínuslíkingu og n-gram greiningu. Athyglisvert er að n-gram greining sker sig úr fyrir mikla nákvæmni. Þessar framfarir draga verulega úr líkum á að ritstuldað og umorðað efni verði óuppgötvað og eykur þar með fræðilega heilindi.

Hversu gagnlegt var þessi færsla?

Smelltu á stjarna til að meta það!

Meðaleinkunn / 5. Atkvæðagreiðsla:

Engin atkvæði hingað til! Vertu fyrstur til að gefa þessari færslu einkunn.

Því miður er þetta innlegg ekki gagnlegt fyrir þig!

Leyfðu okkur að bæta þessa færslu!

Segðu okkur hvernig við getum bætt þessa færslu?