Kuidas tuvastavad plagiaadikontrollid parafraseerimist?

kuidas-plagiaat-kontrollib-avasta-parafraseerimine
()

Plagiaat hõlmab kellegi teise ideede, sõnade või piltide eest au võtmist – see on tava ebaeetiline akadeemilises ja professionaalses keskkonnas. See võib jääda märkamatuks õpilastele, kes võivad kellegi teise sõnu kogemata ümber sõnastada ilma korraliku omistamiseta. Kuna millegi ümbersõnastamisel jutumärke ei kasutata, võib see kergesti korrektori haardest pääseda ja minna edasi lõplikku mustandisse. Siiski pole see täiesti võimatu, eriti kuna plagiaadikontrollid tuvastavad tänapäeval parafraseerimist tõhusamalt.

Parafraseerimise tuvastamine võib olla keeruline ülesanne, kuna see hõlmab tekstide sarnasuste ja erinevuste tuvastamist. Järgmistes osades käsitleme kõikehõlmavat arutelu tavapäraste meetodite ja tehnikate üle, mida kasutatakse ümbersõnastamise juhtude tuvastamiseks.

Kuidas plagiaadikontrollid parafraseerimist tuvastavad: uuriti sobivaid meetodeid

Tänasel haridusmaastikul on plagiaadikontroll muutunud üha arenenumaks, ulatudes kaugemale kopeeritud teksti märgistamisest ja ka ümbersõnastatud sisu tuvastamisest. Selles artiklis uuritakse meetodeid, mis võimaldavad neil tööriistadel parafraseerimist tõhusalt tuvastada.

plagiaat-kontrollib-avasta-parafraseerimine

1. Stringi sobitamine

See meetod hõlmab tekstide võrdlemist tähe- või sõnatasandil, et määrata täpsed vasted. Kahe teksti märgijadade või sõnavalikute suur sarnasus võib viidata ümberfraseerimisele. Need tööriistad kasutavad keerulisi algoritme, mis võivad isegi arvesse võtta sõnade kontekstuaalset tähendust, muutes plagiaadi ja parafraseeritud materjali avastamata jätmise üha raskemaks.

2. Koosinussarnasus

Koosinussarnasus on üks meetoditest, mille abil plagiaadi kontrollijad parafraseerimist tuvastavad. See mõõdab kahe teksti sarnasust, võttes aluseks nende vektoresitluse vahelise nurga suuremõõtmelises ruumis. Esitades tekste sõnade sageduste või manuste vektoritena, saavad need tööriistad arvutada koosinussarnasuse skoori, et veelgi täpsustada nende ümbersõnastatud sisu tuvastamise võimet.

3. Sõnade joondamise mudelid

Need mudelid joondavad sõnu või fraase kahe teksti vahel, et tuvastada nende vastavus. Joondatud segmente võrreldes saate tuvastada parafraseerimist, mis põhineb sobitatud jadade sarnasustel ja erinevustel.

4. Semantiline analüüs

See lähenemisviis hõlmab sõnade ja fraaside tähenduse ja konteksti analüüsimist tekstides. Sellised tehnikad nagu latentne semantiline analüüs (LSA), sõnade manustamine (nt Word2Vec või GloVe) või süvaõppemudelid, nagu BERT, suudavad tabada sõnade vahelisi semantilisi seoseid ja tuvastada ümberfraseerimist nende semantiliste esituste sarnasuse alusel.

5. Masinõpe

Järelevalvega masinõppe algoritme saab õpetada ümbersõnastatud ja parafraseerimata tekstipaaride märgistatud andmekogumitele. Need mudelid saavad õppida mustreid ja funktsioone, mis eristavad parafraase, ning neid saab kasutada uute tekstijuhtumite liigitamiseks parafraseerituks või mitte.

6. N-grammi analüüs

N-grammid on sõnarühmad, mis asuvad üksteise kõrval. Kui kontrollite, kui sageli need rühmad erinevates tekstides esinevad, ja võrdlete neid, võite leida sarnaseid fraase või järjestusi. Kui sarnaseid mustreid on palju, võib see tähendada, et tekst võidi ümber sõnastada.

7. Peaaegu duplikaattuvastus

Viimane viis, kuidas plagiaadikontrollid parafraseerimist tõhusalt tuvastavad.

Peaaegu dubleerivaid tuvastusalgoritme kasutatakse sageli parafraseerides tuvastamaks tekstisegmente, millel on suur sarnasus või mis on peaaegu identsed. Need algoritmid on spetsiaalselt loodud ümberfraseeritud sisu tuvastamiseks teksti sarnasuse võrdlemise kaudu üksikasjalikul tasemel.

Millist meetodit plagiaadi ennetamise tarkvara tavaliselt kasutab?

Professionaalsete plagiaaditõrjeteenuste kasutatavad tehnoloogilised lahendused põhinevad tavaliselt n-grammi analüüsil. N-grammipõhist tehnoloogiat kasutades saavutavad need teenused märkimisväärselt suure täpsuse. See on üks parimaid viise, kuidas plagiaadikontrollid tuvastavad ümbersõnastamist, võimaldades tuvastada ja esile tõsta täpseid ümberkirjutatud sõnu.

Mehaanika selle kohta, kuidas plagiaadikontrollid parafraseerimist tuvastavad

Plagiaadi ennetamise teenused kasutavad dokumentide võrdlemiseks tavaliselt sõrmejälgede võtmise tehnikat. See hõlmab kontrollitavatest dokumentidest vajalike n-grammide eraldamist ja nende võrdlemist kõigi nende andmebaasides olevate dokumentide n-grammidega.

õpilased-lugevad-kuidas-plagiaati-kontrollivad-avastavad-parafraseerivad

Näide

Oletame, et seal on lause: «Le mont Olympe est la plus haute montagne de Grèce. »

. n-grammi (näiteks 3 grammi) sellest lausest on järgmine:

  • Le mont Olympe
  • mont Olympe est
  • Olympe est la
  • on kõige
  • la pluss haute
  • kõrgeim mägi
  • haute montagne de
  • mägi de Grece

Juhtum 1. Asendamine

Kui sõna asendatakse teise sõnaga, jääb osa sellest siiski n-grammi vaste ja edasise analüüsi abil on võimalik tuvastada sõnaasendus.

Muudetud lause:  " Mägi Olympe est la plus haute montagne de Peloponnesos. "

Originaal 3-grammine3 grammi muudetud teksti
Le mont Olympe
mont Olympe est
Olympe est la
on kõige
la pluss haute
kõrgeim mägi
haute montagne de
mägi de Grece
Le Mägi Olympus
Mägi Olympe est
Olympe est la
on kõige
la pluss haute
kõrgeim mägi
haute montagne de
Montagne de Peloponnesos

Juhtum 2. Sõnade (või lausete, lõikude) järjestuse muutmine

Kui lause järjekorda muudetakse, siis mingid 3-grammised ikka klapivad, nii et muutust on võimalik tuvastada.

Muudetud lause: « La plus haute montagne de Grèce est Le mont Olympe. »

Originaal 3-grammine3 grammi muudetud teksti
Le mont Olympe
mont Olympe est
Olympe est la
on kõige
la pluss haute
kõrgeim mägi
haute montagne de
mägi de Grece
La plus haute
kõrgeim mägi
haute montagne de
mägi de Grece
de Grèce est
Grèce est Le
est Le mont
Le mont Olympe

Juhtum 3. Lisatud uued sõnad

Kui uued sõnad on lisatud, on veel mõned 3 grammi, mis sobivad, nii et muutust on võimalik tuvastada.

Muudetud lause: « Le mont Olympe est kaugelt la pluss haute montagne de Grece. »

Originaal 3-grammine3 grammi muudetud teksti
Le mont Olympe
mont Olympe est
Olympe est la
on kõige
la pluss haute
kõrgeim mägi
haute montagne de
mägi de Grece
Le mont Olympe
mont Olympe est
Olympe est de
est de loin
kaugel
nimme la pluss
la pluss haute
kõrgeim mägi
haute montagne de
mägi de Grece

Juhtum 4. Kustutatud mõned sõnad

Kui sõna eemaldatakse, on veel mõned 3-grammised, mis sobivad, nii et muutust on võimalik tuvastada.

Muudetud lause: «L'Olympe est la plus haute montagne de Grece. »

Originaal 3-grammine3 grammi muudetud teksti
Le mont Olympe
mont Olympe est
Olympe est la
on kõige
la pluss haute
kõrgeim mägi
haute montagne de
mägi de Grece
L'Olympe est la
on kõige
la pluss haute
kõrgeim mägi
haute montagne de
mägi de Grece

Näide reaalsest maailmast

Tõendamise lõpetamisel tegelikus dokumendis tuvastatakse parafraseeritud lõigud sageli katkendlike märgistuste kaudu. Need katkestused, mis tähistavad muudetud sõnu, on nähtavuse ja eristamise parandamiseks esile tõstetud.

Altpoolt leiate tegeliku dokumendi näite.

  • Esimene väljavõte pärineb failist, mis on kinnitatud rakendusega OXSICO Plagiaadi ennetamise teenus:
  • Teine väljavõte on algsest algdokumendist:
plagiaat-aruanne

Pärast põhjalikumat analüüsi on ilmne, et dokumendi valitud osa parafraseeriti järgmiste muudatustega:

AlgtekstParafraseeritud tekstVaidluste lahendamine
iseloomustab ka innovatsiooni toetab innovatsiooni toetamine on lisaks määratletudAsendamine
majanduslikud ja sotsiaalsed teadmised, tõhusad süsteemid majanduslik ja ühiskondlik teadlikkus, tõhus organisatsioonAsendamine
ettepanekud (ideed)soovitusAsendamine, kustutamine
hoiakudasendidAsendamine
eduvõitjaAsendamine
protsess (Perenc, Holub-Ivankognitiivne protsess (Perenc, Holub – IvanLisamine
innovatsiooni pooldajasoodneAsendamine
kliima loomine: tingimuse loomineAsendamine
soodnejõukasAsendamine
teadmiste arendaminearenguteadlikkusAsendamine

Järeldus

Plagiaat, mida parafraseerimise puhul sageli ei avastata, on akadeemiliste ringkondade seas endiselt suur probleem. Tehnoloogia areng on varustanud plagiaadikontrollid võimalusega parafraseeritud sisu tõhusalt tuvastada. Täpsemalt tuvastavad plagiaadikontrollid parafraseerimist erinevate meetodite abil, nagu stringide sobitamine, koosinuse sarnasus ja n-grammi analüüs. Nimelt paistab n-grammi analüüs silma suure täpsuse poolest. Need edusammud vähendavad oluliselt tõenäosust, et plagiaat ja parafraseeritud materjal jääb avastamata, suurendades seeläbi akadeemilist terviklikkust.

Kui kasulik oli see postitus?

Selle hindamiseks klõpsake tärnil!

Keskmine hinne / 5. Häälte arv:

Siiani pole ühtegi häält saanud! Ole esimene, kes hindab seda postitust.

Vabandame, et see postitus pole teile kasulik!

Parandagem seda postitust!

Räägi meile, kuidas me saame seda postitust parandada?