Il-plaġjariżmu jinvolvi li jittieħed kreditu għall-ideat, kliem, jew immaġini ta 'xi ħadd ieħor, prattika kkunsidrata mhux etiku f’ambjenti akkademiċi u professjonali. Jista' ma jkunx innutat mill-istudenti li aċċidentalment jistgħu jbiddlu l-kliem ta' xi ħadd ieħor mingħajr attribuzzjoni xierqa. Peress li l-virgoletti ma jintużawx meta xi ħaġa tiġi parafrasata, jistgħu faċilment jaħarbu mill-ħakma ta 'qarrej tal-provi u jkomplu fl-abbozz finali. Madankollu, mhuwiex għal kollox li ma jistax jintlaħaq, speċjalment peress li l-kontrolluri tal-plaġjariżmu jiskopru parafrażi b'mod aktar effiċjenti llum il-ġurnata.
L-iskoperta tal-parafrażi tista’ tkun biċċa xogħol ta’ sfida, peress li tinvolvi l-identifikazzjoni ta’ xebh u differenzi bejn it-testi. Fit-taqsimiet sussegwenti, se nidħlu f'diskussjoni komprensiva dwar metodi u tekniki komuni użati biex nagħrfu każijiet ta 'parafrażi.
Kif il-kontrolluri tal-plaġjariżmu jiskopru parafrażi: Metodi xierqa esplorati
Fil-pajsaġġ edukattiv tal-lum, il-kontrolluri tal-plaġjariżmu saru dejjem aktar avvanzati, u jmorru lil hinn mill-immarkar ta' test ikkupjat biss biex jiskopru wkoll kontenut parafraż. Dan l-artikolu jesplora l-metodi li jippermettu lil dawn l-għodod jidentifikaw b'mod effettiv il-parafrażi.
1. Tqabbil ta 'korda
Dan il-metodu jinvolvi t-tqabbil tat-testi fil-livell tal-karattri jew tal-kelma biex jiġu identifikati logħbiet eżatti. Grad għoli ta' xebh f'sekwenzi ta' karattri jew għażliet ta' kliem bejn żewġ testi jista' jindika parafrażi. Dawn l-għodod jużaw algoritmi kumplessi li jistgħu saħansitra jqisu t-tifsira kuntestwali tal-kliem, u jagħmluha dejjem aktar diffiċli għal materjal plaġjat u parafrasat li ma jinstabx.
2. Xebh tal-kosinu
Is-similarità tal-kosinju hija waħda mill-metodi li bihom il-kontrolluri tal-plaġjariżmu jiskopru parafrażi. Tkejjel ix-xebh bejn żewġ testi bbażat fuq l-angolu bejn ir-rappreżentazzjonijiet tal-vettur tagħhom fi spazju ta 'dimensjoni għolja. Billi jirrappreżentaw testi bħala vettori ta 'frekwenzi ta' kliem jew inkorporazzjonijiet, dawn l-għodod jistgħu jikkalkulaw il-punteġġ tas-similarità tal-cosine biex jirfinaw aktar il-kapaċità tagħhom li jiskopru kontenut parafrasat.
3. Mudelli ta 'allinjament tal-kelma
Dawn il-mudelli jallinjaw kliem jew frażijiet bejn żewġ testi biex jidentifikaw il-korrispondenzi tagħhom. Billi tqabbel is-segmenti allinjati, tista 'tiskopri parafrażi bbażati fuq xebh u differenzi fis-sekwenzi mqabbla.
4. Analiżi semantika
Dan l-approċċ jinvolvi l-analiżi tat-tifsira u l-kuntest tal-kliem u l-frażijiet fit-testi. Tekniki bħall-analiżi semantika moħbija (LSA), inkorporazzjonijiet ta' kliem (bħal Word2Vec jew GloVe), jew mudelli ta' tagħlim profond bħal BERT jistgħu jaqbdu relazzjonijiet semantiċi bejn il-kliem u jidentifikaw parafrażi bbażati fuq ix-xebh tar-rappreżentazzjonijiet semantiċi tagħhom.
5. Tagħlim bil-Magni
Algoritmi ta' tagħlim tal-magni sorveljati jistgħu jiġu mħarrġa fuq settijiet ta' dejta ttikkettjati ta' pari ta' testi parafrażi u mhux parafrażi. Dawn il-mudelli jistgħu jitgħallmu mudelli u karatteristiċi li jiddistingwu parafrażi u jistgħu jintużaw biex jikklassifikaw każijiet ġodda ta 'test bħala parafrażi jew le.
6. Analiżi N-gramma
N-grammi huma gruppi ta 'kliem li huma eżatt ħdejn xulxin. Meta tiċċekkja kemm-il darba dawn il-gruppi jidhru f'testi differenti u tqabbelhom, tista' ssib frażijiet jew sekwenzi simili. Jekk ikun hemm ħafna mudelli simili, jista 'jfisser li t-test seta' ġie parafrasat.
7. Kważi skoperta duplikata
L-aħħar mod kif il-kontrolluri tal-plaġjariżmu jiskopru l-parafrażi b'mod effettiv.
Algoritmi ta' skoperta kważi duplikati huma ta' spiss użati fil-parafrażi ta' skoperta biex jindikaw segmenti ta' test li juru grad għoli ta' xebh jew li huma kważi identiċi. Dawn l-algoritmi huma mfassla speċifikament biex jirrikonoxxu kontenut parafrasat permezz tat-tqabbil tax-xebh tat-test fuq livell dettaljat.
Liema metodu normalment jintuża minn softwer għall-prevenzjoni tal-plaġjariżmu?
Is-soluzzjonijiet teknoloġiċi utilizzati minn servizzi professjonali għall-prevenzjoni tal-plaġjariżmu tipikament jiddependu fuq analiżi n-gram. Permezz ta 'lieva tat-teknoloġija bbażata fuq n-gramm, dawn is-servizzi jiksbu rata ta' preċiżjoni notevolment għolja. Dan huwa wieħed mill-aħjar modi kif il-kontrolluri tal-plaġjariżmu jiskopru l-parafrażi, li jippermetti l-identifikazzjoni u l-enfasi ta 'kliem eżatt li nkiteb mill-ġdid.
Mekkaniċi ta 'kif il-kontrolluri tal-plaġjariżmu jiskopru parafrażi
Is-servizzi ta' prevenzjoni tal-plaġjariżmu ġeneralment jużaw it-teknika tal-marki tas-swaba' biex iqabblu d-dokumenti. Dan jinvolvi l-estrazzjoni tal-n-grams meħtieġa mid-dokumenti li jridu jiġu vverifikati u t-tqabbilhom mal-n-grams tad-dokumenti kollha fid-databases tagħhom.
Eżempju
Ejja ngħidu li hemm sentenza: « Le mont Olympe est la plus haute montagne de Grèce. »
il n-grammi (per eżempju 3-grammi) ta’ din is-sentenza tkun:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- huwa l-iktar
- la plus haute
- l-ogħla muntanja
- haute montagne de
- montagne de Grèce
Każ 1. Sostituzzjoni
Jekk il-kelma tiġi sostitwita bil-kelma l-oħra, xorta waħda mill- n-grammi jaqblu u huwa possibbli li tinstab is-sostituzzjoni tal-kelma b'aktar analiżi.
Sentenza mibdula: L- muntanji Olympe est la plus haute montagne de Péloponnèse. "
3-grammi oriġinali | 3-grammi ta 'test mibdul |
Le mont Olympe mont Olympe est Olympe est la huwa l-iktar la plus haute l-ogħla muntanja haute montagne de montagne de Grèce | Le muntanji Olympus muntanji Olympe est Olympe est la huwa l-iktar la plus haute l-ogħla muntanja haute montagne de Montagne de Péloponnèse |
Każ 2. Bidla l-ordni tal-kliem (jew sentenzi, paragrafi)
Meta l-ordni tas-sentenza tinbidel, xorta waħda xi 3-grammi jaqblu u għalhekk ikun possibbli li tinstab il-bidla.
Sentenza mibdula: « La plus haute montagne de Grèce est Le mont Olympe. »
3-grammi oriġinali | 3-grammi ta 'test mibdul |
Le mont Olympe mont Olympe est Olympe est la huwa l-iktar la plus haute l-ogħla muntanja haute montagne de montagne de Grèce | La plus haute l-ogħla muntanja haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Każ 3. Miżjud kliem ġdid
Meta jiżdiedu l-kliem il-ġdid, għad hemm xi 3-grammi li jaqblu u għalhekk ikun possibbli li tiskopri l-bidla.
Sentenza mibdula: « Le mont Olympe est mill-bogħod la plus haute montagne de Grèce. »
3-grammi oriġinali | 3-grammi ta 'test mibdul |
Le mont Olympe mont Olympe est Olympe est la huwa l-iktar la plus haute l-ogħla muntanja haute montagne de montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin Il-boghod loin la plus la plus haute l-ogħla muntanja haute montagne de montagne de Grèce |
Każ 4. Imħassar xi kliem
Meta l-kelma titneħħa, għad hemm xi 3-grammi li jaqblu u għalhekk ikun possibbli li tinstab il-bidla.
Sentenza mibdula: « L'Olympe est la plus haute montagne de Grèce. »
3-grammi oriġinali | 3-grammi ta 'test mibdul |
Le mont Olympe mont Olympe est Olympe est la huwa l-iktar la plus haute l-ogħla muntanja haute montagne de montagne de Grèce | L'Olympe est la huwa l-iktar la plus haute l-ogħla muntanja haute montagne de montagne de Grèce |
Eżempju tad-dinja reali
Mat-tlestija tal-verifika f'dokument attwali, is-sezzjonijiet parafrażi huma spiss identifikati permezz ta' marki interrotti. Dawn l-interruzzjonijiet, li jindikaw kliem mibdul, huma enfasizzati biex itejbu l-viżibilità u d-distinzjoni.
Hawn taħt, issib eżempju ta 'dokument attwali.
- L-ewwel silta ġejja minn fajl li ġie vverifikat bl-użu tal- OXSICO servizz għall-prevenzjoni tal-plaġjariżmu:
- It-tieni silta hija mid-dokument oriġinali tas-sors:
Wara analiżi aktar profonda huwa evidenti li l-parti magħżula tad-dokument ġiet parafrasata billi saru l-bidliet li ġejjin:
Test oriġinali | Test parafrasat | Bidliet |
jappoġġja l-innovazzjoni hija kkaratterizzata wkoll | jappoġġja l-innovazzjoni huwa barra minn hekk definit | Sostituzzjoni |
għarfien ekonomiku u soċjali, sistemi effiċjenti | għarfien ekonomiku u tas-soċjetà, organizzazzjoni effiċjenti | Sostituzzjoni |
proposti (ideat) | rakkomandazzjoni | Sostituzzjoni, tħassir |
attitudnijiet | qagħdiet | Sostituzzjoni |
suċċess | rebbieħ | Sostituzzjoni |
proċess (Perenc, Holub-Ivan | proċess konjittiv (Perenc, Holub – Ivan | Żieda |
favur l-innovazzjoni | favorevoli | Sostituzzjoni |
ħolqien ta’ klima | : toħloq kundizzjoni | Sostituzzjoni |
favorevoli | sinjur | Sostituzzjoni |
jiżviluppaw l-għarfien | kuxjenza dwar l-iżvilupp | Sostituzzjoni |
konklużjoni
Il-plaġjariżmu, li spiss ma jinstabx f'każijiet ta' parafrażi, jibqa' tħassib sinifikanti fl-akkademja. L-avvanzi teknoloġiċi għarrfu lill-kontrolluri tal-plaġjariżmu bil-kapaċità li jidentifikaw b'mod effettiv il-kontenut parafrasat. Speċifikament, il-kontrolluri tal-plaġjariżmu jiskopru parafrażi permezz ta 'metodi varji bħal tqabbil ta' string, xebh tal-cosine, u analiżi n-gram. Notevolment, l-analiżi ta 'n-gram tispikka għar-rata ta' preċiżjoni għolja tagħha. Dawn l-avvanzi jnaqqsu sostanzjalment il-probabbiltà li materjal plaġjat u parafrasat ma jindunax, u b'hekk itejbu l-integrità akkademika. |