Plagiato implikas preni krediton por alies ideoj, vortoj aŭ bildoj, praktiko konsiderata maletika en akademiaj kaj profesiaj medioj. Ĝi povas pasi nerimarkita de studentoj, kiuj eble hazarde reformu la vortojn de iu alia sen taŭga atribuo. Ĉar citiloj ne estas uzataj kiam io estas parafrazita, ĝi povas facile eviti la tenon de provleganto kaj daŭriĝi en la finan skizon. Tamen, ĝi ne estas tute neatingebla, precipe ĉar plagiatkontroliloj detektas parafrazadon pli efike nuntempe.
Detekti parafrazon povas esti malfacila tasko, ĉar ĝi implikas identigi similecojn kaj diferencojn inter tekstoj. En la postaj sekcioj, ni enprofundiĝos en ampleksa diskuto pri oftaj metodoj kaj teknikoj utiligitaj por distingi kazojn de parafrazo.
Kiel plagiatkontroliloj detektas parafrazadon: Taŭgaj metodoj esploritaj
En la hodiaŭa eduka pejzaĝo, plagiataj kontroliloj fariĝis ĉiam pli progresintaj, preter nur markado de kopiita teksto al ankaŭ detektado de parafrazita enhavo. Ĉi tiu artikolo esploras la metodojn permesantajn al ĉi tiuj iloj efike identigi parafrazon.
1. Korda kongruo
Ĉi tiu metodo implikas kompari tekstojn je la signo aŭ vorto nivelo por precizigi precizajn kongruojn. Alta grado da simileco en signosekvencoj aŭ vortelektoj inter du tekstoj povus signali parafrazon. Ĉi tiuj iloj utiligas kompleksajn algoritmojn, kiuj eĉ povas konsideri la kontekstan signifon de vortoj, igante ĝin ĉiam pli malfacila por plagiata, parafrazita materialo resti nerimarkita.
2. Kosinuso simileco
Kosinussimileco estas unu el la metodoj per kiuj plagiatkontroliloj detektas parafrazon. Ĝi mezuras la similecon inter du tekstoj surbaze de la angulo inter iliaj vektoraj reprezentadoj en alt-dimensia spaco. Reprezentante tekstojn kiel vektorojn de vortfrekvencoj aŭ enkonstruadoj, tiuj iloj povas komputi la kosinusa similecpoentaron por plue rafini sian kapablon detekti parafrazitan enhavon.
3. Vort-vicigmodeloj
Tiuj modeloj vicigas vortojn aŭ frazojn inter du tekstoj por identigi siajn korespondadojn. Komparante la vicigitajn segmentojn, vi povas detekti parafrazon surbaze de similecoj kaj diferencoj en la kongruaj sekvencoj.
4. Semantika analizo
Ĉi tiu aliro implikas analizi la signifon kaj kuntekston de vortoj kaj frazoj en tekstoj. Teknikoj kiel latenta semantika analizo (LSA), vortaj enkonstruadoj (kiel ekzemple Word2Vec aŭ GloVe), aŭ profundaj lernaj modeloj kiel BERT povas kapti semantikajn rilatojn inter vortoj kaj identigi parafrazon bazitan sur la simileco de iliaj semantikaj reprezentadoj.
5. Maŝinlernado
Kontrolitaj maŝinlernado-algoritmoj povas esti trejnitaj sur etikeditaj datumaroj de parafrazitaj kaj ne-parafrazitaj paroj de tekstoj. Tiuj modeloj povas lerni ŝablonojn kaj ecojn kiuj distingas parafrazojn kaj povas esti uzitaj por klasifiki novajn kazojn de teksto kiel parafrazitajn aŭ ne.
6. N-grama analizo
N-gramoj estas grupoj de vortoj kiuj estas tuj apud la alia. Kiam vi kontrolas kiom ofte ĉi tiuj grupoj aperas en malsamaj tekstoj kaj komparas ilin, vi povas trovi similajn frazojn aŭ sinsekvojn. Se estas multaj similaj ŝablonoj, tio povus signifi, ke la teksto eble estis parafrazita.
7. Proksime de duplikata detekto
La lasta maniero, ke plagiataj kontroliloj detektas parafrazadon efike.
Preskaŭ-duoblaj detektalgoritmoj estas ofte utiligitaj en parafrazado de detekto por precizigi tekstosegmentojn kiuj montras altan gradon da simileco aŭ estas preskaŭ identaj. Ĉi tiuj algoritmoj estas specife kreitaj por rekoni parafrazitan enhavon tra la komparo de teksta simileco sur detala nivelo.
Kiun metodon kutime uzas plagiata preventa programaro?
Teknologiaj solvoj uzataj de profesiaj plagiataj preventaj servoj kutime dependas de n-grama analizo. Utiligante n-gram-bazitan teknologion, ĉi tiuj servoj atingas rimarkinde altan precizecan indicon. Ĉi tio estas unu el la plej bonaj manieroj, kiel plagiatkontroliloj detektas parafrazon, ebligante la identigon kaj reliefigon de precizaj vortoj, kiuj estis reverkitaj.
Mekaniko de kiel plagiataj kontroliloj detektas parafrazon
Plagiatpreventservoj ofte utiligas la fingrospuradteknikon por kompari dokumentojn. Ĉi tio implicas ĉerpi la necesajn n-gramojn el la dokumentoj por esti kontrolitaj kaj kompari ilin kun la n-gramoj de ĉiuj dokumentoj en iliaj datumbazoj.
ekzemple
Ni diru, ke estas frazo: « Le mont Olympe est la plus haute montagne de Grèce. »
la n-gramoj (ekzemple 3-gramoj) de ĉi tiu frazo estos:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- estas la plej
- la plus haute
- plej alta monto
- haute montagne de
- montagne de Grèce
Kazo 1. Anstataŭigo
Se la vorto estas anstataŭigita per la alia vorto, ankoraŭ kelkaj el la n-gramoj kongruas kaj eblas detekti la vortan anstataŭigon per plua analizo.
Ŝanĝita frazo: "La montoj Olympe est la plus haute montagne de Peloponezo. »
Originalaj 3-gramoj | 3-gramoj da ŝanĝita teksto |
Le mont Olympe mont Olympe est Olympe est la estas la plej la plus haute plej alta monto haute montagne de montagne de Grèce | Le montoj Olimpo montoj Olympe est Olympe est la estas la plej la plus haute plej alta monto haute montagne de Montagne de Peloponezo |
Kazo 2. Ŝanĝis la ordigon de vortoj (aŭ frazoj, alineoj)
Kiam la ordo de la frazo estas ŝanĝita, ankoraŭ kelkaj 3-gramoj kongruas, do eblas detekti la ŝanĝon.
Ŝanĝita frazo: « La plus haute montagne de Grèce est Le mont Olympe. »
Originalaj 3-gramoj | 3-gramoj da ŝanĝita teksto |
Le mont Olympe mont Olympe est Olympe est la estas la plej la plus haute plej alta monto haute montagne de montagne de Grèce | La plus haute plej alta monto haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Kazo 3. Aldonitaj novaj vortoj
Kiam la novaj vortoj estas aldonitaj, estas ankoraŭ kelkaj 3-gramoj, kiuj kongruas, do eblas detekti la ŝanĝon.
Ŝanĝita frazo: « Le mont Olympe est de malproksime la plus haute montagne de Grèce. »
Originalaj 3-gramoj | 3-gramoj da ŝanĝita teksto |
Le mont Olympe mont Olympe est Olympe est la estas la plej la plus haute plej alta monto haute montagne de montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin malproksime loin la plus la plus haute plej alta monto haute montagne de montagne de Grèce |
Kazo 4. Forigis kelkajn vortojn
Kiam la vorto estas forigita, estas ankoraŭ kelkaj 3-gramoj, kiuj kongruas, do eblas detekti la ŝanĝon.
Ŝanĝita frazo: « L'Olympe est la plus haute montagne de Grèce. »
Originalaj 3-gramoj | 3-gramoj da ŝanĝita teksto |
Le mont Olympe mont Olympe est Olympe est la estas la plej la plus haute plej alta monto haute montagne de montagne de Grèce | L'Olympe estas la estas la plej la plus haute plej alta monto haute montagne de montagne de Grèce |
Reala mondo ekzemplo
Post kompletigo de konfirmo en fakta dokumento, parafrazitaj sekcioj ofte estas identigitaj tra interrompitaj markadoj. Ĉi tiuj interrompoj, indikante ŝanĝitajn vortojn, estas emfazitaj por plibonigi videblecon kaj distingon.
Malsupre, vi trovos ekzemplon de reala dokumento.
- La unua eltiraĵo venas de dosiero, kiu estis kontrolita per la OXSICO Servo pri prevento de plagiato:
- La dua eltiraĵo estas el la origina fontdokumento:
Post pli profunda analizo evidentiĝas, ke la elektita parto de la dokumento estis parafrazita per la sekvaj ŝanĝoj:
Originala teksto | Parafrazita teksto | ŝanĝoj |
apogas novigadon ankaŭ karakterizas | subtenas novigadon estas krome difinita | Anstataŭo |
ekonomia kaj socia scio, efikaj sistemoj | ekonomia kaj socia konscio, efika organizo | Anstataŭo |
proponoj (ideoj) | rekomendo | Anstataŭigo, forigo |
sintenoj | postenoj | Anstataŭo |
sukceso | venkinto | Anstataŭo |
procezo (Perenc, Holub-Ivan | kogna procezo (Perenc, Holub - Ivan | Krome |
por novigado | favoraj | Anstataŭo |
kreante klimaton | : kreante kondiĉon | Anstataŭo |
favoraj | prospera | Anstataŭo |
evoluigante scion | disvolva konscio | Anstataŭo |
konkludo
Plagiato, ofte nerimarkita en kazoj de parafrazado, restas signifa maltrankvilo en akademiularo. Teknologiaj progresoj ekipis plagiatajn kontrolilojn per la kapablo efike identigi parafrazitan enhavon. Specife, plagiatkontroliloj detektas parafrazon per diversaj metodoj kiel kordkongruo, kosinussimileco kaj n-grama analizo. Precipe, n-grama analizo elstaras pro sia alta precizeca indico. Tiuj akceloj konsiderinde reduktas la verŝajnecon de plagiata kaj parafrazita materialo nerimarkita, tiel plibonigante akademian integrecon. |