Plagiarism ji bo raman, peyv, an wêneyên yekî din qedirgiran digire, pratîkek ku tête hesibandin bêehlaqî li derdorên akademîk û pîşeyî. Ew dikare ji hêla xwendekarên ku dibe ku bêhemdî gotinên yekî din bêyî destnîşankirina rast ji nû ve biweşînin, ji nedîtî ve bê. Ji ber ku îşaretên neqilkirinê nayên bikar anîn dema ku tiştek tê ravekirin, ew bi hêsanî dikare ji destê rastnivîserek xilas bibe û biçe pêşnivîsa dawî. Lêbelê, ew bi tevahî ne pêkan e, nemaze ji ber ku kontrolkerên plagiarîzmê îro parafrazkirinê bi bandortir nas dikin.
Tesbîtkirina parafrazkirinê dikare karekî dijwar be, ji ber ku ew bi naskirina wekhevî û cûdahiyên di navbera metnan de vedihewîne. Di beşên paşîn de, em ê di nîqaşek berfireh de li ser rêbaz û teknîkên hevpar ên ku ji bo tespîtkirina mînakên parafrazkirinê têne bikar anîn, bigerin.
Kontrolkerên plagiaturîzmê çawa parafrazkirinê tesbît dikin: Rêbazên maqûl hatine keşif kirin
Di perestgeha perwerdehiyê ya îroyîn de, kontrolên plagiaturîzmê her ku diçe pêşkeftî bûne, ku ji tenê alaqkirina nivîsa kopî derbas dibe û di heman demê de naveroka parafrazkirî jî tespît dike. Ev gotar rêgezên ku rê didin van amûran ku bi bandor parafrazkirinê nas bikin vedikole.
1. Lihevhatina string
Ev rêbaz bi berhevdana metnan di asta karakter an peyvan de ji bo destnîşankirina lihevhatinên rastîn pêk tîne. Asta bilind a wekheviyê di rêzikên karakteran an bijartina peyvan de di navbera du metnan de dikare nîşana parafrazkirinê bide. Van amûran algorîtmayên tevlihev bikar tînin ku tewra dikarin wateya naveroka peyvan jî bihesibînin, ji ber vê yekê nenaskirina materyalên plagiar, parafrazkirî her ku diçe dijwartir dike.
2. Wekheviya kozînê
Wekheviya kozînê yek ji wan rêbazan e ku bi wan vekolerên plagiarîzmê parafrazkirinê tespît dikin. Ew wekheviya di navbera du nivîsan de li ser bingeha goşeya di navbera nûnerên wan ên vektorê de li cîhek pîvaz bilind dipîve. Bi temsîlkirina metnan wekî vektorên frekansên peyvan an pêvekêşan, van amûr dikarin pîvana hevsengiya kosîneyê bihejmêrin da ku kapasîteya xwe ya ji bo tespîtkirina naveroka parafrazkirî bêtir safî bikin.
3. Modelên lihevhatina peyvan
Van modelan peyvan an hevokan di navbera du nivîsan de li hev dikin da ku hevbendiyên wan nas bikin. Bi danberhevkirina beşên rêzkirî, hûn dikarin li ser bingeha wekhevî û cûdahiyên di rêzikên lihevhatî de parafrazkirinê tespît bikin.
4. Analîza semantîk
Ev nêzîkatî bi tehlîlkirina wate û naveroka peyv û biwêjên di metnan de ye. Teknîkên mîna analîza semantîkî ya veşartî (LSA), bicîkirina peyvan (wek Word2Vec an GloVe), an modelên fêrbûna kûr ên mîna BERT dikarin têkiliyên semantîkî yên di navbera peyvan de bigirin û li ser bingeha wekheviya temsîlên wan ên semantîk parafrazê nas bikin.
5. Fêrbûna makîneyê
Algorîtmayên fêrbûna makîneyê yên çavdêrîkirî dikarin li ser berhevokên binavkirî yên cotên nivîsarên parafrazekirî û ne-parafrazekirî werin perwerde kirin. Van modelan dikarin qalib û taybetmendiyên ku parafrazeyan ji hev cuda dikin fêr bibin û dikarin ji bo dabeşkirina mînakên nû yên nivîsê wekî parafraze an na werin bikar anîn.
6. Analîza N-gram
N-gram komên peyvan in ku li kêleka hev in. Gava ku hûn kontrol bikin ka çend caran ev kom di metnên cihê de xuya dibin û wan didin ber hev, hûn dikarin hevok an rêzikên wekhev bibînin. Heger gelek qalibên mîna hev hebin, ev tê wê wateyê ku dibe ku nivîs hatibe parafraz kirin.
7. Nêzîkî vedîtina dubare
Awayê paşîn ku kontrolkerên plagiarîzmê parafrazkirinê bi bandor tespît dikin.
Algorîtmayên vedîtina nêzîkî ducarî bi gelemperî di tespîtkirina parafrazkirinê de têne bikar anîn da ku beşên nivîsê yên ku astek bilind a wekheviyê nîşan didin an jî hema hema yek in destnîşan bikin. Van algorîtmayan bi taybetî têne çêkirin da ku naveroka parafrazkirî bi berhevkirina wekheviya nivîsê li ser astek hûrgulî nas bikin.
Kîjan rêbaz bi gelemperî ji hêla nermalava pêşîlêgirtina plagiarîzmê ve tê bikar anîn?
Çareseriyên teknolojîk ên ku ji hêla karûbarên pêşîlêgirtina plagiarîzmê ve têne bikar anîn bi gelemperî bi analîzên n-gram ve girêdayî ne. Bi karanîna teknolojiya n-gram-based, van karûbaran rêjeyek rastiyek berbiçav bi dest dixin. Ev yek ji awayên çêtirîn e ku kontrolkerên plagiaturîzmê parafrazkirinê tesbît dikin, rê dide naskirin û ronîkirina peyvên tam ên ku ji nû ve hatine nivîsandin.
Mekanîka ka çawa kontrolkerên plagiarîzmê parafrazkirinê tespît dikin
Karûbarên pêşîlêgirtina plagiarîzmê bi gelemperî teknîka tilikê bikar tînin da ku belgeyan berhev bikin. Ev tê de derxistina n-gramên pêwîst ji belgeyên ku têne verast kirin û berhevkirina wan bi n-gramên hemî belgeyên di databasên wan de ye.
Mînak
Em bibêjin hevokek heye: « Le mont Olympe est la plus haute montagne de Grèce. »
Ew n-gram (mînak 3-gram) ya vê hevokê dê bibe:
- Le mont Olympe
- Mont Olympe est
- Olympe est la
- herî zêde ye
- la plus haute
- plus haute montagne
- haute montagne de
- montagne de Grèce
Meseleya 1. Replacement
Ger peyv bi peyva din were guheztin, dîsa jî hin ji wan n-gram lihevhatin û mimkun e ku bi vekolînek din veguheztina peyvê were tesbît kirin.
Hevoka guhert: "The çîya Olympe est la plus haute montagne de Péloponnèse. »
Orjînal 3-gram | 3-gram nivîsa guhertî |
Le mont Olympe Mont Olympe est Olympe est la herî zêde ye la plus haute plus haute montagne haute montagne de montagne de Grèce | Le çîya Olympus çîya Olympe est Olympe est la herî zêde ye la plus haute plus haute montagne haute montagne de Montagne de Péloponnèse |
Rewş 2. Rêzkirina peyvan (an hevokan, paragrafan) guhert
Dema ku rêza hevokê tê guheztin, dîsa jî hin 3 gram li hev dikin, ji ber vê yekê gengaz e ku meriv guheztinê bibîne.
Hevoka guhert: «La plus haute montagne de Grèce est Le mont Olympe. »
Orjînal 3-gram | 3-gram nivîsa guhertî |
Le mont Olympe Mont Olympe est Olympe est la herî zêde ye la plus haute plus haute montagne haute montagne de montagne de Grèce | La plus haute plus haute montagne haute montagne de montagne de Grèce de Grêce est Grèce est Le est Le mont Le mont Olympe |
Mesele 3. Peyvên nû lê zêde kirin
Gava ku peyvên nû têne zêdekirin, hîna hin 3-gramên ku li hev dikin hene, ji ber vê yekê gengaz e ku meriv guheztinê bibîne.
Hevoka guhert: « Le mont Olympe est ji dûr ve la plus haute montagne de Grèce. »
Orjînal 3-gram | 3-gram nivîsa guhertî |
Le mont Olympe Mont Olympe est Olympe est la herî zêde ye la plus haute plus haute montagne haute montagne de montagne de Grèce | Le mont Olympe Mont Olympe est Olympe est de est de loin dur dest loin la plus la plus haute plus haute montagne haute montagne de montagne de Grèce |
Rewşa 4. Hin peyv jêbirin
Dema ku peyv tê rakirin, hîn jî hin 3-gramên ku li hev dikin hene, ji ber vê yekê gengaz e ku meriv guheztinê bibîne.
Hevoka guhert: «L'Olympe est la plus haute montagne de Grèce. »
Orjînal 3-gram | 3-gram nivîsa guhertî |
Le mont Olympe Mont Olympe est Olympe est la herî zêde ye la plus haute plus haute montagne haute montagne de montagne de Grèce | L'Olympe est la herî zêde ye la plus haute plus haute montagne haute montagne de montagne de Grèce |
Mînaka cîhana rastîn
Piştî qedandina verastkirinê di belgeyek rastîn de, beşên parafrazkirî bi gelemperî bi navgîniya nişankirî têne nas kirin. Van qutbûnên, peyvên guhertî destnîşan dikin, ji bo zêdekirina dîtin û cihêbûnê têne ronî kirin.
Li jêr, hûn ê mînakek belgeyek rastîn bibînin.
- Berçavka yekem ji pelek ku bi karanîna ve hatî verast kirin tê OXSICO karûbarê pêşîlêgirtina plagiarîzmê:
- Beşa duyemîn ji belgeya çavkaniya orîjînal e:
Piştî vekolînek kûrtir diyar dibe ku beşa hilbijartî ya belgeyê bi guherandinanên jêrîn ve hatî veguheztin:
Nivîsarê rastîn | Nivîsara parafrazkirî | Changes |
piştgirî dide nûbûnê jî tê destnîşan kirin | pişta nûjeniyê ji bilî diyar kirin | Diber |
zanîna aborî û civakî, sîstemên bi bandor | hişmendiya aborî û civakî, rêxistina bi bandor | Diber |
pêşniyarên (raman) | pêşnîyar | Li şûna, jêbirin |
helwesta | nirxandin | Diber |
serketinî | serketî | Diber |
pêvajo (Perenc, Holub-Ivan | Pêvajoya cognitive (Perenc, Holub - Ivan | Pitir |
alîgirê nûbûnê | erzan | Diber |
avhewa ava dike | : afirandina şert | Diber |
erzan | ava | Diber |
pêşxistina zanînê | hişmendiya pêşveçûnê | Diber |
Xelasî
Plagiarism, ku pir caran di rewşên parafrazkirinê de nayê dîtin, di akademiyê de xemgîniyek girîng dimîne. Pêşveçûnên teknolojîk kontrolên plagiarîzmê bi şiyana ku bi bandor naveroka parafrazkirî nas dikin vekiriye. Bi taybetî, kontrolkerên plagiaturîzmê bi rêgezên cihêreng ên mîna hevhevkirina rêzan, hevsengiya kosîn, û analîza n-gram parafrazkirinê tespît dikin. Nemaze, analîza n-gram ji ber rêjeya rastbûna xwe ya bilind radiweste. Van pêşkeftinan bi giranî îhtîmala ku materyalên pelgeyî û parafrazekirî neyên dîtin kêm dikin, bi vî rengî yekbûna akademîk zêde dikin. |