Plaģiāts ietver atzinību par kāda cita idejām, vārdiem vai attēliem, kas tiek uzskatīta par praksi neētisks akadēmiskajā un profesionālajā vidē. To var nepamanīt skolēni, kuri var nejauši pārfrāzēt kāda cita vārdus bez atbilstošas attiecināšanas. Tā kā pēdiņas netiek izmantotas, kad kaut kas tiek pārfrāzēts, tas var viegli izvairīties no korektora uztveres un nonākt gala melnrakstā. Tomēr tas nav gluži neizpildāms, jo īpaši tāpēc, ka mūsdienās plaģiāta pārbaudītāji pārfrāzēšanu atklāj daudz efektīvāk.
Pārfrāzēšanas noteikšana var būt sarežģīts uzdevums, jo tas ietver tekstu līdzību un atšķirību noteikšanu. Nākamajās sadaļās mēs iedziļināsimies visaptverošā diskusijā par izplatītākajām metodēm un paņēmieniem, ko izmanto, lai izšķirtu pārfrāzēšanas gadījumus.
Kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu: izpētītas piemērotas metodes
Mūsdienu izglītības vidē plaģiāta pārbaudītāji ir kļuvuši arvien progresīvāki, sniedzot ne tikai kopēta teksta atzīmēšanu, bet arī pārfrāzēta satura atklāšanu. Šajā rakstā ir apskatītas metodes, kas ļauj šiem rīkiem efektīvi identificēt pārfrāzēšanu.
1. Stīgu saskaņošana
Šī metode ietver tekstu salīdzināšanu rakstzīmju vai vārdu līmenī, lai precīzi noteiktu precīzas atbilstības. Liela līdzības pakāpe rakstzīmju secībā vai vārdu izvēlē starp diviem tekstiem varētu liecināt par pārfrāzēšanu. Šie rīki izmanto sarežģītus algoritmus, kas var pat ņemt vērā vārdu kontekstuālo nozīmi, padarot arvien grūtāk plaģiātu, pārfrāzētu materiālu neatklātu.
2. Kosinusa līdzība
Kosinusa līdzība ir viena no metodēm, ar kuras palīdzību plaģiāta pārbaudītāji atklāj pārfrāzēšanu. Tas mēra divu tekstu līdzību, pamatojoties uz leņķi starp to vektoru attēlojumiem augstas dimensijas telpā. Attēlojot tekstus kā vārdu biežuma vai iegulšanas vektorus, šie rīki var aprēķināt kosinusa līdzības punktu, lai vēl vairāk uzlabotu to spēju noteikt pārfrāzētu saturu.
3. Vārdu izlīdzināšanas modeļi
Šie modeļi saskaņo vārdus vai frāzes starp diviem tekstiem, lai identificētu to atbilstību. Salīdzinot līdzinātos segmentus, varat noteikt pārfrāzēšanu, pamatojoties uz līdzībām un atšķirībām saskaņotajās secībās.
4. Semantiskā analīze
Šī pieeja ietver vārdu un frāžu nozīmes un konteksta analīzi tekstos. Tādas metodes kā latentā semantiskā analīze (LSA), vārdu iegulšana (piemēram, Word2Vec vai GloVe) vai dziļās mācīšanās modeļi, piemēram, BERT, var uztvert semantiskās attiecības starp vārdiem un identificēt pārfrāzēšanu, pamatojoties uz to semantisko attēlojumu līdzību.
5. Mašīnmācība
Uzraudzītus mašīnmācīšanās algoritmus var apmācīt, izmantojot marķētu pārfrāzētu un nepārfrāzētu tekstu pāru datu kopas. Šie modeļi var apgūt modeļus un pazīmes, kas atšķir pārfrāzes, un tos var izmantot, lai klasificētu jaunus teksta gadījumus kā pārfrāzētus vai ne.
6. N-gramu analīze
N-grami ir vārdu grupas, kas atrodas blakus viena otrai. Pārbaudot, cik bieži šīs grupas parādās dažādos tekstos, un salīdzinot tās, varat atrast līdzīgas frāzes vai secības. Ja ir daudz līdzīgu modeļu, tas varētu nozīmēt, ka teksts varētu būt pārfrāzēts.
7. Gandrīz dublikāta noteikšana
Pēdējais veids, kā plaģiāta pārbaudītāji efektīvi atklāj pārfrāzēšanu.
Gandrīz dublikātu noteikšanas algoritmi bieži tiek izmantoti pārfrāzējot noteikšanu, lai precīzi noteiktu teksta segmentus, kuriem ir liela līdzības pakāpe vai kas ir gandrīz identiski. Šie algoritmi ir īpaši izstrādāti, lai atpazītu pārfrāzētu saturu, detalizēti salīdzinot teksta līdzību.
Kuru metodi parasti izmanto plaģiāta novēršanas programmatūra?
Profesionālo plaģiāta novēršanas dienestu izmantotie tehnoloģiskie risinājumi parasti balstās uz n-gramu analīzi. Izmantojot n-gramu tehnoloģiju, šie pakalpojumi sasniedz ļoti augstu precizitātes līmeni. Šis ir viens no labākajiem veidiem, kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu, ļaujot identificēt un izcelt precīzus vārdus, kas ir pārrakstīti.
Mehānika, kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu
Plaģiāta novēršanas dienesti dokumentu salīdzināšanai parasti izmanto pirkstu nospiedumu noņemšanas paņēmienu. Tas ietver nepieciešamo n-gramu izņemšanu no pārbaudāmajiem dokumentiem un to salīdzināšanu ar visu to datubāzēs esošo dokumentu n-gramiem.
Piemērs
Pieņemsim, ka ir teikums: « Le mont Olympe est la plus haute montagne de Grèce. »
Jūsu darbs IR Klientu apkalpošana n-grami (piemēram, 3 grami) šī teikuma daļa būs:
- Le Mont Olympe
- Mont Olympe est
- Olympe est la
- ir visvairāk
- la plus haute
- augstākais kalns
- haute montagne de
- Grieķijas kalns
1. gadījums. Nomaiņa
Ja vārds tiek aizstāts ar citu vārdu, joprojām daži no n-grami atbilst, un ir iespējams noteikt vārda aizstāšanu, veicot turpmāku analīzi.
Mainīts teikums: " kalni Olympe est la plus haute montagne de Peloponēsa. "
Oriģināls 3 grami | 3 grami mainīta teksta |
Le Mont Olympe Mont Olympe est Olympe est la ir visvairāk la plus haute augstākais kalns haute montagne de Grieķijas kalns | Le kalni Olympus kalni Olympe est Olympe est la ir visvairāk la plus haute augstākais kalns haute montagne de Montagne de Peloponēsa |
2. gadījums. Mainīta vārdu (vai teikumu, rindkopu) secība
Ja teikuma secība tiek mainīta, daži 3 grami joprojām atbilst, lai ir iespējams noteikt izmaiņas.
Mainīts teikums: « La plus haute montagne de Grèce est Le Mont Olympe. »
Oriģināls 3 grami | 3 grami mainīta teksta |
Le Mont Olympe Mont Olympe est Olympe est la ir visvairāk la plus haute augstākais kalns haute montagne de Grieķijas kalns | La plus haute augstākais kalns haute montagne de Grieķijas kalns de Grèce est Grèce est Le est Le mont Le Mont Olympe |
3. gadījums. Pievienoti jauni vārdi
Kad tiek pievienoti jauni vārdi, joprojām ir daži 3 grami, kas atbilst, lai ir iespējams noteikt izmaiņas.
Mainīts teikums: « Le mont Olympe est no tālienes la plus haute montagne de Grèce. »
Oriģināls 3 grami | 3 grami mainīta teksta |
Le Mont Olympe Mont Olympe est Olympe est la ir visvairāk la plus haute augstākais kalns haute montagne de Grieķijas kalns | Le Mont Olympe Mont Olympe est Olympe est de est de loin tālu prom loin la plus la plus haute augstākais kalns haute montagne de Grieķijas kalns |
4. gadījums. Svītroti daži vārdi
Kad vārds ir noņemts, joprojām ir daži 3 grami, kas atbilst, lai ir iespējams noteikt izmaiņas.
Mainīts teikums: « L'Olympe est la plus haute montagne de Grèce. »
Oriģināls 3 grami | 3 grami mainīta teksta |
Le Mont Olympe Mont Olympe est Olympe est la ir visvairāk la plus haute augstākais kalns haute montagne de Grieķijas kalns | L'Olympe est la ir visvairāk la plus haute augstākais kalns haute montagne de Grieķijas kalns |
Reālās pasaules piemērs
Pabeidzot verifikāciju faktiskā dokumentā, pārfrāzētās sadaļas bieži tiek identificētas ar pārtrauktu marķējumu. Šie pārtraukumi, kas apzīmē mainītos vārdus, ir izcelti, lai uzlabotu redzamību un atšķirību.
Tālāk ir sniegts faktiskā dokumenta piemērs.
- Pirmais fragments nāk no faila, kas ir pārbaudīts, izmantojot OXSICO Plaģiāta novēršanas dienests:
- Otrais izvilkums ir no oriģinālā avota dokumenta:
Pēc dziļākas analīzes ir skaidrs, ka izvēlētā dokumenta daļa tika pārfrāzēta, veicot šādas izmaiņas:
Sākotnējais teksts | Pārfrāzēts teksts | Izmaiņas |
atbalsta inovāciju raksturo arī | turklāt ir definēts, ka atbalsta inovācijas | Aizstāšana |
ekonomiskās un sociālās zināšanas, efektīvas sistēmas | ekonomiska un sabiedriska apziņa, efektīva organizācija | Aizstāšana |
priekšlikumi (idejas) | ieteikums | Aizstāšana, dzēšana |
attieksme | pozas | Aizstāšana |
veiksme | uzvarētājs | Aizstāšana |
process (Perenc, Holub-Ivan | izziņas process (Perenc, Holub – Ivan | Papildinājums |
inovācijas atbalstošs | labvēlīgs | Aizstāšana |
radot klimatu | : nosacījuma radīšana | Aizstāšana |
labvēlīgs | pārtikuši | Aizstāšana |
attīstot zināšanas | attīstības izpratne | Aizstāšana |
Secinājumi
Plaģiāts, kas bieži netiek atklāts pārfrāzēšanas gadījumos, joprojām ir nopietna problēma akadēmiskajās aprindās. Tehnoloģiju attīstība ir nodrošinājusi plaģiāta pārbaudītājus ar iespēju efektīvi identificēt pārfrāzētu saturu. Konkrētāk, plaģiāta pārbaudītāji nosaka pārfrāzēšanu, izmantojot dažādas metodes, piemēram, virkņu saskaņošanu, kosinusu līdzību un n-gramu analīzi. Jo īpaši n-gramu analīze izceļas ar augstu precizitātes ātrumu. Šie sasniegumi būtiski samazina iespējamību, ka plaģiāts un pārfrāzēts materiāls paliks neatklāts, tādējādi uzlabojot akadēmisko integritāti. |