Kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu?

kā-plaģiāts-pārbaudītāji-atklāt-pārfrāzēšana
()

Plaģiāts ietver atzinību par kāda cita idejām, vārdiem vai attēliem, kas tiek uzskatīta par praksi neētisks akadēmiskajā un profesionālajā vidē. To var nepamanīt skolēni, kuri var nejauši pārfrāzēt kāda cita vārdus bez atbilstošas ​​attiecināšanas. Tā kā pēdiņas netiek izmantotas, kad kaut kas tiek pārfrāzēts, tas var viegli izvairīties no korektora uztveres un nonākt gala melnrakstā. Tomēr tas nav gluži neizpildāms, jo īpaši tāpēc, ka mūsdienās plaģiāta pārbaudītāji pārfrāzēšanu atklāj daudz efektīvāk.

Pārfrāzēšanas noteikšana var būt sarežģīts uzdevums, jo tas ietver tekstu līdzību un atšķirību noteikšanu. Nākamajās sadaļās mēs iedziļināsimies visaptverošā diskusijā par izplatītākajām metodēm un paņēmieniem, ko izmanto, lai izšķirtu pārfrāzēšanas gadījumus.

Kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu: izpētītas piemērotas metodes

Mūsdienu izglītības vidē plaģiāta pārbaudītāji ir kļuvuši arvien progresīvāki, sniedzot ne tikai kopēta teksta atzīmēšanu, bet arī pārfrāzēta satura atklāšanu. Šajā rakstā ir apskatītas metodes, kas ļauj šiem rīkiem efektīvi identificēt pārfrāzēšanu.

plaģiāts-pārbaudes-atklāt-pārfrāzēšana

1. Stīgu saskaņošana

Šī metode ietver tekstu salīdzināšanu rakstzīmju vai vārdu līmenī, lai precīzi noteiktu precīzas atbilstības. Liela līdzības pakāpe rakstzīmju secībā vai vārdu izvēlē starp diviem tekstiem varētu liecināt par pārfrāzēšanu. Šie rīki izmanto sarežģītus algoritmus, kas var pat ņemt vērā vārdu kontekstuālo nozīmi, padarot arvien grūtāk plaģiātu, pārfrāzētu materiālu neatklātu.

2. Kosinusa līdzība

Kosinusa līdzība ir viena no metodēm, ar kuras palīdzību plaģiāta pārbaudītāji atklāj pārfrāzēšanu. Tas mēra divu tekstu līdzību, pamatojoties uz leņķi starp to vektoru attēlojumiem augstas dimensijas telpā. Attēlojot tekstus kā vārdu biežuma vai iegulšanas vektorus, šie rīki var aprēķināt kosinusa līdzības punktu, lai vēl vairāk uzlabotu to spēju noteikt pārfrāzētu saturu.

3. Vārdu izlīdzināšanas modeļi

Šie modeļi saskaņo vārdus vai frāzes starp diviem tekstiem, lai identificētu to atbilstību. Salīdzinot līdzinātos segmentus, varat noteikt pārfrāzēšanu, pamatojoties uz līdzībām un atšķirībām saskaņotajās secībās.

4. Semantiskā analīze

Šī pieeja ietver vārdu un frāžu nozīmes un konteksta analīzi tekstos. Tādas metodes kā latentā semantiskā analīze (LSA), vārdu iegulšana (piemēram, Word2Vec vai GloVe) vai dziļās mācīšanās modeļi, piemēram, BERT, var uztvert semantiskās attiecības starp vārdiem un identificēt pārfrāzēšanu, pamatojoties uz to semantisko attēlojumu līdzību.

5. Mašīnmācība

Uzraudzītus mašīnmācīšanās algoritmus var apmācīt, izmantojot marķētu pārfrāzētu un nepārfrāzētu tekstu pāru datu kopas. Šie modeļi var apgūt modeļus un pazīmes, kas atšķir pārfrāzes, un tos var izmantot, lai klasificētu jaunus teksta gadījumus kā pārfrāzētus vai ne.

6. N-gramu analīze

N-grami ir vārdu grupas, kas atrodas blakus viena otrai. Pārbaudot, cik bieži šīs grupas parādās dažādos tekstos, un salīdzinot tās, varat atrast līdzīgas frāzes vai secības. Ja ir daudz līdzīgu modeļu, tas varētu nozīmēt, ka teksts varētu būt pārfrāzēts.

7. Gandrīz dublikāta noteikšana

Pēdējais veids, kā plaģiāta pārbaudītāji efektīvi atklāj pārfrāzēšanu.

Gandrīz dublikātu noteikšanas algoritmi bieži tiek izmantoti pārfrāzējot noteikšanu, lai precīzi noteiktu teksta segmentus, kuriem ir liela līdzības pakāpe vai kas ir gandrīz identiski. Šie algoritmi ir īpaši izstrādāti, lai atpazītu pārfrāzētu saturu, detalizēti salīdzinot teksta līdzību.

Kuru metodi parasti izmanto plaģiāta novēršanas programmatūra?

Profesionālo plaģiāta novēršanas dienestu izmantotie tehnoloģiskie risinājumi parasti balstās uz n-gramu analīzi. Izmantojot n-gramu tehnoloģiju, šie pakalpojumi sasniedz ļoti augstu precizitātes līmeni. Šis ir viens no labākajiem veidiem, kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu, ļaujot identificēt un izcelt precīzus vārdus, kas ir pārrakstīti.

Mehānika, kā plaģiāta pārbaudītāji atklāj pārfrāzēšanu

Plaģiāta novēršanas dienesti dokumentu salīdzināšanai parasti izmanto pirkstu nospiedumu noņemšanas paņēmienu. Tas ietver nepieciešamo n-gramu izņemšanu no pārbaudāmajiem dokumentiem un to salīdzināšanu ar visu to datubāzēs esošo dokumentu n-gramiem.

skolēni-lasa-kā-izdara-plaģiātu-pārbaudes-atklāj-pārfrāzējot

Piemērs

Pieņemsim, ka ir teikums: « Le mont Olympe est la plus haute montagne de Grèce. »

Jūsu darbs IR Klientu apkalpošana n-grami (piemēram, 3 grami) šī teikuma daļa būs:

  • Le Mont Olympe
  • Mont Olympe est
  • Olympe est la
  • ir visvairāk
  • la plus haute
  • augstākais kalns
  • haute montagne de
  • Grieķijas kalns

1. gadījums. Nomaiņa

Ja vārds tiek aizstāts ar citu vārdu, joprojām daži no n-grami atbilst, un ir iespējams noteikt vārda aizstāšanu, veicot turpmāku analīzi.

Mainīts teikums:  " kalni Olympe est la plus haute montagne de Peloponēsa. "

Oriģināls 3 grami3 grami mainīta teksta
Le Mont Olympe
Mont Olympe est
Olympe est la
ir visvairāk
la plus haute
augstākais kalns
haute montagne de
Grieķijas kalns
Le kalni Olympus
kalni Olympe est
Olympe est la
ir visvairāk
la plus haute
augstākais kalns
haute montagne de
Montagne de Peloponēsa

2. gadījums. Mainīta vārdu (vai teikumu, rindkopu) secība

Ja teikuma secība tiek mainīta, daži 3 grami joprojām atbilst, lai ir iespējams noteikt izmaiņas.

Mainīts teikums: « La plus haute montagne de Grèce est Le Mont Olympe. »

Oriģināls 3 grami3 grami mainīta teksta
Le Mont Olympe
Mont Olympe est
Olympe est la
ir visvairāk
la plus haute
augstākais kalns
haute montagne de
Grieķijas kalns
La plus haute
augstākais kalns
haute montagne de
Grieķijas kalns
de Grèce est
Grèce est Le
est Le mont
Le Mont Olympe

3. gadījums. Pievienoti jauni vārdi

Kad tiek pievienoti jauni vārdi, joprojām ir daži 3 grami, kas atbilst, lai ir iespējams noteikt izmaiņas.

Mainīts teikums: « Le mont Olympe est no tālienes la plus haute montagne de Grèce. »

Oriģināls 3 grami3 grami mainīta teksta
Le Mont Olympe
Mont Olympe est
Olympe est la
ir visvairāk
la plus haute
augstākais kalns
haute montagne de
Grieķijas kalns
Le Mont Olympe
Mont Olympe est
Olympe est de
est de loin
tālu prom
loin la plus
la plus haute
augstākais kalns
haute montagne de
Grieķijas kalns

4. gadījums. Svītroti daži vārdi

Kad vārds ir noņemts, joprojām ir daži 3 grami, kas atbilst, lai ir iespējams noteikt izmaiņas.

Mainīts teikums: « L'Olympe est la plus haute montagne de Grèce. »

Oriģināls 3 grami3 grami mainīta teksta
Le Mont Olympe
Mont Olympe est
Olympe est la
ir visvairāk
la plus haute
augstākais kalns
haute montagne de
Grieķijas kalns
L'Olympe est la
ir visvairāk
la plus haute
augstākais kalns
haute montagne de
Grieķijas kalns

Reālās pasaules piemērs

Pabeidzot verifikāciju faktiskā dokumentā, pārfrāzētās sadaļas bieži tiek identificētas ar pārtrauktu marķējumu. Šie pārtraukumi, kas apzīmē mainītos vārdus, ir izcelti, lai uzlabotu redzamību un atšķirību.

Tālāk ir sniegts faktiskā dokumenta piemērs.

  • Pirmais fragments nāk no faila, kas ir pārbaudīts, izmantojot OXSICO Plaģiāta novēršanas dienests:
  • Otrais izvilkums ir no oriģinālā avota dokumenta:
plaģiāts-ziņojums

Pēc dziļākas analīzes ir skaidrs, ka izvēlētā dokumenta daļa tika pārfrāzēta, veicot šādas izmaiņas:

Sākotnējais tekstsPārfrāzēts tekstsIzmaiņas
atbalsta inovāciju raksturo arī turklāt ir definēts, ka atbalsta inovācijasAizstāšana
ekonomiskās un sociālās zināšanas, efektīvas sistēmas ekonomiska un sabiedriska apziņa, efektīva organizācijaAizstāšana
priekšlikumi (idejas)ieteikumsAizstāšana, dzēšana
attieksmepozasAizstāšana
veiksmeuzvarētājsAizstāšana
process (Perenc, Holub-Ivanizziņas process (Perenc, Holub – IvanPapildinājums
inovācijas atbalstošslabvēlīgsAizstāšana
radot klimatu: nosacījuma radīšanaAizstāšana
labvēlīgspārtikušiAizstāšana
attīstot zināšanasattīstības izpratneAizstāšana

Secinājumi

Plaģiāts, kas bieži netiek atklāts pārfrāzēšanas gadījumos, joprojām ir nopietna problēma akadēmiskajās aprindās. Tehnoloģiju attīstība ir nodrošinājusi plaģiāta pārbaudītājus ar iespēju efektīvi identificēt pārfrāzētu saturu. Konkrētāk, plaģiāta pārbaudītāji nosaka pārfrāzēšanu, izmantojot dažādas metodes, piemēram, virkņu saskaņošanu, kosinusu līdzību un n-gramu analīzi. Jo īpaši n-gramu analīze izceļas ar augstu precizitātes ātrumu. Šie sasniegumi būtiski samazina iespējamību, ka plaģiāts un pārfrāzēts materiāls paliks neatklāts, tādējādi uzlabojot akadēmisko integritāti.

Cik noderīga bija šī ziņa?

Noklikšķiniet uz zvaigznītes, lai to novērtētu!

Vidējais vērtējums / 5. Balsu skaits:

Pagaidām nav balsu! Esi pirmais, kurš novērtē šo ziņu.

Diemžēl šī ziņa jums nav noderīga!

Uzlabosim šo amatu!

Pastāstiet, kā mēs varam uzlabot šo amatu?