Plagiarism enplike pran kredi pou lide yon lòt moun, mo, oswa imaj, yon pratik konsidere immoral nan anviwònman akademik ak pwofesyonèl. Li ka pase inapèsi pa elèv ki ka aksidantèlman repete pawòl yon lòt moun san yo pa bon atribisyon. Piske guillemets yo pa itilize lè yon bagay parafraze, li ka fasilman chape anba men yon koreksyon epi ale nan bouyon final la. Sepandan, li pa totalman irealizabl, espesyalman depi dam plagiat detekte parafraze pi efikas sèjousi.
Detekte parafraze kapab yon travay difisil, paske li enplike idantifye resanblans ak diferans ki genyen ant tèks yo. Nan seksyon ki vin apre yo, nou pral fouye nan yon diskisyon konplè sou metòd ak teknik komen yo itilize pou disène ka parafraz.
Ki jan chèk plagiatis yo detekte parafraze: Metòd apwopriye eksplore
Nan peyizaj edikasyon jodi a, chèk plagiarism yo te vin de pli zan pli avanse, ale pi lwen pase sèlman siyale tèks kopye tou detekte kontni parafraze. Atik sa a eksplore metòd ki pèmèt zouti sa yo byen idantifye parafraze.
1. Asòti fisèl
Metòd sa a enplike nan konpare tèks nan nivo karaktè oswa mo pou idantifye alimèt egzak. Yon wo degre de resanblans nan sekans karaktè oswa chwa mo ant de tèks ka siyal parafraz. Zouti sa yo itilize algoritm konplèks ki ka menm konsidere siyifikasyon kontèks mo yo, sa ki fè li de pli zan pli difisil pou materyèl ki plagiye, parafraze pa detekte.
2. resanblans kosin
Resanblans kosinen se youn nan metòd yo pa ki chèk plagiarism detekte parafraz. Li mezire resanblans ant de tèks ki baze sou ang ki genyen ant reprezantasyon vektè yo nan yon espas ki gen gwo dimansyon. Lè yo reprezante tèks yo kòm vektè frekans mo yo oswa embeddings, zouti sa yo ka kalkile nòt resanblans kosinis la pou amelyore plis kapasite yo pou detekte kontni parafraze.
3. Pawòl aliyman modèl
Modèl sa yo aliman mo oswa fraz ant de tèks pou idantifye korespondans yo. Lè w konpare segman ki aliyen yo, ou ka detekte parafraze ki baze sou resanblans ak diferans ki genyen nan sekans matche yo.
4. Analiz semantik
Apwòch sa a enplike nan analize siyifikasyon ak kontèks mo ak fraz nan tèks yo. Teknik tankou analiz semantik inaktif (LSA), embeddings mo (tankou Word2Vec oswa GloVe), oswa modèl aprantisaj pwofon tankou BERT ka kaptire relasyon semantik ant mo yo epi idantifye parafraze ki baze sou resanblans nan reprezantasyon semantik yo.
NAN. Aprantisaj machin
Yo ka fòme algoritm aprantisaj machin sipèvize sou seri done ki gen etikèt sou pè tèks parafraze ak ki pa parafraze. Modèl sa yo ka aprann modèl ak karakteristik ki fè distenksyon ant parafraz epi yo ka itilize pou klasifye nouvo egzanp tèks kòm parafraz oswa ou pa.
6. analiz N-gram
N-gram yo se gwoup mo ki byen akote youn ak lòt. Lè w tcheke konbyen fwa gwoup sa yo parèt nan diferan tèks epi konpare yo, ou ka jwenn fraz oswa sekans ki sanble. Si gen anpil modèl ki sanble, sa ka vle di ke tèks la te ka parafraze.
7. Toupre deteksyon kopi
Dènye fason ke chèk plagiarism detekte parafraze efektivman.
Yo souvan itilize algoritm deteksyon pre-double nan parafraze deteksyon pou idantifye segman tèks ki montre yon wo degre de resanblans oswa ki prèske idantik. Algoritm sa yo espesyalman fabrike pou rekonèt kontni parafraze atravè konparezon resanblans tèks sou yon nivo detaye.
Ki metòd lojisyèl prevansyon plagiat itilize anjeneral?
Solisyon teknolojik yo itilize pa sèvis prevansyon plagiatis pwofesyonèl anjeneral depann sou analiz n-gram. Lè yo itilize teknoloji ki baze sou n-gram, sèvis sa yo reyalize yon to presizyon konsiderableman wo. Sa a se youn nan pi bon fason chèk plagiarism detekte parafraze, ki pèmèt idantifikasyon ak mete aksan sou mo egzak ki te reekri.
Mekanik nan ki jan dam plagiarism detekte parafraze
Sèvis prevansyon plagiatis souvan itilize teknik anprent pou konpare dokiman yo. Sa a enplike nan ekstrè n-gram ki nesesè nan dokiman yo dwe verifye epi konpare yo ak n-gram yo nan tout dokiman ki nan baz done yo.
Egzanp
Ann di gen yon fraz: « Le mont Olympe est la plus haute montagne de Grèce. »
Jounal n-gram (pa egzanp 3 gram) nan fraz sa a pral:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- se pi plis la
- la plus haute
- pi wo mòn
- haute montagne de
- mòn de Grèce
Ka 1. Ranplasman
Si mo a ranplase pa lòt mo a, toujou kèk nan n-gram matche epi li posib pou detekte ranplasman mo a pa plis analiz.
Chanje fraz: " mòn Olympe est la plus haute montagne de Péloponnèse. »
Orijinal 3-gram | 3-gram tèks chanje |
Le mont Olympe mont Olympe est Olympe est la se pi plis la la plus haute pi wo mòn haute montagne de mòn de Grèce | Le mòn Olympus mòn Olympe est Olympe est la se pi plis la la plus haute pi wo mòn haute montagne de Montagne de Péloponnèse |
Ka 2. Chanje lòd mo yo (oswa fraz, paragraf)
Lè yo chanje lòd fraz la, toujou gen kèk 3 gram matche ak konsa li posib pou detekte chanjman an.
Chanje fraz: « La plus haute montagne de Grèce est Le mont Olympe. »
Orijinal 3-gram | 3-gram tèks chanje |
Le mont Olympe mont Olympe est Olympe est la se pi plis la la plus haute pi wo mòn haute montagne de mòn de Grèce | La plus haute pi wo mòn haute montagne de mòn de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Ka 3. Te ajoute nouvo mo
Lè yo ajoute nouvo mo yo, toujou gen kèk 3 gram ki matche pou li posib pou detekte chanjman an.
Chanje fraz: « Le mont Olympe est soti byen lwen la plus haute montagne de Grèce. »
Orijinal 3-gram | 3-gram tèks chanje |
Le mont Olympe mont Olympe est Olympe est la se pi plis la la plus haute pi wo mòn haute montagne de mòn de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin lwen loin la plus la plus haute pi wo mòn haute montagne de mòn de Grèce |
Ka 4. Efase kèk mo
Lè yo retire mo a, toujou gen kèk 3-gram ki koresponn pou li posib pou detekte chanjman an.
Chanje fraz: « L'Olympe est la plus haute montagne de Grèce. »
Orijinal 3-gram | 3-gram tèks chanje |
Le mont Olympe mont Olympe est Olympe est la se pi plis la la plus haute pi wo mòn haute montagne de mòn de Grèce | L'Olympe est la se pi plis la la plus haute pi wo mòn haute montagne de mòn de Grèce |
Reyèl mond egzanp
Lè yo fini verifikasyon nan yon dokiman aktyèl, seksyon parafraze yo souvan idantifye atravè mak entèwonp. Entèripsyon sa yo, ki vle di mo chanje, yo make pou amelyore vizibilite ak distenksyon.
Anba a, w ap jwenn yon egzanp yon dokiman aktyèl.
- Premye ekstrè a soti nan yon dosye ki te verifye lè l sèvi avèk la OXSICO sèvis prevansyon plagiat:
- Dezyèm ekstrè a soti nan dokiman sous orijinal la:
Apre yon analiz pi pwofon, li evidan ke pati seleksyon an nan dokiman an te parafraze pa fè chanjman sa yo:
Tèks orijinal la | Tèks parafraze | Chanjman |
sipòte inovasyon tou karakterize | apiye inovasyon se san konte defini | Ranplasman |
konesans ekonomik ak sosyal, sistèm efikas | konsyans ekonomik ak sosyete, òganizasyon efikas | Ranplasman |
pwopozisyon (ide) | rekòmandasyon | Ranplasman, efase |
atitid | posture | Ranplasman |
siksè | gayan | Ranplasman |
pwosesis (Perenc, Holub-Ivan | pwosesis mantal (Perenc, Holub – Ivan | Adisyon |
pro-inovasyon | favorab | Ranplasman |
kreye yon klima | : kreye yon kondisyon | Ranplasman |
favorab | pwosperite | Ranplasman |
devlope konesans | konsyans devlopman | Ranplasman |
konklizyon
Plaji, souvan detekte nan ka parafraze, rete yon enkyetid enpòtan nan inivèsite. Pwogrè teknolojik yo te ekipe dam plagiarism ak kapasite pou idantifye efektivman kontni parafraze. Espesyalman, chèk plagiarism detekte parafraze atravè divès metòd tankou matche fisèl, resanblans kosin, ak analiz n-gram. Miyò, analiz n-gram vle di pou pousantaj segondè presizyon li yo. Avansman sa yo redwi anpil chans pou materyèl ki plagiye ak parafraze pa detekte, kidonk amelyore entegrite akademik. |