Ինչպե՞ս են գրագողության ստուգիչները հայտնաբերում պարաֆրազավորումը:

ինչպես-do-plagiarism-checkers-dect-paraphrasing
()

Գրագողությունը ներառում է ուրիշի գաղափարների, խոսքերի կամ պատկերների հարգանքը, որը համարվում է պրակտիկա անբարոյական ակադեմիական և մասնագիտական ​​միջավայրերում: Այն կարող է աննկատ մնալ ուսանողների կողմից, ովքեր կարող են պատահաբար վերափոխել ուրիշի խոսքերը՝ առանց պատշաճ վերագրման: Քանի որ չակերտները չեն օգտագործվում, երբ ինչ-որ բան վերափոխվում է, այն հեշտությամբ կարող է վրիպել սրբագրողի ձեռքից և անցնել վերջնական նախագծի: Այնուամենայնիվ, դա լիովին անհասանելի չէ, մանավանդ, որ գրագողության ստուգիչները մեր օրերում ավելի արդյունավետ են հայտնաբերում վերափոխումը:

Պարաֆրազիայի հայտնաբերումը կարող է դժվար խնդիր լինել, քանի որ այն ներառում է տեքստերի միջև նմանություններն ու տարբերությունները: Հետագա բաժիններում մենք կխորանանք համապարփակ քննարկման մեջ այն ընդհանուր մեթոդների և մեթոդների մասին, որոնք օգտագործվում են վերափոխման դեպքերը տարբերելու համար:

Ինչպե՞ս են գրագողության ստուգիչները հայտնաբերում պարաֆրազավորումը. ուսումնասիրված են համապատասխան մեթոդներ

Այսօրվա կրթական լանդշաֆտում գրագողության ստուգիչները գնալով ավելի են զարգացել՝ անցնելով միայն պատճենված տեքստը դրոշակելուց և վերափոխված բովանդակության հայտնաբերմամբ: Այս հոդվածը ուսումնասիրում է այն մեթոդները, որոնք թույլ են տալիս այս գործիքներին արդյունավետ կերպով բացահայտել պարաֆրազավորումը:

գրագողություն-ստուգիչներ-հայտնաբերում-պարաֆրազավորում

1. Լարի համապատասխանեցում

Այս մեթոդը ներառում է տեքստերի համեմատություն նիշերի կամ բառի մակարդակով` ճշգրիտ համընկնումները մատնանշելու համար: Երկու տեքստերի միջև նիշերի հաջորդականությունների կամ բառերի ընտրության նմանության բարձր աստիճանը կարող է ազդարարել վերափոխում: Այս գործիքներն օգտագործում են բարդ ալգորիթմներ, որոնք կարող են նույնիսկ դիտարկել բառերի համատեքստային իմաստը, ինչը դժվարացնում է գրագողության, պարաֆրազավորված նյութերի աննկատ մնալը:

2. Կոսինուսների նմանություն

Կոսինուսների նմանությունը այն մեթոդներից մեկն է, որով գրագողության ստուգիչները հայտնաբերում են պարաֆրազավորումը: Այն չափում է երկու տեքստերի միջև եղած նմանությունը՝ հիմնվելով դրանց վեկտորային պատկերների միջև բարձրաչափ տարածության անկյան վրա: Տեքստերը ներկայացնելով որպես բառի հաճախականությունների կամ ներկառուցման վեկտորներ՝ այս գործիքները կարող են հաշվարկել կոսինուսի նմանության միավորը՝ հետագայում կատարելագործելու վերաֆրազավորված բովանդակությունը հայտնաբերելու իրենց կարողությունը:

3. Բառերի հավասարեցման մոդելներ

Այս մոդելները հավասարեցնում են բառերը կամ արտահայտությունները երկու տեքստերի միջև՝ պարզելու դրանց համապատասխանությունը: Համեմատելով հավասարեցված հատվածները՝ դուք կարող եք հայտնաբերել պարաֆրազավորում՝ հիմնված համապատասխան հաջորդականությունների նմանությունների և տարբերությունների վրա:

4. Իմաստային վերլուծություն

Այս մոտեցումը ներառում է տեքստերում բառերի և արտահայտությունների իմաստի և համատեքստի վերլուծություն: Տեխնիկաները, ինչպիսիք են թաքնված իմաստային վերլուծությունը (LSA), բառերի ներկառուցումը (օրինակ, Word2Vec կամ GloVe) կամ խորը ուսուցման մոդելները, ինչպիսին BERT-ն է, կարող են ֆիքսել բառերի միջև իմաստային հարաբերությունները և որոշել պարաֆրազավորումը՝ հիմնվելով դրանց իմաստային ներկայացումների նմանության վրա:

5. Մեքենայի ուսուցում

Վերահսկվող մեքենայական ուսուցման ալգորիթմները կարող են վերապատրաստվել պարաֆրազավորված և չպարաֆրազավորված զույգ տեքստերի պիտակավորված տվյալների հավաքածուների վրա: Այս մոդելները կարող են սովորել օրինաչափություններ և առանձնահատկություններ, որոնք տարբերակում են պարաֆրազները և կարող են օգտագործվել տեքստի նոր օրինակները դասակարգելու համար՝ որպես պարաֆրազավորված կամ ոչ:

6. N-գրամ անալիզ

N-գրամները բառերի խմբեր են, որոնք գտնվում են իրար կողքի: Երբ ստուգեք, թե որքան հաճախ են այս խմբերը հայտնվում տարբեր տեքստերում և համեմատում դրանք, կարող եք գտնել նմանատիպ արտահայտություններ կամ հաջորդականություններ: Եթե ​​կան բազմաթիվ նմանատիպ օրինաչափություններ, դա կարող է նշանակել, որ տեքստը կարող է վերափոխված լինել:

7. Մոտ կրկնօրինակների հայտնաբերում

Վերջին միջոցը, որով գրագողությունը ստուգողները արդյունավետ կերպով հայտնաբերում են պարաֆրազավորումը:

Գրեթե կրկնակի հայտնաբերման ալգորիթմները հաճախ օգտագործվում են հայտնաբերման պարաֆրազավորման մեջ՝ տեքստի հատվածները մատնանշելու համար, որոնք բարձր աստիճանի նմանություն են ցուցադրում կամ գրեթե նույնական են: Այս ալգորիթմները հատուկ մշակված են՝ ճանաչելու վերաֆրազավորված բովանդակությունը՝ մանրամասն մակարդակով տեքստի նմանության համեմատության միջոցով:

Ո՞ր մեթոդն է սովորաբար օգտագործում գրագողության կանխարգելման ծրագրաշարը:

Գրագողության կանխարգելման պրոֆեսիոնալ ծառայությունների կողմից կիրառվող տեխնոլոգիական լուծումները սովորաբար հիմնվում են n-gram վերլուծության վրա: Օգտագործելով n-gram-ի վրա հիմնված տեխնոլոգիան՝ այս ծառայությունները հասնում են զգալի բարձր ճշգրտության ցուցանիշի: Սա լավագույն միջոցներից մեկն է, որով գրագողությունը ստուգողները հայտնաբերում են վերափոխումը, ինչը հնարավորություն է տալիս նույնականացնել և ընդգծել ճշգրիտ բառերը, որոնք վերագրված են:

Մեխանիկա, թե ինչպես են գրագողության ստուգիչները հայտնաբերում պարաֆրազավորումը

Գրագողությունների կանխարգելման ծառայությունները սովորաբար օգտագործում են մատնահետքերի տեխնիկան՝ փաստաթղթերը համեմատելու համար: Սա ներառում է ստուգման ենթակա փաստաթղթերից անհրաժեշտ n-գրամների դուրսբերումը և դրանց տվյալների բազայի բոլոր փաստաթղթերի n-գրամների հետ համեմատումը:

ուսանողներ-կարդալու-ինչպես-անել-գրագողություն-ստուգիչներ-հայտնաբերում-պարաֆրազավորում

Օրինակ

Ասենք մի նախադասություն կա. « Le mont Olympe est la plus haute montagne de Grèce. »

The n-գրամ (օրինակ 3 գրամ) այս նախադասությունից կլինի.

  • Le mont Olympe
  • Mont Olympe est
  • Olympe est la
  • ամենաշատն է
  • la plus haute
  • ամենաբարձր լեռը
  • Haute montagne de
  • montagne de Grèce

Դեպք 1. Փոխարինում

Եթե ​​բառը փոխարինվում է մեկ այլ բառով, դեռ մի քանիսը n-գրամ համընկնում է, և հետագա վերլուծությամբ հնարավոր է հայտնաբերել բառի փոխարինումը:

Փոփոխված նախադասություն.  «The լեռներ Olympe est la plus haute montagne de Պելոպոնես: "

Օրիգինալ 3 գրամ3 գրամ փոխված տեքստ
Le mont Olympe
Mont Olympe est
Olympe est la
ամենաշատն է
la plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce
Le լեռներ Olympus
լեռներ Olympe est
Olympe est la
ամենաշատն է
la plus haute
ամենաբարձր լեռը
Haute montagne de
Մոնտանյե դե Պելոպոնես

Դեպք 2. Փոխվել է բառերի (կամ նախադասությունների, պարբերությունների) հերթականությունը.

Երբ նախադասության հերթականությունը փոխվում է, դեռ մի քանի 3 գրամ համընկնում է, որպեսզի հնարավոր լինի հայտնաբերել փոփոխությունը:

Փոփոխված նախադասություն. « La plus haute montagne de Grèce est Le mont Olympe. »

Օրիգինալ 3 գրամ3 գրամ փոխված տեքստ
Le mont Olympe
Mont Olympe est
Olympe est la
ամենաշատն է
la plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce
La plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce
de Grèce est
Grèce est Le
est Le mont
Le mont Olympe

Դեպք 3. Ավելացրել է նոր բառեր

Երբ ավելացվեն նոր բառերը, դեռ մնում են 3 գրամ, որոնք համընկնում են, այնպես որ հնարավոր է հայտնաբերել փոփոխությունը:

Փոփոխված նախադասություն. «Le mont Olympe est հեռվից la plus haute montagne de Grèce. »

Օրիգինալ 3 գրամ3 գրամ փոխված տեքստ
Le mont Olympe
Mont Olympe est
Olympe est la
ամենաշատն է
la plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce
Le mont Olympe
Mont Olympe est
Olympe est de
est de loin
հեռու
լոին լա պլյուս
la plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce

Դեպք 4. Ջնջել է որոշ բառեր

Երբ բառը հանվում է, դեռ մնում է 3 գրամ, որը համապատասխանում է, այնպես որ հնարավոր է հայտնաբերել փոփոխությունը:

Փոփոխված նախադասություն. «L'Olympe est la plus haute montagne de Grèce. »

Օրիգինալ 3 գրամ3 գրամ փոխված տեքստ
Le mont Olympe
Mont Olympe est
Olympe est la
ամենաշատն է
la plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce
L'Olympe est la
ամենաշատն է
la plus haute
ամենաբարձր լեռը
Haute montagne de
montagne de Grèce

Իրական աշխարհի օրինակ

Փաստացի փաստաթղթում ստուգումն ավարտվելուց հետո պարաֆրազավորված բաժինները հաճախ նույնացվում են ընդհատված գծանշումների միջոցով: Այս ընդհատումները, որոնք նշանակում են փոխված բառեր, ընդգծված են տեսանելիությունն ու տարբերակումը բարձրացնելու համար:

Ստորև դուք կգտնեք փաստացի փաստաթղթի օրինակ:

  • Առաջին քաղվածքը գալիս է մի ֆայլից, որը հաստատվել է օգտագործելով OXSICO գրագողության կանխարգելման ծառայություն.
  • Երկրորդ հատվածը սկզբնաղբյուր փաստաթղթից է.
գրագողություն-զեկույց

Ավելի խորը վերլուծությունից հետո ակնհայտ է դառնում, որ փաստաթղթի ընտրված մասը վերափոխվել է՝ կատարելով հետևյալ փոփոխությունները.

Բնօրինակ տեքստՎերափոխված տեքստԷջեր
աջակցում է նորարարությանը նույնպես բնութագրվում է աջակցում է նորարարությունը, բացի այդ, սահմանված էՓոխարինում
տնտեսական և սոցիալական գիտելիքներ, արդյունավետ համակարգեր տնտեսական և հասարակական իրազեկում, արդյունավետ կազմակերպումՓոխարինում
առաջարկներ (գաղափարներ)առաջարկությունՓոխարինում, ջնջում
վերաբերմունքըկաթվածներՓոխարինում
հաջողությունհաղթողՓոխարինում
գործընթաց (Պերենց, Հոլուբ-Իվանճանաչողական գործընթաց (Պերենց, Հոլուբ – ԻվանԺամանակը
նորարարության կողմնակիցբարենպաստՓոխարինում
կլիմայի ստեղծում:պայման ստեղծելըՓոխարինում
բարենպաստբարգավաճՓոխարինում
գիտելիքների զարգացումզարգացման իրազեկումՓոխարինում

եզրափակում

Գրագողությունը, որը հաճախ չի հայտնաբերվում վերափոխման դեպքերում, շարունակում է զգալի մտահոգություն առաջացնել ակադեմիայում: Տեխնոլոգիական առաջընթացը պլագիատի ստուգիչները համալրել է վերաֆրազավորված բովանդակությունը արդյունավետորեն նույնականացնելու ունակությամբ: Մասնավորապես, գրագողության ստուգիչները հայտնաբերում են պարաֆրազավորում տարբեր մեթոդների միջոցով, ինչպիսիք են տողերի համընկնումը, կոսինուսի նմանությունը և n-gram վերլուծությունը: Հատկանշական է, որ n-gram վերլուծությունը առանձնանում է իր բարձր ճշգրտությամբ: Այս առաջընթացներն էապես նվազեցնում են գրագողության և վերափոխված նյութերի անհայտ մնալու հավանականությունը՝ դրանով իսկ բարձրացնելով ակադեմիական ամբողջականությունը:

Որքան օգտակար էր այս գրառումը:

Սեղմեք այն աստղին գնահատելու համար:

Միջին գնահատականը / 5. Ընտրեք հաշիվը:

Առայժմ ոչ մի ձայն չկա: Եղիր առաջինը, ով կգնահատի այս գրառումը:

Ներեցեք, որ այս գրառումը օգտակար չէ ձեզ համար:

Եկեք բարելենք այս գրառումը:

Ասեք մեզ, թե ինչպես կարող ենք բարելավել այս պաշտոնը: