Գրագողությունը ներառում է ուրիշի գաղափարների, խոսքերի կամ պատկերների հարգանքը, որը համարվում է պրակտիկա անբարոյական ակադեմիական և մասնագիտական միջավայրերում: Այն կարող է աննկատ մնալ ուսանողների կողմից, ովքեր կարող են պատահաբար վերափոխել ուրիշի խոսքերը՝ առանց պատշաճ վերագրման: Քանի որ չակերտները չեն օգտագործվում, երբ ինչ-որ բան վերափոխվում է, այն հեշտությամբ կարող է վրիպել սրբագրողի ձեռքից և անցնել վերջնական նախագծի: Այնուամենայնիվ, դա լիովին անհասանելի չէ, մանավանդ, որ գրագողության ստուգիչները մեր օրերում ավելի արդյունավետ են հայտնաբերում վերափոխումը:
Պարաֆրազիայի հայտնաբերումը կարող է դժվար խնդիր լինել, քանի որ այն ներառում է տեքստերի միջև նմանություններն ու տարբերությունները: Հետագա բաժիններում մենք կխորանանք համապարփակ քննարկման մեջ այն ընդհանուր մեթոդների և մեթոդների մասին, որոնք օգտագործվում են վերափոխման դեպքերը տարբերելու համար:
Ինչպե՞ս են գրագողության ստուգիչները հայտնաբերում պարաֆրազավորումը. ուսումնասիրված են համապատասխան մեթոդներ
Այսօրվա կրթական լանդշաֆտում գրագողության ստուգիչները գնալով ավելի են զարգացել՝ անցնելով միայն պատճենված տեքստը դրոշակելուց և վերափոխված բովանդակության հայտնաբերմամբ: Այս հոդվածը ուսումնասիրում է այն մեթոդները, որոնք թույլ են տալիս այս գործիքներին արդյունավետ կերպով բացահայտել պարաֆրազավորումը:
1. Լարի համապատասխանեցում
Այս մեթոդը ներառում է տեքստերի համեմատություն նիշերի կամ բառի մակարդակով` ճշգրիտ համընկնումները մատնանշելու համար: Երկու տեքստերի միջև նիշերի հաջորդականությունների կամ բառերի ընտրության նմանության բարձր աստիճանը կարող է ազդարարել վերափոխում: Այս գործիքներն օգտագործում են բարդ ալգորիթմներ, որոնք կարող են նույնիսկ դիտարկել բառերի համատեքստային իմաստը, ինչը դժվարացնում է գրագողության, պարաֆրազավորված նյութերի աննկատ մնալը:
2. Կոսինուսների նմանություն
Կոսինուսների նմանությունը այն մեթոդներից մեկն է, որով գրագողության ստուգիչները հայտնաբերում են պարաֆրազավորումը: Այն չափում է երկու տեքստերի միջև եղած նմանությունը՝ հիմնվելով դրանց վեկտորային պատկերների միջև բարձրաչափ տարածության անկյան վրա: Տեքստերը ներկայացնելով որպես բառի հաճախականությունների կամ ներկառուցման վեկտորներ՝ այս գործիքները կարող են հաշվարկել կոսինուսի նմանության միավորը՝ հետագայում կատարելագործելու վերաֆրազավորված բովանդակությունը հայտնաբերելու իրենց կարողությունը:
3. Բառերի հավասարեցման մոդելներ
Այս մոդելները հավասարեցնում են բառերը կամ արտահայտությունները երկու տեքստերի միջև՝ պարզելու դրանց համապատասխանությունը: Համեմատելով հավասարեցված հատվածները՝ դուք կարող եք հայտնաբերել պարաֆրազավորում՝ հիմնված համապատասխան հաջորդականությունների նմանությունների և տարբերությունների վրա:
4. Իմաստային վերլուծություն
Այս մոտեցումը ներառում է տեքստերում բառերի և արտահայտությունների իմաստի և համատեքստի վերլուծություն: Տեխնիկաները, ինչպիսիք են թաքնված իմաստային վերլուծությունը (LSA), բառերի ներկառուցումը (օրինակ, Word2Vec կամ GloVe) կամ խորը ուսուցման մոդելները, ինչպիսին BERT-ն է, կարող են ֆիքսել բառերի միջև իմաստային հարաբերությունները և որոշել պարաֆրազավորումը՝ հիմնվելով դրանց իմաստային ներկայացումների նմանության վրա:
5. Մեքենայի ուսուցում
Վերահսկվող մեքենայական ուսուցման ալգորիթմները կարող են վերապատրաստվել պարաֆրազավորված և չպարաֆրազավորված զույգ տեքստերի պիտակավորված տվյալների հավաքածուների վրա: Այս մոդելները կարող են սովորել օրինաչափություններ և առանձնահատկություններ, որոնք տարբերակում են պարաֆրազները և կարող են օգտագործվել տեքստի նոր օրինակները դասակարգելու համար՝ որպես պարաֆրազավորված կամ ոչ:
6. N-գրամ անալիզ
N-գրամները բառերի խմբեր են, որոնք գտնվում են իրար կողքի: Երբ ստուգեք, թե որքան հաճախ են այս խմբերը հայտնվում տարբեր տեքստերում և համեմատում դրանք, կարող եք գտնել նմանատիպ արտահայտություններ կամ հաջորդականություններ: Եթե կան բազմաթիվ նմանատիպ օրինաչափություններ, դա կարող է նշանակել, որ տեքստը կարող է վերափոխված լինել:
7. Մոտ կրկնօրինակների հայտնաբերում
Վերջին միջոցը, որով գրագողությունը ստուգողները արդյունավետ կերպով հայտնաբերում են պարաֆրազավորումը:
Գրեթե կրկնակի հայտնաբերման ալգորիթմները հաճախ օգտագործվում են հայտնաբերման պարաֆրազավորման մեջ՝ տեքստի հատվածները մատնանշելու համար, որոնք բարձր աստիճանի նմանություն են ցուցադրում կամ գրեթե նույնական են: Այս ալգորիթմները հատուկ մշակված են՝ ճանաչելու վերաֆրազավորված բովանդակությունը՝ մանրամասն մակարդակով տեքստի նմանության համեմատության միջոցով:
Ո՞ր մեթոդն է սովորաբար օգտագործում գրագողության կանխարգելման ծրագրաշարը:
Գրագողության կանխարգելման պրոֆեսիոնալ ծառայությունների կողմից կիրառվող տեխնոլոգիական լուծումները սովորաբար հիմնվում են n-gram վերլուծության վրա: Օգտագործելով n-gram-ի վրա հիմնված տեխնոլոգիան՝ այս ծառայությունները հասնում են զգալի բարձր ճշգրտության ցուցանիշի: Սա լավագույն միջոցներից մեկն է, որով գրագողությունը ստուգողները հայտնաբերում են վերափոխումը, ինչը հնարավորություն է տալիս նույնականացնել և ընդգծել ճշգրիտ բառերը, որոնք վերագրված են:
Մեխանիկա, թե ինչպես են գրագողության ստուգիչները հայտնաբերում պարաֆրազավորումը
Գրագողությունների կանխարգելման ծառայությունները սովորաբար օգտագործում են մատնահետքերի տեխնիկան՝ փաստաթղթերը համեմատելու համար: Սա ներառում է ստուգման ենթակա փաստաթղթերից անհրաժեշտ n-գրամների դուրսբերումը և դրանց տվյալների բազայի բոլոր փաստաթղթերի n-գրամների հետ համեմատումը:
Օրինակ
Ասենք մի նախադասություն կա. « Le mont Olympe est la plus haute montagne de Grèce. »
The n-գրամ (օրինակ 3 գրամ) այս նախադասությունից կլինի.
- Le mont Olympe
- Mont Olympe est
- Olympe est la
- ամենաշատն է
- la plus haute
- ամենաբարձր լեռը
- Haute montagne de
- montagne de Grèce
Դեպք 1. Փոխարինում
Եթե բառը փոխարինվում է մեկ այլ բառով, դեռ մի քանիսը n-գրամ համընկնում է, և հետագա վերլուծությամբ հնարավոր է հայտնաբերել բառի փոխարինումը:
Փոփոխված նախադասություն. «The լեռներ Olympe est la plus haute montagne de Պելոպոնես: "
Օրիգինալ 3 գրամ | 3 գրամ փոխված տեքստ |
Le mont Olympe Mont Olympe est Olympe est la ամենաշատն է la plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce | Le լեռներ Olympus լեռներ Olympe est Olympe est la ամենաշատն է la plus haute ամենաբարձր լեռը Haute montagne de Մոնտանյե դե Պելոպոնես |
Դեպք 2. Փոխվել է բառերի (կամ նախադասությունների, պարբերությունների) հերթականությունը.
Երբ նախադասության հերթականությունը փոխվում է, դեռ մի քանի 3 գրամ համընկնում է, որպեսզի հնարավոր լինի հայտնաբերել փոփոխությունը:
Փոփոխված նախադասություն. « La plus haute montagne de Grèce est Le mont Olympe. »
Օրիգինալ 3 գրամ | 3 գրամ փոխված տեքստ |
Le mont Olympe Mont Olympe est Olympe est la ամենաշատն է la plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce | La plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Դեպք 3. Ավելացրել է նոր բառեր
Երբ ավելացվեն նոր բառերը, դեռ մնում են 3 գրամ, որոնք համընկնում են, այնպես որ հնարավոր է հայտնաբերել փոփոխությունը:
Փոփոխված նախադասություն. «Le mont Olympe est հեռվից la plus haute montagne de Grèce. »
Օրիգինալ 3 գրամ | 3 գրամ փոխված տեքստ |
Le mont Olympe Mont Olympe est Olympe est la ամենաշատն է la plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce | Le mont Olympe Mont Olympe est Olympe est de est de loin հեռու լոին լա պլյուս la plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce |
Դեպք 4. Ջնջել է որոշ բառեր
Երբ բառը հանվում է, դեռ մնում է 3 գրամ, որը համապատասխանում է, այնպես որ հնարավոր է հայտնաբերել փոփոխությունը:
Փոփոխված նախադասություն. «L'Olympe est la plus haute montagne de Grèce. »
Օրիգինալ 3 գրամ | 3 գրամ փոխված տեքստ |
Le mont Olympe Mont Olympe est Olympe est la ամենաշատն է la plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce | L'Olympe est la ամենաշատն է la plus haute ամենաբարձր լեռը Haute montagne de montagne de Grèce |
Իրական աշխարհի օրինակ
Փաստացի փաստաթղթում ստուգումն ավարտվելուց հետո պարաֆրազավորված բաժինները հաճախ նույնացվում են ընդհատված գծանշումների միջոցով: Այս ընդհատումները, որոնք նշանակում են փոխված բառեր, ընդգծված են տեսանելիությունն ու տարբերակումը բարձրացնելու համար:
Ստորև դուք կգտնեք փաստացի փաստաթղթի օրինակ:
- Առաջին քաղվածքը գալիս է մի ֆայլից, որը հաստատվել է օգտագործելով OXSICO գրագողության կանխարգելման ծառայություն.
- Երկրորդ հատվածը սկզբնաղբյուր փաստաթղթից է.
Ավելի խորը վերլուծությունից հետո ակնհայտ է դառնում, որ փաստաթղթի ընտրված մասը վերափոխվել է՝ կատարելով հետևյալ փոփոխությունները.
Բնօրինակ տեքստ | Վերափոխված տեքստ | Էջեր |
աջակցում է նորարարությանը նույնպես բնութագրվում է | աջակցում է նորարարությունը, բացի այդ, սահմանված է | Փոխարինում |
տնտեսական և սոցիալական գիտելիքներ, արդյունավետ համակարգեր | տնտեսական և հասարակական իրազեկում, արդյունավետ կազմակերպում | Փոխարինում |
առաջարկներ (գաղափարներ) | առաջարկություն | Փոխարինում, ջնջում |
վերաբերմունքը | կաթվածներ | Փոխարինում |
հաջողություն | հաղթող | Փոխարինում |
գործընթաց (Պերենց, Հոլուբ-Իվան | ճանաչողական գործընթաց (Պերենց, Հոլուբ – Իվան | Ժամանակը |
նորարարության կողմնակից | բարենպաստ | Փոխարինում |
կլիմայի ստեղծում | :պայման ստեղծելը | Փոխարինում |
բարենպաստ | բարգավաճ | Փոխարինում |
գիտելիքների զարգացում | զարգացման իրազեկում | Փոխարինում |
Եզրափակում
Գրագողությունը, որը հաճախ չի հայտնաբերվում վերափոխման դեպքերում, շարունակում է զգալի մտահոգություն առաջացնել ակադեմիայում: Տեխնոլոգիական առաջընթացը պլագիատի ստուգիչները համալրել է վերաֆրազավորված բովանդակությունը արդյունավետորեն նույնականացնելու ունակությամբ: Մասնավորապես, գրագողության ստուգիչները հայտնաբերում են պարաֆրազավորում տարբեր մեթոդների միջոցով, ինչպիսիք են տողերի համընկնումը, կոսինուսի նմանությունը և n-gram վերլուծությունը: Հատկանշական է, որ n-gram վերլուծությունը առանձնանում է իր բարձր ճշգրտությամբ: Այս առաջընթացներն էապես նվազեցնում են գրագողության և վերափոխված նյութերի անհայտ մնալու հավանականությունը՝ դրանով իսկ բարձրացնելով ակադեմիական ամբողջականությունը: |