Плагиат тексерушілері парафразаны қалай анықтайды?

қалай-плагиат-тексерушілер-анықтайды-парафраза
()

Плагиат басқа біреудің идеялары, сөздері немесе суреттері үшін несие алуды қамтиды, бұл тәжірибе қарастырылады этикалық емес академиялық және кәсіби ортада. Бұл басқа біреудің сөзін дұрыс атрибутсыз кездейсоқ қайталауы мүмкін студенттердің назарынан тыс қалуы мүмкін. Тырнақшалар бірдеңені қайталау кезінде пайдаланылмайтындықтан, ол корректордың қолынан оңай құтылып, соңғы жобаға өтуі мүмкін. Дегенмен, бұл мүлдем мүмкін емес, әсіресе плагиат тексерушілер қазіргі уақытта парафразаны тиімдірек анықтайтындықтан.

Парафразаны анықтау қиын тапсырма болуы мүмкін, өйткені ол мәтіндер арасындағы ұқсастықтар мен айырмашылықтарды анықтауды қамтиды. Келесі бөлімдерде біз парафраза мысалдарын анықтау үшін қолданылатын жалпы әдістер мен әдістер туралы жан-жақты талқылауды қарастырамыз.

Плагиат тексерушілері парафразаны қалай анықтайды: Тиісті әдістер зерттелді

Бүгінгі білім беру ландшафтында плагиат тексергіштері барған сайын жетілдірілген, көшірілген мәтінді белгілеумен шектеліп, қайталанған мазмұнды анықтауға дейін барады. Бұл мақала осы құралдарға парафразаны тиімді анықтауға мүмкіндік беретін әдістерді зерттейді.

плагиат-тексерушілер-анықтайды-парафраза

1. Жолды сәйкестендіру

Бұл әдіс дәл сәйкестіктерді анықтау үшін мәтіндерді таңба немесе сөз деңгейінде салыстыруды қамтиды. Екі мәтін арасындағы таңбалар тізбегіндегі немесе сөз таңдауындағы жоғары дәрежелі ұқсастық парафразаны көрсетуі мүмкін. Бұл құралдар күрделі алгоритмдерді қолданады, олар тіпті сөздердің контекстік мағынасын қарастыра алады, бұл плагиат, парафразаланған материалдың анықталмауын қиындатады.

2. Косинустардың ұқсастығы

Косинус ұқсастығы - плагиат тексерушілері парафразаны анықтайтын әдістердің бірі. Ол жоғары өлшемді кеңістіктегі векторлық көріністер арасындағы бұрыш негізінде екі мәтіннің ұқсастығын өлшейді. Мәтіндерді сөз жиіліктерінің немесе ендірулердің векторлары ретінде көрсету арқылы бұл құралдар перифразирленген мазмұнды анықтау мүмкіндігін одан әрі нақтылау үшін косинус ұқсастық ұпайын есептей алады.

3. Сөздерді туралау модельдері

Бұл модельдер екі мәтін арасындағы сәйкестіктерді анықтау үшін сөздерді немесе сөз тіркестерін туралайды. Түзетілген сегменттерді салыстыру арқылы сәйкес тізбектердегі ұқсастықтар мен айырмашылықтар негізінде парафразаны анықтауға болады.

4. Семантикалық талдау

Бұл тәсіл мәтіндердегі сөздер мен сөз тіркестерінің мағынасы мен контекстін талдауды қамтиды. Жасырын семантикалық талдау (LSA), сөздерді ендіру (Word2Vec немесе GloVe сияқты) немесе BERT сияқты терең оқыту үлгілері сияқты әдістер сөздер арасындағы семантикалық қарым-қатынастарды түсіріп, олардың семантикалық көріністерінің ұқсастығына негізделген парафразаны анықтай алады.

5. Машина жасау

Бақыланатын машиналық оқыту алгоритмдерін мәтіндердің парафразаланған және парафразаланбаған жұптарының таңбаланған деректер жиынында оқытуға болады. Бұл үлгілер парафразаларды ажырататын үлгілер мен мүмкіндіктерді үйрене алады және мәтіннің жаңа даналарын парафразаланған немесе жоқ деп жіктеу үшін пайдаланылуы мүмкін.

6. N-граммдық талдау

N-граммдар - бір-біріне жақын орналасқан сөздер тобы. Бұл топтардың әртүрлі мәтіндерде қаншалықты жиі кездесетінін тексеріп, оларды салыстырсаңыз, ұқсас тіркестерді немесе тізбектерді таба аласыз. Ұқсас үлгілер көп болса, бұл мәтіннің перфрафразаланған болуы мүмкін дегенді білдіруі мүмкін.

7. Қайталанатын анықтау

Плагиат тексерушілері парафразаны тиімді анықтаудың соңғы жолы.

Қайталанатын дерлік анықтау алгоритмдері ұқсастық деңгейі жоғары немесе бірдей дерлік мәтін сегменттерін анықтау үшін анықтауды қайталауда жиі қолданылады. Бұл алгоритмдер мәтіннің ұқсастығын егжей-тегжейлі деңгейде салыстыру арқылы қайталанған мазмұнды тану үшін арнайы жасалған.

Плагиаттың алдын алу бағдарламалық құралы әдетте қандай әдісті қолданады?

Кәсіби плагиаттың алдын алу қызметтері пайдаланатын технологиялық шешімдер әдетте n-gram талдауына сүйенеді. n-gram негізіндегі технологияны қолдана отырып, бұл қызметтер өте жоғары дәлдік көрсеткішіне қол жеткізеді. Бұл плагиат тексерушілерінің қайта жазылған сөздерді анықтауға және бөлектеуге мүмкіндік беретін парафразаны анықтаудың ең жақсы тәсілдерінің бірі.

Плагиат тексергіштерінің парафразаны анықтау механизмі

Плагиаттың алдын алу қызметтері құжаттарды салыстыру үшін әдетте саусақ ізін алу әдісін пайдаланады. Бұл тексерілетін құжаттардан қажетті n-граммдарды алуды және оларды деректер қорындағы барлық құжаттардың n-граммдарымен салыстыруды қамтиды.

оқушылар-оқу-қалай-плагиат-тексерушілер-анықтайды-парафраза

мысал

Мына сөйлем бар делік: « Le mont Olympe est la plus Haute Montagne de Grece. »

The n-грамм (мысалы, 3 грамм) бұл сөйлемнің келесілері болады:

  • Ле монт Олимп
  • Монт Олимп est
  • Olympe est la
  • ең көп
  • la plus haute
  • плюс жоғары Монтань
  • жоғары монтань де
  • Монтань де Греция

1-жағдай. Ауыстыру

Егер сөз басқа сөзбен ауыстырылса, әлі де кейбір n-грамм сәйкес келеді және әрі қарай талдау арқылы сөзді ауыстыруды анықтауға болады.

Өзгертілген сөйлем:  «The тау Olympe est la plus high montangne ​​de Пелопоннес. «

Түпнұсқа 3 грамм3 грамм өзгертілген мәтін
Ле монт Олимп
Монт Олимп est
Olympe est la
ең көп
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция
Le тау Olympus
тау Олимп est
Olympe est la
ең көп
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Пелопоннес

2-жағдай. Сөздердің (немесе сөйлемдердің, абзацтардың) реті өзгертілді.

Сөйлемнің реті өзгертілгенде, кейбір 3 грамм сәйкес келеді, сондықтан өзгерісті анықтауға болады.

Өзгертілген сөйлем: « La plus montagne de Grece est Le mont Olympe. »

Түпнұсқа 3 грамм3 грамм өзгертілген мәтін
Ле монт Олимп
Монт Олимп est
Olympe est la
ең көп
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция
Ла плюс жоғары
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция
de Grece est
Grece est Le
est Le Mont
Ле монт Олимп

Жағдай 3. Жаңа сөздер қосылды

Жаңа сөздер қосылғанда, әлі де сәйкес келетін 3 грамм бар, сондықтан өзгерісті анықтауға болады.

Өзгертілген сөйлем: « Le mont Olympe est де бел la plus Haute montagne de Grece. »

Түпнұсқа 3 грамм3 грамм өзгертілген мәтін
Ле монт Олимп
Монт Олимп est
Olympe est la
ең көп
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция
Ле монт Олимп
Монт Олимп est
Olympe est de
est de loin
алыс
loin la plus
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция

Кейс 4. Кейбір сөздер жойылды

Сөзді алып тастағанда, өзгерісті анықтауға болатын 3 грамм сәйкес келеді.

Өзгертілген сөйлем: « L'Olympe est la plus Haute Montagne de Grece. »

Түпнұсқа 3 грамм3 грамм өзгертілген мәтін
Ле монт Олимп
Монт Олимп est
Olympe est la
ең көп
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция
L'Olympe est la
ең көп
la plus haute
плюс жоғары Монтань
жоғары монтань де
Монтань де Греция

Нақты мысал

Нақты құжатта тексеруді аяқтағаннан кейін үзілген таңбалар арқылы парафразаланған бөлімдер жиі анықталады. Өзгертілген сөздерді білдіретін бұл үзілістер көріну мен айырмашылықты жақсарту үшін бөлектеледі.

Төменде сіз нақты құжаттың мысалын таба аласыз.

  • Бірінші үзінді арқылы тексерілген файлдан алынған OXSICO плагиаттың алдын алу қызметі:
  • Екінші үзінді бастапқы құжаттан:
плагиат-есеп

Тереңірек талдаудан кейін құжаттың таңдалған бөлігі келесі өзгерістерді енгізу арқылы парафразаланғаны анық болды:

Бастапқы мәтінПарафразаланған мәтінөзгерістер
инновацияны қолдайды деп те сипатталады инновацияның резерві анықталғаннан басқаАуыстыру
экономикалық және әлеуметтік білімдер, тиімді жүйелер экономикалық және қоғамдық сана, тиімді ұйымдастыруАуыстыру
ұсыныстар (идеялар)ұсынысАуыстыру, жою
қатынасытұрақтылықАуыстыру
табысжеңімпазАуыстыру
процесс (Перенц, Холуб-Иванкогнитивті процесс (Перенц, Холуб – Иванқосу
жаңашылдықты жақтаушықолайлыАуыстыру
климат құру: жағдай жасауАуыстыру
қолайлыгүлденгенАуыстыру
білімдерін дамытудамыту туралы хабардарлықАуыстыру

қорытынды

Плагиат, жиі қайталау кезінде анықталмайтын, академияда маңызды мәселе болып қала береді. Технологиялық жетістіктер плагиат тексергіштерін парафразаланған мазмұнды тиімді анықтау мүмкіндігімен жабдықтады. Атап айтқанда, плагиат тексергіштері жолды сәйкестендіру, косинус ұқсастығы және n-грамды талдау сияқты әртүрлі әдістер арқылы парафразаны анықтайды. Атап айтқанда, n-грамдық талдау өзінің жоғары дәлдік жылдамдығымен ерекшеленеді. Бұл жетістіктер плагиат және парафразаланған материалдың анықталмай қалу ықтималдығын айтарлықтай төмендетеді, осылайша академиялық адалдықты арттырады.

Бұл лауазым қаншалықты пайдалы болды?

Оны бағалау үшін жұлдызды басыңыз!

Орташа рейтингі / 5. Дауыс саны:

Әзірге дауыс жоқ! Бұл жазбаны бірінші болып бағалаңыз.

Кешіріңіз, бұл пост сіз үшін пайдалы болмады!

Осы постты жақсартуға рұқсат етіңіз!

Осы жазбаны қалай жақсартуға болатынын айтыңыз?