Плагиат басқа біреудің идеялары, сөздері немесе суреттері үшін несие алуды қамтиды, бұл тәжірибе қарастырылады этикалық емес академиялық және кәсіби ортада. Бұл басқа біреудің сөзін дұрыс атрибутсыз кездейсоқ қайталауы мүмкін студенттердің назарынан тыс қалуы мүмкін. Тырнақшалар бірдеңені қайталау кезінде пайдаланылмайтындықтан, ол корректордың қолынан оңай құтылып, соңғы жобаға өтуі мүмкін. Дегенмен, бұл мүлдем мүмкін емес, әсіресе плагиат тексерушілер қазіргі уақытта парафразаны тиімдірек анықтайтындықтан.
Парафразаны анықтау қиын тапсырма болуы мүмкін, өйткені ол мәтіндер арасындағы ұқсастықтар мен айырмашылықтарды анықтауды қамтиды. Келесі бөлімдерде біз парафраза мысалдарын анықтау үшін қолданылатын жалпы әдістер мен әдістер туралы жан-жақты талқылауды қарастырамыз.
Плагиат тексерушілері парафразаны қалай анықтайды: Тиісті әдістер зерттелді
Бүгінгі білім беру ландшафтында плагиат тексергіштері барған сайын жетілдірілген, көшірілген мәтінді белгілеумен шектеліп, қайталанған мазмұнды анықтауға дейін барады. Бұл мақала осы құралдарға парафразаны тиімді анықтауға мүмкіндік беретін әдістерді зерттейді.
1. Жолды сәйкестендіру
Бұл әдіс дәл сәйкестіктерді анықтау үшін мәтіндерді таңба немесе сөз деңгейінде салыстыруды қамтиды. Екі мәтін арасындағы таңбалар тізбегіндегі немесе сөз таңдауындағы жоғары дәрежелі ұқсастық парафразаны көрсетуі мүмкін. Бұл құралдар күрделі алгоритмдерді қолданады, олар тіпті сөздердің контекстік мағынасын қарастыра алады, бұл плагиат, парафразаланған материалдың анықталмауын қиындатады.
2. Косинустардың ұқсастығы
Косинус ұқсастығы - плагиат тексерушілері парафразаны анықтайтын әдістердің бірі. Ол жоғары өлшемді кеңістіктегі векторлық көріністер арасындағы бұрыш негізінде екі мәтіннің ұқсастығын өлшейді. Мәтіндерді сөз жиіліктерінің немесе ендірулердің векторлары ретінде көрсету арқылы бұл құралдар перифразирленген мазмұнды анықтау мүмкіндігін одан әрі нақтылау үшін косинус ұқсастық ұпайын есептей алады.
3. Сөздерді туралау модельдері
Бұл модельдер екі мәтін арасындағы сәйкестіктерді анықтау үшін сөздерді немесе сөз тіркестерін туралайды. Түзетілген сегменттерді салыстыру арқылы сәйкес тізбектердегі ұқсастықтар мен айырмашылықтар негізінде парафразаны анықтауға болады.
4. Семантикалық талдау
Бұл тәсіл мәтіндердегі сөздер мен сөз тіркестерінің мағынасы мен контекстін талдауды қамтиды. Жасырын семантикалық талдау (LSA), сөздерді ендіру (Word2Vec немесе GloVe сияқты) немесе BERT сияқты терең оқыту үлгілері сияқты әдістер сөздер арасындағы семантикалық қарым-қатынастарды түсіріп, олардың семантикалық көріністерінің ұқсастығына негізделген парафразаны анықтай алады.
5. Машина жасау
Бақыланатын машиналық оқыту алгоритмдерін мәтіндердің парафразаланған және парафразаланбаған жұптарының таңбаланған деректер жиынында оқытуға болады. Бұл үлгілер парафразаларды ажырататын үлгілер мен мүмкіндіктерді үйрене алады және мәтіннің жаңа даналарын парафразаланған немесе жоқ деп жіктеу үшін пайдаланылуы мүмкін.
6. N-граммдық талдау
N-граммдар - бір-біріне жақын орналасқан сөздер тобы. Бұл топтардың әртүрлі мәтіндерде қаншалықты жиі кездесетінін тексеріп, оларды салыстырсаңыз, ұқсас тіркестерді немесе тізбектерді таба аласыз. Ұқсас үлгілер көп болса, бұл мәтіннің перфрафразаланған болуы мүмкін дегенді білдіруі мүмкін.
7. Қайталанатын анықтау
Плагиат тексерушілері парафразаны тиімді анықтаудың соңғы жолы.
Қайталанатын дерлік анықтау алгоритмдері ұқсастық деңгейі жоғары немесе бірдей дерлік мәтін сегменттерін анықтау үшін анықтауды қайталауда жиі қолданылады. Бұл алгоритмдер мәтіннің ұқсастығын егжей-тегжейлі деңгейде салыстыру арқылы қайталанған мазмұнды тану үшін арнайы жасалған.
Плагиаттың алдын алу бағдарламалық құралы әдетте қандай әдісті қолданады?
Кәсіби плагиаттың алдын алу қызметтері пайдаланатын технологиялық шешімдер әдетте n-gram талдауына сүйенеді. n-gram негізіндегі технологияны қолдана отырып, бұл қызметтер өте жоғары дәлдік көрсеткішіне қол жеткізеді. Бұл плагиат тексерушілерінің қайта жазылған сөздерді анықтауға және бөлектеуге мүмкіндік беретін парафразаны анықтаудың ең жақсы тәсілдерінің бірі.
Плагиат тексергіштерінің парафразаны анықтау механизмі
Плагиаттың алдын алу қызметтері құжаттарды салыстыру үшін әдетте саусақ ізін алу әдісін пайдаланады. Бұл тексерілетін құжаттардан қажетті n-граммдарды алуды және оларды деректер қорындағы барлық құжаттардың n-граммдарымен салыстыруды қамтиды.
мысал
Мына сөйлем бар делік: « Le mont Olympe est la plus Haute Montagne de Grece. »
The n-грамм (мысалы, 3 грамм) бұл сөйлемнің келесілері болады:
- Ле монт Олимп
- Монт Олимп est
- Olympe est la
- ең көп
- la plus haute
- плюс жоғары Монтань
- жоғары монтань де
- Монтань де Греция
1-жағдай. Ауыстыру
Егер сөз басқа сөзбен ауыстырылса, әлі де кейбір n-грамм сәйкес келеді және әрі қарай талдау арқылы сөзді ауыстыруды анықтауға болады.
Өзгертілген сөйлем: «The тау Olympe est la plus high montangne de Пелопоннес. «
Түпнұсқа 3 грамм | 3 грамм өзгертілген мәтін |
Ле монт Олимп Монт Олимп est Olympe est la ең көп la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Греция | Le тау Olympus тау Олимп est Olympe est la ең көп la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Пелопоннес |
2-жағдай. Сөздердің (немесе сөйлемдердің, абзацтардың) реті өзгертілді.
Сөйлемнің реті өзгертілгенде, кейбір 3 грамм сәйкес келеді, сондықтан өзгерісті анықтауға болады.
Өзгертілген сөйлем: « La plus montagne de Grece est Le mont Olympe. »
Түпнұсқа 3 грамм | 3 грамм өзгертілген мәтін |
Ле монт Олимп Монт Олимп est Olympe est la ең көп la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Греция | Ла плюс жоғары плюс жоғары Монтань жоғары монтань де Монтань де Греция de Grece est Grece est Le est Le Mont Ле монт Олимп |
Жағдай 3. Жаңа сөздер қосылды
Жаңа сөздер қосылғанда, әлі де сәйкес келетін 3 грамм бар, сондықтан өзгерісті анықтауға болады.
Өзгертілген сөйлем: « Le mont Olympe est де бел la plus Haute montagne de Grece. »
Түпнұсқа 3 грамм | 3 грамм өзгертілген мәтін |
Ле монт Олимп Монт Олимп est Olympe est la ең көп la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Греция | Ле монт Олимп Монт Олимп est Olympe est de est de loin алыс loin la plus la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Греция |
Кейс 4. Кейбір сөздер жойылды
Сөзді алып тастағанда, өзгерісті анықтауға болатын 3 грамм сәйкес келеді.
Өзгертілген сөйлем: « L'Olympe est la plus Haute Montagne de Grece. »
Түпнұсқа 3 грамм | 3 грамм өзгертілген мәтін |
Ле монт Олимп Монт Олимп est Olympe est la ең көп la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Греция | L'Olympe est la ең көп la plus haute плюс жоғары Монтань жоғары монтань де Монтань де Греция |
Нақты мысал
Нақты құжатта тексеруді аяқтағаннан кейін үзілген таңбалар арқылы парафразаланған бөлімдер жиі анықталады. Өзгертілген сөздерді білдіретін бұл үзілістер көріну мен айырмашылықты жақсарту үшін бөлектеледі.
Төменде сіз нақты құжаттың мысалын таба аласыз.
- Бірінші үзінді арқылы тексерілген файлдан алынған OXSICO плагиаттың алдын алу қызметі:
- Екінші үзінді бастапқы құжаттан:
Тереңірек талдаудан кейін құжаттың таңдалған бөлігі келесі өзгерістерді енгізу арқылы парафразаланғаны анық болды:
Бастапқы мәтін | Парафразаланған мәтін | өзгерістер |
инновацияны қолдайды деп те сипатталады | инновацияның резерві анықталғаннан басқа | Ауыстыру |
экономикалық және әлеуметтік білімдер, тиімді жүйелер | экономикалық және қоғамдық сана, тиімді ұйымдастыру | Ауыстыру |
ұсыныстар (идеялар) | ұсыныс | Ауыстыру, жою |
қатынасы | тұрақтылық | Ауыстыру |
табыс | жеңімпаз | Ауыстыру |
процесс (Перенц, Холуб-Иван | когнитивті процесс (Перенц, Холуб – Иван | қосу |
жаңашылдықты жақтаушы | қолайлы | Ауыстыру |
климат құру | : жағдай жасау | Ауыстыру |
қолайлы | гүлденген | Ауыстыру |
білімдерін дамыту | дамыту туралы хабардарлық | Ауыстыру |
қорытынды
Плагиат, жиі қайталау кезінде анықталмайтын, академияда маңызды мәселе болып қала береді. Технологиялық жетістіктер плагиат тексергіштерін парафразаланған мазмұнды тиімді анықтау мүмкіндігімен жабдықтады. Атап айтқанда, плагиат тексергіштері жолды сәйкестендіру, косинус ұқсастығы және n-грамды талдау сияқты әртүрлі әдістер арқылы парафразаны анықтайды. Атап айтқанда, n-грамдық талдау өзінің жоғары дәлдік жылдамдығымен ерекшеленеді. Бұл жетістіктер плагиат және парафразаланған материалдың анықталмай қалу ықтималдығын айтарлықтай төмендетеді, осылайша академиялық адалдықты арттырады. |