Плагијат подразумева преузимање заслуга за туђе идеје, речи или слике, што је пракса која се разматра неетичко у академском и професионалном окружењу. То може проћи непримећено од стране ученика који случајно могу преформулисати туђе речи без одговарајућег приписивања. Пошто се наводници не користе када се нешто парафразира, лако се може избећи из руку лектора и прећи у коначну верзију. Међутим, то није сасвим неоствариво, поготово зато што контролори плагијата данас ефикасније детектују парафразирање.
Откривање парафразирања може бити изазован задатак, јер укључује идентификацију сличности и разлика између текстова. У наредним одељцима ћемо се упустити у свеобухватну дискусију о уобичајеним методама и техникама које се користе за уочавање случајева парафразирања.
Како провере плагијата откривају парафразирање: Истражене одговарајуће методе
У данашњем образовном окружењу, провере плагијата су постале све напредније, превазилазећи само означавање копираног текста и откривање парафразираног садржаја. Овај чланак истражује методе које омогућавају овим алатима да ефикасно идентификују парафразирање.
1. Подударање низова
Овај метод укључује упоређивање текстова на нивоу знакова или речи како би се утврдила тачна подударања. Висок степен сличности у секвенцама знакова или избору речи између два текста могао би сигнализирати парафразирање. Ови алати користе сложене алгоритме који чак могу да узму у обзир контекстуално значење речи, што отежава да плагирани, парафразирани материјал остане неоткривен.
2. Косинусна сличност
Косинусна сличност је један од метода помоћу којих контролори плагијата откривају парафразирање. Он мери сличност између два текста на основу угла између њихових векторских репрезентација у високодимензионалном простору. Представљајући текстове као векторе учесталости речи или уградње, ови алати могу да израчунају косинусну оцену сличности да би даље прецизирали своју способност да детектују парафразирани садржај.
3. Модели поравнања речи
Ови модели усклађују речи или фразе између два текста како би идентификовали њихову кореспонденцију. Упоређивањем поравнатих сегмената, можете открити парафразирање на основу сличности и разлика у подударним секвенцама.
4. Семантичка анализа
Овај приступ подразумева анализу значења и контекста речи и фраза у текстовима. Технике попут латентне семантичке анализе (ЛСА), уграђивања речи (као што су Ворд2Вец или ГлоВе) или модели дубоког учења као што је БЕРТ могу ухватити семантичке односе између речи и идентификовати парафразирање на основу сличности њихових семантичких репрезентација.
5. Машинско учење
Надзирани алгоритми машинског учења могу се обучити на означеним скуповима података парафразираних и непарафразираних парова текстова. Ови модели могу научити обрасце и карактеристике које разликују парафразе и могу се користити за класификацију нових инстанци текста као парафразираних или не.
6. Анализа Н-грама
Н-грами су групе речи које се налазе једна поред друге. Када проверите колико се често ове групе појављују у различитим текстовима и упоредите их, можете пронаћи сличне фразе или секвенце. Ако постоји много сличних образаца, то би могло значити да је текст можда парафразиран.
7. Откривање скоро дупликата
Последњи начин на који провере плагијата ефикасно откривају парафразирање.
Алгоритми за детекцију скоро дупликата се често користе у парафразирању детекције да би се прецизно одредили сегменти текста који показују висок степен сличности или су скоро идентични. Ови алгоритми су посебно направљени да препознају парафразирани садржај кроз поређење сличности текста на детаљном нивоу.
Коју методу обично користи софтвер за спречавање плагијата?
Технолошка решења која користе професионалне службе за превенцију плагијата обично се ослањају на н-грам анализу. Коришћењем технологије засноване на н-граму, ове услуге постижу изузетно високу стопу прецизности. Ово је један од најбољих начина на који провере плагијата откривају парафразирање, омогућавајући идентификацију и истицање тачних речи које су преписане.
Механизам како провере плагијата откривају парафразирање
Службе за превенцију плагијата обично користе технику узимања отисака прстију за упоређивање докумената. Ово укључује издвајање потребних н-грама из докумената који треба да буду верификовани и њихово поређење са н-грамима свих докумената у њиховим базама података.
Пример
Рецимо да постоји реченица: « Ле монт Олимпе ест ла плус хауте монтагне де Греце. »
н-грама (на пример 3 грама) ове реченице биће:
- Ле монт Олимпе
- монт Олимпе ест
- Олимпе ест ла
- је највише
- ла плус хауте
- Највиша планина
- хауте монтагне де
- монтагне де Греце
Случај 1. Замена
Ако се реч замени другом речју, још увек нека од н-грама подударање и могуће је детектовати замену речи даљом анализом.
Промењена реченица: "Тхе Планине Олимпе ест ла плус хауте монтагне де Пелопонез. "
Оригинал 3-грама | 3 грама промењеног текста |
Ле монт Олимпе монт Олимпе ест Олимпе ест ла је највише ла плус хауте Највиша планина хауте монтагне де монтагне де Греце | Le Планине Олимп Планине Олимпе ест Олимпе ест ла је највише ла плус хауте Највиша планина хауте монтагне де Монтагне де Пелопонез |
Случај 2. Промењен редослед речи (или реченица, пасуса)
Када се промени редослед реченице, још увек се поклапају неких 3 грама тако да је могуће уочити промену.
Промењена реченица: « Ла плус хауте монтагне де Греце ест Ле монт Олимпе. »
Оригинал 3-грама | 3 грама промењеног текста |
Ле монт Олимпе монт Олимпе ест Олимпе ест ла је највише ла плус хауте Највиша планина хауте монтагне де монтагне де Греце | Ла плус хауте Највиша планина хауте монтагне де монтагне де Греце де Греце ест Греце ест Ле ест Ле монт Ле монт Олимпе |
Случај 3. Додате нове речи
Када се додају нове речи, још увек има неких 3 грама који се подударају тако да је могуће открити промену.
Промењена реченица: « Ле монт Олимпе ест издалека ла плус хауте монтагне де Греце. »
Оригинал 3-грама | 3 грама промењеног текста |
Ле монт Олимпе монт Олимпе ест Олимпе ест ла је највише ла плус хауте Највиша планина хауте монтагне де монтагне де Греце | Ле монт Олимпе монт Олимпе ест Олимпе ест де ест де лоин далеко лоин ла плус ла плус хауте Највиша планина хауте монтагне де монтагне де Греце |
Случај 4. Избрисане неке речи
Када се реч уклони, има још неких 3 грама који се подударају тако да је могуће открити промену.
Промењена реченица: « Л'Олимпе ест ла плус хауте монтагне де Греце. »
Оригинал 3-грама | 3 грама промењеног текста |
Ле монт Олимпе монт Олимпе ест Олимпе ест ла је највише ла плус хауте Највиша планина хауте монтагне де монтагне де Греце | Л'Олимпе ест ла је највише ла плус хауте Највиша планина хауте монтагне де монтагне де Греце |
Пример из стварног света
По завршетку верификације у стварном документу, парафразирани делови се често идентификују кроз испрекидане ознаке. Ови прекиди, који означавају измењене речи, су истакнути да би се побољшала видљивост и разликовање.
У наставку ћете наћи пример стварног документа.
- Први извод долази из датотеке која је верификована помоћу ОКССИЦО служба за превенцију плагијата:
- Други извод је из оригиналног изворног документа:
Након дубље анализе видљиво је да је одабрани део документа парафразиран уношењем следећих измена:
Оригинални текст | Парафразирани текст | Промене |
подржава иновације такође карактерише | подржава иновације је поред тога дефинисан | Замена |
економска и друштвена знања, ефикасни системи | економска и друштвена свест, ефикасна организација | Замена |
предлози (идеје) | препорука | Замена, брисање |
ставови | држања тела | Замена |
успех | победник | Замена |
процес (Перенц, Холуб-Иван | когнитивни процес (Перенц, Холуб – Иван | Додатак |
про-иновација | повољан | Замена |
стварање климе | : стварање услова | Замена |
повољан | просперитетан | Замена |
развијање знања | развој свести | Замена |
Zakljucak
Плагијат, који се често не открива у случајевима парафразирања, остаје значајан проблем у академској заједници. Технолошки напредак је опремио провере плагијата способношћу да ефикасно идентификују парафразирани садржај. Конкретно, провере плагијата откривају парафразирање кроз различите методе као што су подударање низова, косинусна сличност и анализа н-грама. Значајно је да се анализа н-грама истиче својом високом стопом прецизности. Ова побољшања значајно смањују вероватноћу да плагирани и парафразирани материјал остане неоткривен, чиме се повећава академски интегритет. |