Плагијатот вклучува преземање заслуги за туѓи идеи, зборови или слики, што се смета за практика неетички во академски и професионални средини. Тоа може да остане незабележано од учениците кои случајно може да преформулираат туѓи зборови без соодветна атрибуција. Бидејќи наводниците не се користат кога нешто се парафразира, лесно може да избега од разбирањето на коректорот и да продолжи во последниот нацрт. Сепак, тоа не е сосема неостварливо, особено затоа што проверувачите на плагијати поефикасно откриваат парафразирање во денешно време.
Откривањето на парафразирањето може да биде предизвикувачка задача, бидејќи вклучува идентификување на сличностите и разликите помеѓу текстовите. Во следните делови, ќе навлеземе во сеопфатна дискусија за вообичаените методи и техники што се користат за да се забележат примери на парафраза.
Како проверувачите на плагијат откриваат парафразирање: Истражени соодветни методи
Во денешниот образовен пејзаж, проверките за плагијати стануваат сè понапредни, надминувајќи го само означувањето на копираниот текст и откривањето на парафразираната содржина. Оваа статија ги истражува методите што им овозможуваат на овие алатки ефективно да го идентификуваат парафразирањето.
1. Усогласување на низа
Овој метод вклучува споредување на текстови на ниво на знаци или зборови за да се прецизираат точните совпаѓања. Висок степен на сличност во низите на знаци или изборот на зборови помеѓу два текста може да сигнализира парафразирање. Овие алатки користат сложени алгоритми кои дури можат да го земат предвид контекстуалното значење на зборовите, што го прави сè потешко плагијатниот, парафразиран материјал да остане неоткриен.
2. Косинусна сличност
Сличноста на косинусите е еден од методите со кои проверувачите на плагијати откриваат парафразација. Ја мери сличноста помеѓу два текста врз основа на аголот помеѓу нивните векторски претстави во високодимензионален простор. Претставувајќи ги текстовите како вектори на фреквенции на зборови или вградување, овие алатки можат да го пресметаат резултатот за сличност на косинус за дополнително да ја усовршат нивната способност за откривање парафразирана содржина.
3. Модели за усогласување на зборови
Овие модели ги усогласуваат зборовите или фразите помеѓу два текста за да ја идентификуваат нивната кореспонденција. Со споредување на порамнетите сегменти, можете да откриете парафраза врз основа на сличностите и разликите во усогласените секвенци.
4. Семантичка анализа
Овој пристап вклучува анализа на значењето и контекстот на зборовите и фразите во текстовите. Техниките како латентна семантичка анализа (LSA), вградување зборови (како Word2Vec или GloVe) или моделите за длабоко учење како BERT можат да доловат семантички односи меѓу зборовите и да идентификуваат парафраза врз основа на сличноста на нивните семантички претстави.
5. Машинско учење
Надгледуваните алгоритми за машинско учење може да се обучуваат на означени сетови на податоци од парафразирани и непарафразирани парови текстови. Овие модели можат да научат обрасци и карактеристики што ги разликуваат парафразите и може да се користат за класифицирање на нови примери на текст како парафразирани или не.
6. Н-грам анализа
N-грамите се групи зборови кои се наоѓаат веднаш еден до друг. Кога ќе проверите колку често овие групи се појавуваат во различни текстови и ќе ги споредите, можете да најдете слични фрази или секвенци. Ако има многу слични обрасци, тоа може да значи дека текстот можеби е парафразиран.
7. Скоро дупликат откривање
Последниот начин на кој проверувачите на плагијат ефикасно го откриваат парафразирањето.
Речиси дупликат алгоритми за откривање често се користат при парафразирање на откривањето за прецизно лоцирање на текстуални сегменти кои прикажуваат висок степен на сличност или се речиси идентични. Овие алгоритми се специјално изработени за да ја препознаат парафразираната содржина преку споредба на сличноста на текстот на детално ниво.
Кој метод обично го користи софтверот за спречување плагијат?
Технолошките решенија што ги користат професионалните служби за спречување на плагијат обично се потпираат на n-грам анализа. Со искористување на технологијата базирана на n-грам, овие услуги постигнуваат неверојатно висока стапка на прецизност. Ова е еден од најдобрите начини на кои проверувачите на плагијати откриваат парафразирање, овозможувајќи идентификација и истакнување на точните зборови што се препишани.
Механика за тоа како проверувачите на плагијат откриваат парафразирање
Службите за спречување на плагијат најчесто ја користат техниката на отпечатоци од прсти за споредување на документите. Ова вклучува извлекување на потребните n-грами од документите што треба да се проверат и нивно споредување со n-грамите на сите документи во нивните бази на податоци.
пример
Да речеме дека има реченица: « Le Mont Olympe е плус високата монтажа на Грција. »
на n-грами (на пример 3 грама) од оваа реченица ќе биде:
- Ле Мон Олимпик
- Mont Olympe est
- Olympe est la
- е најмногу
- la plus haute
- највисоката планина
- високата монтажа де
- Montagne de Grèce
Случај 1. Замена
Ако зборот се замени со другиот збор, сепак некои од n-грами совпаѓаат и можно е да се открие замената на зборот со дополнителна анализа.
Променета реченица: "На Планина Olympe est la plus haute montagne de Пелопонез. "
Оригинални 3 грама | 3 грама променет текст |
Ле Мон Олимпик Mont Olympe est Olympe est la е најмногу la plus haute највисоката планина високата монтажа де Montagne de Grèce | Le Планина Олимп Планина Olympe est Olympe est la е најмногу la plus haute највисоката планина високата монтажа де Монтањ де Пелопонез |
Случај 2. Го смени редоследот на зборовите (или речениците, параграфите)
Кога ќе се смени редоследот на реченицата, сепак се совпаѓаат некои 3 грама, така што е можно да се открие промената.
Променета реченица: « La plus Haute Montagne de Grèce est Le Mont Olympe. »
Оригинални 3 грама | 3 грама променет текст |
Ле Мон Олимпик Mont Olympe est Olympe est la е најмногу la plus haute највисоката планина високата монтажа де Montagne de Grèce | La plus haute највисоката планина високата монтажа де Montagne de Grèce de Grèce est Grèce est Le est Le Mont Ле Мон Олимпик |
Случај 3. Додадени нови зборови
Кога ќе се додадат новите зборови, остануваат уште некои 3 грама што се совпаѓаат, така што е можно да се открие промената.
Променета реченица: „Ле монт Олимп е од далеку la plus Haute Montagne de Grèce. »
Оригинални 3 грама | 3 грама променет текст |
Ле Мон Олимпик Mont Olympe est Olympe est la е најмногу la plus haute највисоката планина високата монтажа де Montagne de Grèce | Ле Мон Олимпик Mont Olympe est Olympe est de est de loin далеку слабината ла плус la plus haute највисоката планина високата монтажа де Montagne de Grèce |
Случај 4. Избришани некои зборови
Кога ќе се отстрани зборот, има уште 3 грама што се совпаѓаат, така што е можно да се открие промената.
Променета реченица: „L'Olympe е плус високата монтажа на Грција. »
Оригинални 3 грама | 3 грама променет текст |
Ле Мон Олимпик Mont Olympe est Olympe est la е најмногу la plus haute највисоката планина високата монтажа де Montagne de Grèce | L'Olympe е ла е најмногу la plus haute највисоката планина високата монтажа де Montagne de Grèce |
Пример во реалниот свет
По завршувањето на верификацијата во вистински документ, парафразираните делови често се идентификуваат преку прекинатите ознаки. Овие прекини, кои означуваат изменети зборови, се означени за да се подобри видливоста и разликата.
Подолу, ќе најдете пример на вистински документ.
- Првиот извадок доаѓа од датотека која е потврдена со помош на OXSICO Служба за превенција од плагијат:
- Вториот извадок е од оригиналниот изворен документ:
По подлабока анализа, евидентно е дека избраниот дел од документот е парафразиран со следните промени:
Оригинален текст | Парафразиран текст | Промени |
се карактеризира и поддржува иновацијата | поддржува иновации е покрај дефинирана | Замена |
економско и социјално знаење, ефикасни системи | економска и општествена свест, ефикасна организација | Замена |
предлози (идеи) | препорака | Замена, бришење |
ставови | положби | Замена |
успех | победник | Замена |
процес (Перенц, Холуб-Иван | когнитивен процес (Перенц, Холуб - Иван | Покрај тоа |
про-иновации | поволни | Замена |
создавање клима | : создавање состојба | Замена |
поволни | просперитетна | Замена |
развивање на знаење | развојна свест | Замена |
Заклучок
Плагијатот, често неоткриен во случаите на парафразирање, останува значајна грижа во академската заедница. Технолошкиот напредок ги опреми проверувачите на плагијати со способност ефективно да ја идентификуваат парафразираната содржина. Поточно, проверувачите на плагијати детектираат парафраза преку различни методи како што се појавување на низи, сличност со косинус и анализа на n-грам. Имено, n-грам анализата се издвојува по високата стапка на прецизност. Овие достигнувања значително ја намалуваат веројатноста плагијат и парафразиран материјал да остане неоткриен, а со тоа го подобрува академскиот интегритет. |