Как проверяващите за плагиатство откриват перифразиране?

how-do-plagiatism-checkers-detect-periphrasing
()

Плагиатството включва приписване на нечии други идеи, думи или изображения, практика, която се разглежда неетично в академична и професионална среда. Може да остане незабелязано от учениците, които могат случайно да перифразират нечии други думи без подходящо приписване. Тъй като кавички не се използват, когато нещо се перифразира, то лесно може да избяга от хватката на коректора и да продължи в окончателната чернова. Това обаче не е напълно непостижимо, особено след като в днешно време контролерите за плагиатство откриват перифразирането по-ефективно.

Откриването на парафразиране може да бъде предизвикателна задача, тъй като включва идентифициране на прилики и разлики между текстове. В следващите раздели ще се задълбочим в изчерпателна дискусия относно общите методи и техники, използвани за разпознаване на случаи на перифразиране.

Как проверяващите за плагиатство откриват перифразиране: Разгледани са подходящи методи

В днешния образователен пейзаж средствата за проверка на плагиатство стават все по-напреднали, като надхвърлят само маркирането на копиран текст до откриването и на перифразирано съдържание. Тази статия изследва методите, позволяващи на тези инструменти ефективно да идентифицират перифразирането.

plagiatism-checkers-detect-periphrasing

1. Съвпадение на низове

Този метод включва сравняване на текстове на ниво знаци или думи, за да се установят точни съвпадения. Висока степен на сходство в поредиците от знаци или избора на думи между два текста може да сигнализира за перифразиране. Тези инструменти използват сложни алгоритми, които могат дори да вземат предвид контекстуалното значение на думите, което прави все по-трудно плагиатстваните, перифразирани материали да останат незабелязани.

2. Косинусово подобие

Косинусното сходство е един от методите, чрез които проверяващите за плагиатство откриват перифразиране. Той измерва приликата между два текста въз основа на ъгъла между техните векторни представяния в пространство с големи измерения. Чрез представяне на текстове като вектори на честоти на думи или вграждания, тези инструменти могат да изчислят резултата за косинусово сходство, за да подобрят допълнително способността си да откриват парафразирано съдържание.

3. Модели за подравняване на думи

Тези модели подравняват думи или фрази между два текста, за да идентифицират техните съответствия. Чрез сравняване на подравнените сегменти можете да откриете парафразиране въз основа на прилики и разлики в съвпадащите последователности.

4. Семантичен анализ

Този подход включва анализ на значението и контекста на думите и фразите в текстовете. Техники като латентен семантичен анализ (LSA), вграждане на думи (като Word2Vec или GloVe) или модели на задълбочено обучение като BERT могат да уловят семантичните връзки между думите и да идентифицират парафразирането въз основа на сходството на техните семантични представяния.

5. Машинно обучение

Алгоритмите за контролирано машинно обучение могат да бъдат обучени върху етикетирани набори от данни от перифразирани и неперефразирани двойки текстове. Тези модели могат да научат модели и функции, които разграничават перифразите и могат да се използват за класифициране на нови случаи на текст като перифразирани или не.

6. N-грам анализ

N-грамите са групи от думи, които са точно една до друга. Когато проверите колко често тези групи се появяват в различни текстове и ги сравните, можете да намерите подобни фрази или последователности. Ако има много подобни модели, това може да означава, че текстът може да е перифразиран.

7. Откриване на почти дублиране

Последният начин, по който контролерите за плагиатство откриват ефективно перифразирането.

Алгоритмите за откриване на почти дублиращи се често се използват при откриване на перифразиране, за да се определят текстови сегменти, които показват висока степен на сходство или са почти идентични. Тези алгоритми са специално създадени, за да разпознават перифразирано съдържание чрез сравнение на сходството на текста на подробно ниво.

Кой метод обикновено се използва от софтуера за предотвратяване на плагиатство?

Технологичните решения, използвани от професионални услуги за предотвратяване на плагиатство, обикновено разчитат на n-gram анализ. Чрез използване на технология, базирана на n-gram, тези услуги постигат забележително висока степен на точност. Това е един от най-добрите начини за проверка на плагиатство за откриване на перифразиране, което позволява идентифицирането и подчертаването на точните думи, които са били пренаписани.

Механика на начина, по който проверяващите за плагиатство откриват перифразиране

Услугите за предотвратяване на плагиатство обикновено използват техниката за пръстови отпечатъци за сравняване на документи. Това включва извличане на необходимите n-грами от документите за проверка и сравняването им с n-грамите на всички документи в техните бази данни.

студенти-четене-как-до-плагиатство-проверки-откриване-перефразиране

Пример

Да кажем, че има изречение: « Le mont Olympe est la plus haute montagne de Grèce. »

- n-грама (например 3 грама) на това изречение ще бъде:

  • Монт Олимп
  • монт Олимп est
  • Olympe est la
  • е най-много
  • la plus haute
  • най-високата планина
  • Haute Montagne de
  • montagne de Grèce

Случай 1. Замяна

Ако думата е заменена с друга дума, все още някои от n-грама съвпадение и е възможно да се открие заместването на думата чрез допълнителен анализ.

Променено изречение:  "The планините Olympe est la plus haute montagne de Пелопонес. "

Оригинални 3 грама3 грама променен текст
Монт Олимп
монт Олимп est
Olympe est la
е най-много
la plus haute
най-високата планина
Haute Montagne de
montagne de Grèce
Le планините Олимп
планините Olympe est
Olympe est la
е най-много
la plus haute
най-високата планина
Haute Montagne de
Монтан де Пелопонес

Случай 2. Променен ред на думите (или изреченията, абзаците)

Когато редът на изречението се промени, все още някои 3-грама съвпадат, така че е възможно да се открие промяната.

Променено изречение: «La plus haute montagne de Grèce est Le mont Olympe. »

Оригинални 3 грама3 грама променен текст
Монт Олимп
монт Олимп est
Olympe est la
е най-много
la plus haute
най-високата планина
Haute Montagne de
montagne de Grèce
La plus haute
най-високата планина
Haute Montagne de
montagne de Grèce
de Grèce est
Grèce est Le
est Le mont
Монт Олимп

Случай 3. Добавени нови думи

Когато се добавят новите думи, все още има няколко 3 грама, които съвпадат, така че е възможно да се открие промяната.

Променено изречение: „Le mont Olympe est отдалеч la plus haute montagne de Grèce. »

Оригинални 3 грама3 грама променен текст
Монт Олимп
монт Олимп est
Olympe est la
е най-много
la plus haute
най-високата планина
Haute Montagne de
montagne de Grèce
Монт Олимп
монт Олимп est
Olympe est de
est de loin
далеч
филе ла плюс
la plus haute
най-високата планина
Haute Montagne de
montagne de Grèce

Случай 4. Изтрити някои думи

Когато думата бъде премахната, все още има няколко 3 грама, които съвпадат, така че е възможно да се открие промяната.

Променено изречение: « L'Olympe est la plus haute montagne de Grèce. »

Оригинални 3 грама3 грама променен текст
Монт Олимп
монт Олимп est
Olympe est la
е най-много
la plus haute
най-високата планина
Haute Montagne de
montagne de Grèce
L'Olympe est la
е най-много
la plus haute
най-високата планина
Haute Montagne de
montagne de Grèce

Пример от реалния свят

След завършване на проверката в действителен документ, парафразираните секции често се идентифицират чрез прекъснати маркировки. Тези прекъсвания, обозначаващи променени думи, са подчертани, за да подобрят видимостта и разграничението.

По-долу ще намерите пример за действителен документ.

  • Първият откъс идва от файл, който е проверен с помощта на OXSICO услуга за предотвратяване на плагиатство:
  • Вторият откъс е от оригиналния изходен документ:
доклад за плагиатство

След по-задълбочен анализ става ясно, че избраната част от документа е перифразирана чрез извършване на следните промени:

Оригинален текстПарафразиран текстПромени
подкрепя иновациите също се характеризира подкрепя иновациите освен дефинираниЗамяна
икономически и социални знания, ефективни системи икономическо и обществено съзнание, ефективна организацияЗамяна
предложения (идеи)препоръкаЗамяна, изтриване
нагласипозиЗамяна
успехпобедителЗамяна
процес (Перенц, Холуб-Иванкогнитивен процес (Перенц, Холуб – ИванДопълнение
про-иновацииблагоприятенЗамяна
създаване на климат: създаване на условиеЗамяна
благоприятенпроцъфтяващЗамяна
развиващи знанияосъзнаване на развитиетоЗамяна

Заключение

Плагиатството, което често не се открива в случаите на перифразиране, остава сериозен проблем в академичните среди. Технологичният напредък оборудва средствата за проверка на плагиатство със способността ефективно да идентифицират перифразирано съдържание. По-конкретно, проверките за плагиатство откриват перифразиране чрез различни методи като съпоставяне на низове, сходство по косинус и анализ на n-грам. Трябва да се отбележи, че n-грамовият анализ се откроява с високата си степен на точност. Тези подобрения значително намаляват вероятността плагиатстван и перифразиран материал да остане незабелязан, като по този начин повишава академичната почтеност.

Колко полезна беше тази публикация?

Кликнете върху звезда, за да я оцените!

Среден рейтинг / 5. Брой гласове:

Засега няма гласове! Бъдете първият, който оцени тази публикация.

Съжаляваме, че тази публикация не ви е била полезна!

Нека подобрим този пост!

Кажете ни как можем да подобрим тази публикация?