Плагиатството включва приписване на нечии други идеи, думи или изображения, практика, която се разглежда неетично в академична и професионална среда. Може да остане незабелязано от учениците, които могат случайно да перифразират нечии други думи без подходящо приписване. Тъй като кавички не се използват, когато нещо се перифразира, то лесно може да избяга от хватката на коректора и да продължи в окончателната чернова. Това обаче не е напълно непостижимо, особено след като в днешно време контролерите за плагиатство откриват перифразирането по-ефективно.
Откриването на парафразиране може да бъде предизвикателна задача, тъй като включва идентифициране на прилики и разлики между текстове. В следващите раздели ще се задълбочим в изчерпателна дискусия относно общите методи и техники, използвани за разпознаване на случаи на перифразиране.
Как проверяващите за плагиатство откриват перифразиране: Разгледани са подходящи методи
В днешния образователен пейзаж средствата за проверка на плагиатство стават все по-напреднали, като надхвърлят само маркирането на копиран текст до откриването и на перифразирано съдържание. Тази статия изследва методите, позволяващи на тези инструменти ефективно да идентифицират перифразирането.
1. Съвпадение на низове
Този метод включва сравняване на текстове на ниво знаци или думи, за да се установят точни съвпадения. Висока степен на сходство в поредиците от знаци или избора на думи между два текста може да сигнализира за перифразиране. Тези инструменти използват сложни алгоритми, които могат дори да вземат предвид контекстуалното значение на думите, което прави все по-трудно плагиатстваните, перифразирани материали да останат незабелязани.
2. Косинусово подобие
Косинусното сходство е един от методите, чрез които проверяващите за плагиатство откриват перифразиране. Той измерва приликата между два текста въз основа на ъгъла между техните векторни представяния в пространство с големи измерения. Чрез представяне на текстове като вектори на честоти на думи или вграждания, тези инструменти могат да изчислят резултата за косинусово сходство, за да подобрят допълнително способността си да откриват парафразирано съдържание.
3. Модели за подравняване на думи
Тези модели подравняват думи или фрази между два текста, за да идентифицират техните съответствия. Чрез сравняване на подравнените сегменти можете да откриете парафразиране въз основа на прилики и разлики в съвпадащите последователности.
4. Семантичен анализ
Този подход включва анализ на значението и контекста на думите и фразите в текстовете. Техники като латентен семантичен анализ (LSA), вграждане на думи (като Word2Vec или GloVe) или модели на задълбочено обучение като BERT могат да уловят семантичните връзки между думите и да идентифицират парафразирането въз основа на сходството на техните семантични представяния.
5. Машинно обучение
Алгоритмите за контролирано машинно обучение могат да бъдат обучени върху етикетирани набори от данни от перифразирани и неперефразирани двойки текстове. Тези модели могат да научат модели и функции, които разграничават перифразите и могат да се използват за класифициране на нови случаи на текст като перифразирани или не.
6. N-грам анализ
N-грамите са групи от думи, които са точно една до друга. Когато проверите колко често тези групи се появяват в различни текстове и ги сравните, можете да намерите подобни фрази или последователности. Ако има много подобни модели, това може да означава, че текстът може да е перифразиран.
7. Откриване на почти дублиране
Последният начин, по който контролерите за плагиатство откриват ефективно перифразирането.
Алгоритмите за откриване на почти дублиращи се често се използват при откриване на перифразиране, за да се определят текстови сегменти, които показват висока степен на сходство или са почти идентични. Тези алгоритми са специално създадени, за да разпознават перифразирано съдържание чрез сравнение на сходството на текста на подробно ниво.
Кой метод обикновено се използва от софтуера за предотвратяване на плагиатство?
Технологичните решения, използвани от професионални услуги за предотвратяване на плагиатство, обикновено разчитат на n-gram анализ. Чрез използване на технология, базирана на n-gram, тези услуги постигат забележително висока степен на точност. Това е един от най-добрите начини за проверка на плагиатство за откриване на перифразиране, което позволява идентифицирането и подчертаването на точните думи, които са били пренаписани.
Механика на начина, по който проверяващите за плагиатство откриват перифразиране
Услугите за предотвратяване на плагиатство обикновено използват техниката за пръстови отпечатъци за сравняване на документи. Това включва извличане на необходимите n-грами от документите за проверка и сравняването им с n-грамите на всички документи в техните бази данни.
Пример
Да кажем, че има изречение: « Le mont Olympe est la plus haute montagne de Grèce. »
- n-грама (например 3 грама) на това изречение ще бъде:
- Монт Олимп
- монт Олимп est
- Olympe est la
- е най-много
- la plus haute
- най-високата планина
- Haute Montagne de
- montagne de Grèce
Случай 1. Замяна
Ако думата е заменена с друга дума, все още някои от n-грама съвпадение и е възможно да се открие заместването на думата чрез допълнителен анализ.
Променено изречение: "The планините Olympe est la plus haute montagne de Пелопонес. "
Оригинални 3 грама | 3 грама променен текст |
Монт Олимп монт Олимп est Olympe est la е най-много la plus haute най-високата планина Haute Montagne de montagne de Grèce | Le планините Олимп планините Olympe est Olympe est la е най-много la plus haute най-високата планина Haute Montagne de Монтан де Пелопонес |
Случай 2. Променен ред на думите (или изреченията, абзаците)
Когато редът на изречението се промени, все още някои 3-грама съвпадат, така че е възможно да се открие промяната.
Променено изречение: «La plus haute montagne de Grèce est Le mont Olympe. »
Оригинални 3 грама | 3 грама променен текст |
Монт Олимп монт Олимп est Olympe est la е най-много la plus haute най-високата планина Haute Montagne de montagne de Grèce | La plus haute най-високата планина Haute Montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Монт Олимп |
Случай 3. Добавени нови думи
Когато се добавят новите думи, все още има няколко 3 грама, които съвпадат, така че е възможно да се открие промяната.
Променено изречение: „Le mont Olympe est отдалеч la plus haute montagne de Grèce. »
Оригинални 3 грама | 3 грама променен текст |
Монт Олимп монт Олимп est Olympe est la е най-много la plus haute най-високата планина Haute Montagne de montagne de Grèce | Монт Олимп монт Олимп est Olympe est de est de loin далеч филе ла плюс la plus haute най-високата планина Haute Montagne de montagne de Grèce |
Случай 4. Изтрити някои думи
Когато думата бъде премахната, все още има няколко 3 грама, които съвпадат, така че е възможно да се открие промяната.
Променено изречение: « L'Olympe est la plus haute montagne de Grèce. »
Оригинални 3 грама | 3 грама променен текст |
Монт Олимп монт Олимп est Olympe est la е най-много la plus haute най-високата планина Haute Montagne de montagne de Grèce | L'Olympe est la е най-много la plus haute най-високата планина Haute Montagne de montagne de Grèce |
Пример от реалния свят
След завършване на проверката в действителен документ, парафразираните секции често се идентифицират чрез прекъснати маркировки. Тези прекъсвания, обозначаващи променени думи, са подчертани, за да подобрят видимостта и разграничението.
По-долу ще намерите пример за действителен документ.
- Първият откъс идва от файл, който е проверен с помощта на OXSICO услуга за предотвратяване на плагиатство:
- Вторият откъс е от оригиналния изходен документ:
След по-задълбочен анализ става ясно, че избраната част от документа е перифразирана чрез извършване на следните промени:
Оригинален текст | Парафразиран текст | Промени |
подкрепя иновациите също се характеризира | подкрепя иновациите освен дефинирани | Замяна |
икономически и социални знания, ефективни системи | икономическо и обществено съзнание, ефективна организация | Замяна |
предложения (идеи) | препоръка | Замяна, изтриване |
нагласи | пози | Замяна |
успех | победител | Замяна |
процес (Перенц, Холуб-Иван | когнитивен процес (Перенц, Холуб – Иван | Допълнение |
про-иновации | благоприятен | Замяна |
създаване на климат | : създаване на условие | Замяна |
благоприятен | процъфтяващ | Замяна |
развиващи знания | осъзнаване на развитието | Замяна |
Заключение
Плагиатството, което често не се открива в случаите на перифразиране, остава сериозен проблем в академичните среди. Технологичният напредък оборудва средствата за проверка на плагиатство със способността ефективно да идентифицират перифразирано съдържание. По-конкретно, проверките за плагиатство откриват перифразиране чрез различни методи като съпоставяне на низове, сходство по косинус и анализ на n-грам. Трябва да се отбележи, че n-грамовият анализ се откроява с високата си степен на точност. Тези подобрения значително намаляват вероятността плагиатстван и перифразиран материал да остане незабелязан, като по този начин повишава академичната почтеност. |