Beim Plagiat geht es darum, die Ideen, Worte oder Bilder einer anderen Person zu würdigen, eine Praxis, die in Erwägung gezogen wird unethisch im akademischen und beruflichen Umfeld. Es kann von Schülern unbemerkt bleiben, die versehentlich die Worte einer anderen Person ohne korrekte Zuordnung umformulieren. Da beim Paraphrasieren von etwas keine Anführungszeichen verwendet werden, kann es leicht passieren, dass es dem Zugriff eines Korrektors entgeht und in den endgültigen Entwurf einfließt. Ganz unerreichbar ist dies jedoch nicht, zumal Plagiatsprüfer heutzutage Paraphrasierungen effizienter erkennen.
Das Erkennen von Paraphrasierungen kann eine anspruchsvolle Aufgabe sein, da es darum geht, Ähnlichkeiten und Unterschiede zwischen Texten zu identifizieren. In den folgenden Abschnitten werden wir uns ausführlich mit den gängigen Methoden und Techniken befassen, die zum Erkennen von Fällen von Paraphrasierung eingesetzt werden.
Wie erkennen Plagiatsprüfer Paraphrasierungen? Geeignete Methoden untersucht
In der heutigen Bildungslandschaft sind Plagiatsprüfer immer ausgereifter geworden, da sie nicht nur kopierten Text kennzeichnen, sondern auch paraphrasierte Inhalte erkennen. In diesem Artikel werden die Methoden untersucht, mit denen diese Tools Paraphrasierungen effektiv erkennen können.
1. String-Matching
Bei dieser Methode werden Texte auf Zeichen- oder Wortebene verglichen, um genaue Übereinstimmungen zu ermitteln. Ein hoher Grad an Ähnlichkeit in der Zeichenfolge oder Wortwahl zwischen zwei Texten könnte auf eine Paraphrasierung hinweisen. Diese Tools verwenden komplexe Algorithmen, die sogar die kontextuelle Bedeutung von Wörtern berücksichtigen können, wodurch es immer schwieriger wird, plagiiertes, paraphrasiertes Material unentdeckt zu bleiben.
2. Kosinusähnlichkeit
Die Kosinusähnlichkeit ist eine der Methoden, mit denen Plagiatsprüfer Paraphrasierungen erkennen. Es misst die Ähnlichkeit zwischen zwei Texten anhand des Winkels zwischen ihren Vektordarstellungen in einem hochdimensionalen Raum. Durch die Darstellung von Texten als Vektoren von Worthäufigkeiten oder Einbettungen können diese Tools den Kosinus-Ähnlichkeitswert berechnen, um ihre Fähigkeit zur Erkennung paraphrasierter Inhalte weiter zu verfeinern.
3. Wortausrichtungsmodelle
Diese Modelle richten Wörter oder Phrasen zwischen zwei Texten aus, um ihre Entsprechungen zu identifizieren. Durch den Vergleich der ausgerichteten Segmente können Sie Paraphrasierungen anhand von Ähnlichkeiten und Unterschieden in den übereinstimmenden Sequenzen erkennen.
4. Semantische Analyse
Bei diesem Ansatz wird die Bedeutung und der Kontext von Wörtern und Phrasen in Texten analysiert. Techniken wie latente semantische Analyse (LSA), Worteinbettungen (wie Word2Vec oder GloVe) oder Deep-Learning-Modelle wie BERT können semantische Beziehungen zwischen Wörtern erfassen und Paraphrasierungen anhand der Ähnlichkeit ihrer semantischen Darstellungen identifizieren.
5. Maschinelles Lernen
Überwachte Algorithmen für maschinelles Lernen können auf gekennzeichneten Datensätzen paraphrasierter und nicht paraphrasierter Textpaare trainiert werden. Diese Modelle können Muster und Merkmale lernen, die Paraphrasen unterscheiden, und können verwendet werden, um neue Textinstanzen als paraphrasiert zu klassifizieren oder nicht.
6. N-Gramm-Analyse
N-Gramm sind Wortgruppen, die direkt nebeneinander stehen. Wenn Sie überprüfen, wie oft diese Gruppen in verschiedenen Texten vorkommen, und sie vergleichen, können Sie ähnliche Phrasen oder Sequenzen finden. Wenn es viele ähnliche Muster gibt, könnte das bedeuten, dass der Text paraphrasiert wurde.
7. Nahezu-Duplikate-Erkennung
Die letzte Methode, mit der Plagiatsprüfer Paraphrasierungen effektiv erkennen können.
Bei der Paraphrasierungserkennung werden häufig Algorithmen zur Erkennung nahezu identischer Duplikate eingesetzt, um Textsegmente zu lokalisieren, die ein hohes Maß an Ähnlichkeit aufweisen oder nahezu identisch sind. Diese Algorithmen sind speziell darauf ausgelegt, paraphrasierte Inhalte durch den Vergleich der Textähnlichkeit auf detaillierter Ebene zu erkennen.
Welche Methode wird normalerweise von Software zur Plagiatsprävention verwendet?
Technologische Lösungen, die von professionellen Plagiatspräventionsdiensten eingesetzt werden, basieren typischerweise auf der N-Gramm-Analyse. Durch den Einsatz n-Gramm-basierter Technologie erreichen diese Dienste eine bemerkenswert hohe Präzisionsrate. Dies ist eine der besten Methoden, mit denen Plagiatsprüfer Paraphrasierungen erkennen und die Identifizierung und Hervorhebung exakter Wörter ermöglichen, die umgeschrieben wurden.
Mechanismen, wie Plagiatsprüfer Paraphrasierungen erkennen
Dienste zur Plagiatsprävention nutzen üblicherweise die Fingerabdrucktechnik, um Dokumente zu vergleichen. Dabei werden die notwendigen N-Gramme aus den zu verifizierenden Dokumenten extrahiert und mit den N-Grammen aller Dokumente in deren Datenbanken verglichen.
Beispiel
Nehmen wir an, es gibt einen Satz: „Der Olymp ist der höchste Berg Griechenlands.“ »
Die n-Gramm (zum Beispiel 3 Gramm) dieses Satzes wird sein:
- Le Mont Olympe
- Mont Olympe est
- Olympe est la
- ist das meiste
- das höchste
- höchster Berg
- haute montagne de
- Montagne de Grece
Fall 1. Ersatz
Wenn das Wort durch das andere Wort ersetzt wird, bleiben einige davon erhalten n-Gramm Übereinstimmung und es ist möglich, die Wortersetzung durch weitere Analyse zu erkennen.
Geänderter Satz: Die Gebirge Der Olymp ist der höchste Berg der Welt Peloponnes. "
Original 3 Gramm | 3 Gramm geänderter Text |
Le Mont Olympe Mont Olympe est Olympe est la ist das meiste das höchste höchster Berg haute montagne de Montagne de Grece | Le Gebirge Olymp Gebirge Olymp est Olympe est la ist das meiste das höchste höchster Berg haute montagne de Berg von Peloponnes |
Fall 2. Die Reihenfolge von Wörtern (oder Sätzen, Absätzen) wurde geändert.
Wenn die Reihenfolge des Satzes geändert wird, stimmen immer noch einige 3 Gramm überein, so dass die Änderung erkannt werden kann.
Geänderter Satz: „Die höchsten Berge Griechenlands sind der Olymp.“ »
Original 3 Gramm | 3 Gramm geänderter Text |
Le Mont Olympe Mont Olympe est Olympe est la ist das meiste das höchste höchster Berg haute montagne de Montagne de Grece | La plus haute höchster Berg haute montagne de Montagne de Grece de Grèce est Griechenland ist Le est Le mont Le Mont Olympe |
Fall 3. Neue Wörter hinzugefügt
Wenn die neuen Wörter hinzugefügt werden, gibt es immer noch einige übereinstimmende 3-Gramm-Wörter, sodass die Änderung erkannt werden kann.
Geänderter Satz: « Le mont Olympe est bei weitem la plus haute montagne de Grece. »
Original 3 Gramm | 3 Gramm geänderter Text |
Le Mont Olympe Mont Olympe est Olympe est la ist das meiste das höchste höchster Berg haute montagne de Montagne de Grece | Le Mont Olympe Mont Olympe est Olympe est de ist mit Abstand weit weg Lende la plus das höchste höchster Berg haute montagne de Montagne de Grece |
Fall 4. Einige Wörter gelöscht
Wenn das Wort entfernt wird, sind immer noch einige 3 Gramm vorhanden, die übereinstimmen, sodass die Änderung erkannt werden kann.
Geänderter Satz: „Der Olymp ist der höchste Berg Griechenlands.“ »
Original 3 Gramm | 3 Gramm geänderter Text |
Le Mont Olympe Mont Olympe est Olympe est la ist das meiste das höchste höchster Berg haute montagne de Montagne de Grece | L'Olympe est la ist das meiste das höchste höchster Berg haute montagne de Montagne de Grece |
Beispiel aus der Praxis
Nach Abschluss der Überprüfung in einem tatsächlichen Dokument werden paraphrasierte Abschnitte häufig durch unterbrochene Markierungen identifiziert. Diese Unterbrechungen, die auf geänderte Wörter hinweisen, werden hervorgehoben, um die Sichtbarkeit und Unterscheidung zu verbessern.
Nachfolgend finden Sie ein Beispiel eines tatsächlichen Dokuments.
- Der erste Auszug stammt aus einer Datei, die mit dem überprüft wurde OXSICO Plagiatspräventionsdienst:
- Der zweite Auszug stammt aus dem Original-Quelldokument:
Nach einer tiefergehenden Analyse wird deutlich, dass der ausgewählte Teil des Dokuments durch folgende Änderungen umschrieben wurde:
Urtext | Paraphrasierter Text | Änderungen |
Unterstützt Innovation ist ebenfalls gekennzeichnet | Unterstützt Innovation ist außerdem definiert | Ersatz |
Wirtschafts- und Sozialwissen, effiziente Systeme | wirtschaftliches und gesellschaftliches Bewusstsein, effiziente Organisation | Ersatz |
Vorschläge (Ideen) | Empfehlung | Ersetzung, Löschung |
Haltungen | haltungen | Ersatz |
Erfolg | Gewinner | Ersatz |
Prozess (Perenc, Holub-Ivan | kognitiver Prozess (Perenc, Holub – Ivan | Zusatz |
Pro-Innovation | günstig | Ersatz |
ein Klima schaffen | : eine Bedingung erstellen | Ersatz |
günstig | wohlhabend | Ersatz |
Wissen entwickeln | Entwicklungsbewusstsein | Ersatz |
Fazit
Plagiate, die bei Paraphrasierungen häufig unentdeckt bleiben, stellen in der Wissenschaft nach wie vor ein großes Problem dar. Technologische Fortschritte haben Plagiatsprüfer in die Lage versetzt, paraphrasierte Inhalte effektiv zu identifizieren. Insbesondere erkennen Plagiatsprüfer Paraphrasierungen mithilfe verschiedener Methoden wie String-Matching, Kosinusähnlichkeit und N-Gramm-Analyse. Insbesondere zeichnet sich die N-Gramm-Analyse durch ihre hohe Präzision aus. Diese Fortschritte verringern die Wahrscheinlichkeit, dass plagiiertes und paraphrasiertes Material unentdeckt bleibt, erheblich und verbessern so die akademische Integrität. |