تتضمن السرقة الأدبية الحصول على الفضل في أفكار أو كلمات أو صور شخص آخر، وهي ممارسة يتم أخذها في الاعتبار غير اخلاقى في البيئات الأكاديمية والمهنية. يمكن أن يمر دون أن يلاحظه أحد من قبل الطلاب الذين قد يعيدون صياغة كلمات شخص آخر عن طريق الخطأ دون الإسناد المناسب. نظرًا لعدم استخدام علامات الاقتباس عند إعادة صياغة شيء ما، فمن الممكن أن يفلت بسهولة من قبضة المصحح وينتقل إلى المسودة النهائية. ومع ذلك، فإنه ليس بعيد المنال تمامًا، خاصة وأن أدوات فحص الانتحال تكتشف إعادة الصياغة بشكل أكثر كفاءة في الوقت الحاضر.
يمكن أن يكون اكتشاف إعادة الصياغة مهمة صعبة، لأنه يتضمن تحديد أوجه التشابه والاختلاف بين النصوص. في الأقسام اللاحقة، سنخوض في مناقشة شاملة حول الأساليب والتقنيات الشائعة المستخدمة لتمييز حالات إعادة الصياغة.
كيف يكتشف مدققو الانتحال إعادة الصياغة: استكشاف الطرق المناسبة
في المشهد التعليمي اليوم، أصبحت أدوات فحص الانتحال متقدمة بشكل متزايد، حيث تجاوزت مجرد وضع علامة على النص المنسوخ لتكتشف أيضًا المحتوى المعاد صياغته. تستكشف هذه المقالة الطرق التي تسمح لهذه الأدوات بتحديد إعادة الصياغة بشكل فعال.
1. مطابقة السلسلة
تتضمن هذه الطريقة مقارنة النصوص على مستوى الحرف أو الكلمة لتحديد التطابقات الدقيقة. إن وجود درجة عالية من التشابه في تسلسل الأحرف أو اختيار الكلمات بين نصين يمكن أن يشير إلى إعادة الصياغة. تستخدم هذه الأدوات خوارزميات معقدة يمكنها حتى مراعاة المعنى السياقي للكلمات، مما يزيد من صعوبة عدم اكتشاف المواد المسروقة والمعاد صياغتها.
2. تشابه جيب التمام
يعد تشابه جيب التمام إحدى الطرق التي يكتشف من خلالها مدققو الانتحال إعادة الصياغة. وهو يقيس التشابه بين نصين بناءً على الزاوية بين تمثيلاتهما المتجهة في فضاء عالي الأبعاد. من خلال تمثيل النصوص كمتجهات لترددات الكلمات أو التضمينات، يمكن لهذه الأدوات حساب درجة تشابه جيب التمام لتحسين قدرتها على اكتشاف المحتوى المعاد صياغته.
3. نماذج محاذاة الكلمات
تقوم هذه النماذج بمحاذاة الكلمات أو العبارات بين نصين لتحديد المراسلات بينهما. من خلال مقارنة المقاطع المحاذاة، يمكنك اكتشاف إعادة الصياغة بناءً على أوجه التشابه والاختلاف في التسلسلات المطابقة.
4. التحليل الدلالي
يتضمن هذا النهج تحليل معنى وسياق الكلمات والعبارات في النصوص. يمكن لتقنيات مثل التحليل الدلالي الكامن (LSA) ، أو تضمين الكلمات (مثل Word2Vec أو GloVe) ، أو نماذج التعلم العميق مثل BERT التقاط العلاقات الدلالية بين الكلمات وتحديد إعادة الصياغة بناءً على تشابه تمثيلاتها الدلالية.
5. التعلم الآلي
يمكن تدريب خوارزميات التعلم الآلي الخاضعة للإشراف على مجموعات البيانات المسمى من أزواج النصوص المعاد صياغتها وغير المعاد صياغتها. يمكن أن تتعلم هذه النماذج الأنماط والميزات التي تميز إعادة الصياغة ويمكن استخدامها لتصنيف مثيلات النص الجديدة على أنها معاد صياغتها أم لا.
6. تحليل N-جرام
N-grams عبارة عن مجموعات من الكلمات بجوار بعضها البعض. عند التحقق من عدد مرات ظهور هذه المجموعات في نصوص مختلفة ومقارنتها، يمكنك العثور على عبارات أو تسلسلات مماثلة. إذا كان هناك العديد من الأنماط المتشابهة، فقد يعني ذلك أنه ربما تم إعادة صياغة النص.
7. قرب الكشف عن التكرارات
الطريقة الأخيرة التي يكتشف بها مدققو الانتحال إعادة الصياغة بشكل فعال.
تُستخدم خوارزميات الكشف شبه المكررة بشكل متكرر في إعادة صياغة الكشف لتحديد أجزاء النص التي تعرض درجة عالية من التشابه أو تكون متطابقة تقريبًا. تم تصميم هذه الخوارزميات خصيصًا للتعرف على المحتوى المعاد صياغته من خلال مقارنة تشابه النص على مستوى تفصيلي.
ما هي الطريقة التي يستخدمها عادةً برنامج منع الانتحال؟
تعتمد الحلول التكنولوجية التي تستخدمها خدمات منع الانتحال المهنية عادةً على تحليل n-gram. ومن خلال الاستفادة من التكنولوجيا القائمة على n-gram، تحقق هذه الخدمات معدل دقة عاليًا بشكل ملحوظ. تعد هذه واحدة من أفضل الطرق التي يكتشف بها مدققو الانتحال إعادة الصياغة، مما يتيح تحديد وإبراز الكلمات الدقيقة التي تمت إعادة كتابتها.
آليات كيفية اكتشاف مدققي الانتحال وإعادة الصياغة
عادة ما تستخدم خدمات منع الانتحال تقنية البصمات لمقارنة المستندات. يتضمن ذلك استخراج عدد n-grams اللازمة من المستندات ليتم التحقق منها ومقارنتها مع n-grams لجميع المستندات في قواعد البيانات الخاصة بهم.
مثال
لنفترض أن هناك جملة: « جبل أوليمب هو أعلى جبل في اليونان. »
تشتهر أجهزة تركيز الأكسجين البيطرية من كالسـتين بجودتها العالية وفعاليتها في الميدان. ن غرام (على سبيل المثال 3 جرام) من هذه الجملة سيكون:
- لو مونت أوليمب
- مؤسسة مونت أوليمب
- أوليمب مؤسسة لا
- هو الاكثر
- لا بلس هوت
- أعلى جبل
- هوت مونتاني دي
- مونتاني دي جريس
حالة 1. الاستبدال
إذا تم استبدال الكلمة بالكلمة الأخرى ، فلا يزال بعض ن غرام تطابق ومن الممكن اكتشاف استبدال الكلمة بمزيد من التحليل.
الجملة التي تم تغييرها: "و الجبال Olympe est la plus haute montagne de بيلوبونيز. '
الأصلي 3 جرام | 3 جرام من النص المتغير |
لو مونت أوليمب مؤسسة مونت أوليمب أوليمب مؤسسة لا هو الاكثر لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس | Le الجبال اوليمبوس الجبال مؤسسة أوليمب أوليمب مؤسسة لا هو الاكثر لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي بيلوبونيز |
الحالة الثانية: تغيير ترتيب الكلمات (أو الجمل ، الفقرات)
عندما يتغير ترتيب الجملة، لا يزال هناك بعض الـ 3 جرام متطابقة، لذلك من الممكن اكتشاف التغيير.
الجملة التي تم تغييرها: « La plus haute montagne de Grèce est Le mont Olympe. »
الأصلي 3 جرام | 3 جرام من النص المتغير |
لو مونت أوليمب مؤسسة مونت أوليمب أوليمب مؤسسة لا هو الاكثر لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس | لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس مؤسسة دي جريس اليونان شرق لو مؤسسة لو مونت لو مونت أوليمب |
الحالة 3. أضيفت كلمات جديدة
عند إضافة الكلمات الجديدة ، لا يزال هناك حوالي 3 غرامات متطابقة لذلك من الممكن اكتشاف التغيير.
الجملة التي تم تغييرها: « مؤسسة لو مونت أوليمب من بعيد لا بلس هوت مونتاني دي اليونان. »
الأصلي 3 جرام | 3 جرام من النص المتغير |
لو مونت أوليمب مؤسسة مونت أوليمب أوليمب مؤسسة لا هو الاكثر لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس | لو مونت أوليمب مؤسسة مونت أوليمب مؤسسة أوليمب دي هو حتى الآن بعيدا الخاصرة لا زائد لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس |
الحالة 4. حذفت بعض الكلمات
عند إزالة الكلمة ، لا يزال هناك بعض 3 غرامات متطابقة لذلك من الممكن اكتشاف التغيير.
الجملة التي تم تغييرها: « L'Olympe هو أعلى جبل في اليونان. »
الأصلي 3 جرام | 3 جرام من النص المتغير |
لو مونت أوليمب مؤسسة مونت أوليمب أوليمب مؤسسة لا هو الاكثر لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس | L'Olympe est la هو الاكثر لا بلس هوت أعلى جبل هوت مونتاني دي مونتاني دي جريس |
مثال من العالم الحقيقي
عند الانتهاء من التحقق في مستند فعلي ، غالبًا ما يتم تحديد الأقسام المعاد صياغتها من خلال العلامات المتقطعة. يتم تمييز هذه المقاطعات ، التي تشير إلى الكلمات المتغيرة ، لتعزيز الرؤية والتمييز.
ستجد أدناه مثالاً على مستند فعلي.
- يأتي المقتطف الأول من ملف تم التحقق منه باستخدام ملف أوكسيسكو خدمة منع الانتحال:
- المقتطف الثاني من الوثيقة المصدر الأصلية:
بعد تحليل أعمق، من الواضح أنه تمت إعادة صياغة الجزء المحدد من الوثيقة عن طريق إجراء التغييرات التالية:
النص الأصلي | نص معاد صياغته | التغييرات |
يدعم الابتكار كما يتميز | يدعم الابتكار إلى جانب تعريفه | بديل |
المعرفة الاقتصادية والاجتماعية ، وأنظمة فعالة | الوعي الاقتصادي والمجتمعي ، التنظيم الفعال | بديل |
مقترحات (أفكار) | توصية | الاستبدال والحذف |
المواقف | المواقف | بديل |
تحقيق النجاح | الفائز | بديل |
عملية (بيرينك ، هولوب إيفان | العملية المعرفية (Perenc ، Holub - Ivan | إضافة |
الموالية للابتكار | ملائم | بديل |
خلق المناخ | : خلق الشرط | بديل |
ملائم | مزدهر | بديل |
تطوير المعرفة | الوعي التنموي | بديل |
وفي الختام
لا تزال السرقة الأدبية، التي لا يتم اكتشافها في كثير من الأحيان في حالات إعادة الصياغة، مصدر قلق كبير في الأوساط الأكاديمية. لقد زود التقدم التكنولوجي أدوات فحص الانتحال بالقدرة على تحديد المحتوى المعاد صياغته بشكل فعال. على وجه التحديد، تكتشف أدوات فحص الانتحال إعادة الصياغة من خلال طرق مختلفة مثل مطابقة السلسلة وتشابه جيب التمام وتحليل n-gram. والجدير بالذكر أن تحليل n-gram يتميز بمعدل الدقة العالي. تقلل هذه التطورات بشكل كبير من احتمالية عدم اكتشاف المواد المسروقة والمعاد صياغتها، وبالتالي تعزيز النزاهة الأكاديمية. |