ادبی سرقہ میں کسی اور کے خیالات، الفاظ یا تصویروں کا کریڈٹ لینا شامل ہے، جسے ایک مشق سمجھا جاتا ہے۔ غیر اخلاقی تعلیمی اور پیشہ ورانہ ماحول میں۔ اس پر ان طلباء کا دھیان نہیں جا سکتا جو غلطی سے کسی اور کے الفاظ کو مناسب انتساب کے بغیر دوبارہ لکھ سکتے ہیں۔ چونکہ اقتباس کے نشانات کو استعمال نہیں کیا جاتا ہے جب کسی چیز کی تشریح کی جاتی ہے، یہ آسانی سے پروف ریڈر کی گرفت سے بچ سکتا ہے اور حتمی مسودے میں جا سکتا ہے۔ تاہم، یہ مکمل طور پر ناقابل حصول نہیں ہے، خاص طور پر چونکہ سرقہ کی جانچ کرنے والے آج کل زیادہ مؤثر طریقے سے پیرا فریسنگ کا پتہ لگاتے ہیں۔
پیرا فریسنگ کا پتہ لگانا ایک مشکل کام ہوسکتا ہے، کیونکہ اس میں متن کے درمیان مماثلت اور فرق کی نشاندہی کرنا شامل ہے۔ اس کے بعد کے حصوں میں، ہم عام طریقوں اور تکنیکوں کے بارے میں ایک جامع بحث کریں گے جو پیرافراسنگ کی مثالوں کو سمجھنے کے لیے استعمال کیے گئے ہیں۔
سرقہ کی جانچ کرنے والے پیرا فریسنگ کا پتہ کیسے لگاتے ہیں: مناسب طریقے تلاش کیے گئے۔
آج کے تعلیمی منظر نامے میں، سرقہ کی جانچ کرنے والے تیزی سے ترقی یافتہ ہو گئے ہیں، جو صرف نقل شدہ متن کو جھنڈا لگانے سے آگے بڑھ کر پیرافراسڈ مواد کا بھی پتہ لگاتے ہیں۔ یہ مضمون ان طریقوں کو تلاش کرتا ہے جو ان ٹولز کو مؤثر طریقے سے پیرا فریسنگ کی شناخت کرنے کی اجازت دیتے ہیں۔
1. سٹرنگ ملاپ
اس طریقے میں کریکٹر یا لفظ کی سطح پر متن کا موازنہ کرنا شامل ہے تاکہ عین مطابق مماثلت کی نشاندہی کی جا سکے۔ دو متن کے درمیان کردار کی ترتیب یا الفاظ کے انتخاب میں اعلیٰ درجے کی مماثلت پیرا فریسنگ کا اشارہ دے سکتی ہے۔ یہ ٹولز پیچیدہ الگورتھم استعمال کرتے ہیں جو الفاظ کے سیاق و سباق کے معنی پر بھی غور کر سکتے ہیں، جس سے سرقہ کرنے والے، پیرافراس شدہ مواد کا پتہ نہ چلنا مشکل ہو جاتا ہے۔
2. کوزائن کی مماثلت
کوزائن مماثلت ان طریقوں میں سے ایک ہے جس کے ذریعے سرقہ کی جانچ کرنے والے پیرافراسنگ کا پتہ لگاتے ہیں۔ یہ ایک اعلی جہتی جگہ میں ان کے ویکٹر کی نمائندگی کے درمیان زاویہ کی بنیاد پر دو متن کے درمیان مماثلت کی پیمائش کرتا ہے۔ متن کو لفظ کی تعدد یا سرایت کے ویکٹر کے طور پر پیش کرتے ہوئے، یہ ٹولز کوزائن مماثلت کے اسکور کی گنتی کر سکتے ہیں تاکہ پیرافراسڈ مواد کا پتہ لگانے کی اپنی صلاحیت کو مزید بہتر بنایا جا سکے۔
3. لفظ کی صف بندی کے ماڈل
یہ ماڈل الفاظ یا جملے کو دو متنوں کے درمیان ان کی خط و کتابت کی شناخت کے لیے سیدھ میں لاتے ہیں۔ منسلک حصوں کا موازنہ کرکے، آپ مماثلتوں اور مماثلتوں میں فرق کی بنیاد پر پیرا فریسنگ کا پتہ لگا سکتے ہیں۔
4. معنوی تجزیہ
اس نقطہ نظر میں متن میں الفاظ اور فقروں کے معنی اور سیاق و سباق کا تجزیہ کرنا شامل ہے۔ لیٹنٹ سیمنٹک اینالیسس (LSA)، ورڈ ایمبیڈنگز (جیسے Word2Vec یا GloVe) جیسی تکنیکیں، یا BERT جیسے گہرے سیکھنے کے ماڈل الفاظ کے درمیان معنوی رشتوں کو پکڑ سکتے ہیں اور ان کی معنوی نمائندگی کی مماثلت کی بنیاد پر پیرا فریسنگ کی شناخت کر سکتے ہیں۔
5. مشین سیکھنے
زیر نگرانی مشین لرننگ الگورتھم کو متن کے پیرا فریزڈ اور غیر پیرافراسڈ جوڑوں کے لیبل والے ڈیٹاسیٹس پر تربیت دی جا سکتی ہے۔ یہ ماڈل ایسے نمونوں اور خصوصیات کو سیکھ سکتے ہیں جو پیرا فریز کو الگ کرتے ہیں اور متن کی نئی مثالوں کو پیرا فریز کے طور پر درجہ بندی کرنے کے لیے استعمال کیا جا سکتا ہے یا نہیں۔
6. این گرام تجزیہ
N-grams الفاظ کے گروپ ہیں جو ایک دوسرے کے بالکل قریب ہیں۔ جب آپ یہ چیک کرتے ہیں کہ یہ گروپ مختلف متن میں کتنی کثرت سے ظاہر ہوتے ہیں اور ان کا موازنہ کرتے ہیں، تو آپ ایک جیسے جملے یا ترتیب تلاش کر سکتے ہیں۔ اگر بہت سے ملتے جلتے نمونے ہیں، تو اس کا مطلب یہ ہو سکتا ہے کہ متن کی تشریح کی گئی ہو گی۔
7. ڈپلیکیٹ کا پتہ لگانے کے قریب
آخری طریقہ جس سے سرقہ کی جانچ پڑتال کرنے والے پیرافراسنگ کا مؤثر طریقے سے پتہ لگاتے ہیں۔
نیئر ڈپلیکیٹ پتہ لگانے والے الگورتھم اکثر متنی حصوں کی نشاندہی کرنے کے لیے پیرا فریسنگ ڈٹیکشن میں استعمال کیے جاتے ہیں جو کہ اعلیٰ درجے کی مماثلت ظاہر کرتے ہیں یا تقریباً ایک جیسے ہوتے ہیں۔ یہ الگورتھم خاص طور پر تفصیلی سطح پر متن کی مماثلت کے موازنہ کے ذریعے پیرافراسڈ مواد کو پہچاننے کے لیے تیار کیے گئے ہیں۔
سرقہ کی روک تھام کے سافٹ ویئر کے ذریعہ عام طور پر کون سا طریقہ استعمال کیا جاتا ہے؟
پیشہ ورانہ سرقہ کی روک تھام کی خدمات کے ذریعہ استعمال کردہ تکنیکی حل عام طور پر n-gram تجزیہ پر انحصار کرتے ہیں۔ این گرام پر مبنی ٹکنالوجی کا فائدہ اٹھا کر، یہ خدمات قابل ذکر حد تک درستگی کی شرح حاصل کرتی ہیں۔ یہ سرقہ کی جانچ کرنے والوں کے پیرا فریسنگ کا پتہ لگانے کے بہترین طریقوں میں سے ایک ہے، جس سے درست الفاظ کی شناخت اور ان کو نمایاں کیا جا سکتا ہے جو دوبارہ لکھے گئے ہیں۔
سرقہ کی جانچ کرنے والے کس طرح پیرا فریسنگ کا پتہ لگاتے ہیں اس کے میکانکس
سرقہ کی روک تھام کی خدمات عام طور پر دستاویزات کا موازنہ کرنے کے لیے فنگر پرنٹنگ تکنیک کا استعمال کرتی ہیں۔ اس میں تصدیق کے لیے دستاویزات سے ضروری n-گرام نکالنا اور ان کے ڈیٹا بیس میں موجود تمام دستاویزات کے n-گرام کے ساتھ موازنہ کرنا شامل ہے۔
مثال کے طور پر
آئیے کہتے ہیں کہ ایک جملہ ہے: « Le mont Olympe est la plus haute montagne de Grèce. »
۔ این گرام (مثال کے طور پر 3 گرام) اس جملے کا یہ ہوگا:
- لی مونٹ اولمپ
- mont Olympe est
- Olympe est la
- سب سے زیادہ ہے
- لا پلس ہوٹ
- پلس ہوٹی مونٹاگن
- haute montagne de
- montagne de Grèce
کیس 1. تبدیلی
اگر اس لفظ کو دوسرے لفظ سے بدل دیا جائے تو پھر بھی کچھ این گرام مماثل ہے اور مزید تجزیہ کرکے لفظ کی تبدیلی کا پتہ لگانا ممکن ہے۔
تبدیل شدہ جملہ: " پہاڑوں Olympe est la plus haute montagne de Péloponnèse. "
اصل 3 گرام | 3 گرام تبدیل شدہ متن |
لی مونٹ اولمپ mont Olympe est Olympe est la سب سے زیادہ ہے لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce | Le پہاڑوں اولمپس پہاڑوں Olympe est Olympe est la سب سے زیادہ ہے لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de مونٹاگن ڈی Péloponnèse |
کیس 2. الفاظ کی ترتیب کو تبدیل کیا (یا جملے، پیراگراف)
جب جملے کی ترتیب کو تبدیل کیا جاتا ہے، تب بھی کچھ 3-گرام مماثل ہوتے ہیں لہذا تبدیلی کا پتہ لگانا ممکن ہے۔
تبدیل شدہ جملہ: « La plus haute montagne de Grèce est Le mont Olympe. »
اصل 3 گرام | 3 گرام تبدیل شدہ متن |
لی مونٹ اولمپ mont Olympe est Olympe est la سب سے زیادہ ہے لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce | لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont لی مونٹ اولمپ |
کیس 3۔ نئے الفاظ شامل کیے گئے۔
جب نئے الفاظ شامل کیے جاتے ہیں، تب بھی کچھ 3 گرام ملتے ہیں اس لیے تبدیلی کا پتہ لگانا ممکن ہے۔
تبدیل شدہ جملہ: « Le mont Olympe est دور سے la plus haute montagne de Grèce. »
اصل 3 گرام | 3 گرام تبدیل شدہ متن |
لی مونٹ اولمپ mont Olympe est Olympe est la سب سے زیادہ ہے لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce | لی مونٹ اولمپ mont Olympe est Olympe est de est de loin بہت دور لون لا پلس لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce |
کیس 4۔ کچھ الفاظ حذف کیے گئے۔
جب لفظ ہٹا دیا جاتا ہے، تب بھی کچھ 3-گرام ملتے ہیں اس لیے تبدیلی کا پتہ لگانا ممکن ہے۔
تبدیل شدہ جملہ: « L'Olympe est la plus haute montagne de Grèce. »
اصل 3 گرام | 3 گرام تبدیل شدہ متن |
لی مونٹ اولمپ mont Olympe est Olympe est la سب سے زیادہ ہے لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce | L'Olympe est la سب سے زیادہ ہے لا پلس ہوٹ پلس ہوٹی مونٹاگن haute montagne de montagne de Grèce |
اصل دنیا کی مثال
ایک حقیقی دستاویز میں تصدیق کے مکمل ہونے پر، پیرافراسڈ حصوں کی شناخت اکثر وقفے وقفے سے نشانات کے ذریعے کی جاتی ہے۔ یہ رکاوٹیں، بدلے ہوئے الفاظ کی نشاندہی کرتے ہوئے، مرئیت اور امتیاز کو بڑھانے کے لیے نمایاں کی گئی ہیں۔
ذیل میں، آپ کو ایک حقیقی دستاویز کی مثال ملے گی۔
- پہلا اقتباس ایک فائل سے آتا ہے جس کی تصدیق کی گئی ہے۔ آکسیکو سرقہ کی روک تھام کی خدمت:
- دوسرا اقتباس اصل ماخذ دستاویز سے ہے:
گہرے تجزیے کے بعد یہ بات سامنے آتی ہے کہ دستاویز کے منتخب حصے کو درج ذیل تبدیلیاں کر کے بیان کیا گیا تھا۔
اصل متن | پیرافراسڈ ٹیکسٹ | تبدیلیاں |
جدت طرازی کی حمایت بھی خصوصیات ہے | جدت طرازی کی حمایت اس کے علاوہ ہے۔ | تبدیلی |
معاشی اور سماجی علم، موثر نظام | اقتصادی اور سماجی بیداری، موثر تنظیم | تبدیلی |
تجاویز (خیالات) | سفارش | بدلنا، حذف کرنا |
رویوں | آسن | تبدیلی |
کامیابی | فاتح | تبدیلی |
عمل (Perenc، Holub-Ivan | علمی عمل (Perenc، Holub - Ivan | اس کے علاوہ |
جدت کے حامی | سازگار | تبدیلی |
ایک آب و ہوا کی تخلیق | : شرط پیدا کرنا | تبدیلی |
سازگار | خوشگوار | تبدیلی |
علم کی ترقی | ترقی کے بارے میں آگاہی | تبدیلی |
نتیجہ
ادبی سرقہ، جو اکثر پیرافراسنگ کے معاملات میں نہیں پایا جاتا ہے، اکیڈمی میں ایک اہم تشویش بنی ہوئی ہے۔ تکنیکی ترقی نے سرقہ کی جانچ پڑتال کرنے والوں کو مؤثر طریقے سے بیان کردہ مواد کی شناخت کرنے کی صلاحیت سے لیس کیا ہے۔ خاص طور پر، سرقہ کی جانچ کرنے والے مختلف طریقوں جیسے سٹرنگ میچنگ، کوزائن مماثلت، اور این گرام تجزیہ کے ذریعے پیرا فریسنگ کا پتہ لگاتے ہیں۔ خاص طور پر، n-gram تجزیہ اس کی اعلی درستگی کی شرح کے لیے نمایاں ہے۔ یہ پیشرفت سرقہ کرنے والے اور پیرافراسڈ مواد کا پتہ نہ لگنے کے امکان کو کافی حد تک کم کرتی ہے، اس طرح تعلیمی سالمیت میں اضافہ ہوتا ہے۔ |