চুরির সাথে অন্য কারো ধারণা, শব্দ বা চিত্রের জন্য ক্রেডিট নেওয়া জড়িত, একটি অনুশীলন বিবেচনা করা হয় অনৈতিক একাডেমিক এবং পেশাদার পরিবেশে। এটা এমন ছাত্রদের অলক্ষ্যে যেতে পারে যারা ভুলবশত অন্য কারো শব্দ সঠিকভাবে উল্লেখ না করে পুনরায় শব্দ করে ফেলতে পারে। যেহেতু উদ্ধৃতি চিহ্নগুলি ব্যবহার করা হয় না যখন কিছু প্যারাফ্রেজ করা হয়, এটি সহজেই একজন প্রুফরিডারের হাত থেকে বাঁচতে পারে এবং চূড়ান্ত খসড়ায় যেতে পারে। যাইহোক, এটি সম্পূর্ণরূপে অপ্রাপ্য নয়, বিশেষ করে যেহেতু চুরির পরীক্ষকরা আজকাল আরও দক্ষতার সাথে প্যারাফ্রেজিং সনাক্ত করে।
প্যারাফ্রেজিং সনাক্ত করা একটি চ্যালেঞ্জিং কাজ হতে পারে, কারণ এতে পাঠ্যের মধ্যে মিল এবং পার্থক্য সনাক্ত করা জড়িত। পরবর্তী বিভাগে, আমরা প্যারাফ্রেজিংয়ের উদাহরণগুলি বোঝার জন্য নিযুক্ত সাধারণ পদ্ধতি এবং কৌশলগুলি সম্পর্কে একটি বিস্তৃত আলোচনা করব।
চুরির পরীক্ষকরা কীভাবে প্যারাফ্রেজিং সনাক্ত করে: উপযুক্ত পদ্ধতিগুলি অন্বেষণ করা হয়েছে
আজকের শিক্ষাগত ল্যান্ডস্কেপে, চৌর্যবৃত্তির চেকারগুলি ক্রমবর্ধমানভাবে উন্নত হয়েছে, শুধুমাত্র অনুলিপি করা পাঠ্যকে পতাকাঙ্কিত করার বাইরে গিয়ে প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করতেও। এই নিবন্ধটি এই সরঞ্জামগুলিকে কার্যকরভাবে প্যারাফ্রেজিং সনাক্ত করার অনুমতি দেওয়ার পদ্ধতিগুলি অন্বেষণ করে৷
1. স্ট্রিং ম্যাচিং
এই পদ্ধতিতে অক্ষর বা শব্দ স্তরে পাঠ্যের তুলনা করা হয় যাতে সঠিক মিলগুলি চিহ্নিত করা যায়। দুটি পাঠ্যের মধ্যে অক্ষর ক্রম বা শব্দ চয়নে উচ্চ মাত্রার সাদৃশ্য প্যারাফ্রেজিংয়ের সংকেত দিতে পারে। এই সরঞ্জামগুলি জটিল অ্যালগরিদম নিয়োগ করে যা এমনকি শব্দের প্রাসঙ্গিক অর্থও বিবেচনা করতে পারে, যা চুরি করা, প্যারাফ্রেজ করা উপাদানগুলিকে সনাক্ত করা ক্রমশ কঠিন করে তোলে।
2. কোসাইন সাদৃশ্য
কোসাইন সাদৃশ্য হল এমন একটি পদ্ধতি যার মাধ্যমে চুরির পরীক্ষকরা প্যারাফ্রেজিং সনাক্ত করে। এটি একটি উচ্চ-মাত্রিক স্থানের ভেক্টর উপস্থাপনার মধ্যে কোণের উপর ভিত্তি করে দুটি পাঠ্যের মধ্যে সাদৃশ্য পরিমাপ করে। শব্দ ফ্রিকোয়েন্সি বা এমবেডিংয়ের ভেক্টর হিসাবে পাঠ্যগুলিকে উপস্থাপন করে, এই সরঞ্জামগুলি প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করার তাদের ক্ষমতাকে আরও পরিমার্জিত করতে কোসাইন সাদৃশ্য স্কোর গণনা করতে পারে।
3. শব্দ প্রান্তিককরণ মডেল
এই মডেলগুলি তাদের চিঠিপত্র সনাক্ত করতে দুটি পাঠ্যের মধ্যে শব্দ বা বাক্যাংশগুলিকে সারিবদ্ধ করে। সারিবদ্ধ অংশগুলির তুলনা করে, আপনি মিলিত অনুক্রমের মিল এবং পার্থক্যের উপর ভিত্তি করে প্যারাফ্রেজিং সনাক্ত করতে পারেন।
4. শব্দার্থগত বিশ্লেষণ
এই পদ্ধতিতে পাঠ্যের শব্দ এবং বাক্যাংশের অর্থ এবং প্রসঙ্গ বিশ্লেষণ করা জড়িত। প্রচ্ছন্ন শব্দার্থিক বিশ্লেষণ (LSA), শব্দ এম্বেডিং (যেমন Word2Vec বা GloVe) বা BERT-এর মতো গভীর শিক্ষার মডেলের মতো কৌশলগুলি শব্দের মধ্যে শব্দার্থিক সম্পর্ককে ক্যাপচার করতে পারে এবং তাদের শব্দার্থিক উপস্থাপনার সাদৃশ্যের উপর ভিত্তি করে প্যারাফ্রেজিং সনাক্ত করতে পারে।
5। মেশিন লার্নিং
তত্ত্বাবধানে মেশিন লার্নিং অ্যালগরিদমগুলিকে প্যারাফ্রেসড এবং নন-প্যারাফ্রেজড জোড়া পাঠ্যের লেবেলযুক্ত ডেটাসেটগুলিতে প্রশিক্ষণ দেওয়া যেতে পারে। এই মডেলগুলি প্যাটার্ন এবং বৈশিষ্ট্যগুলি শিখতে পারে যা প্যারাফ্রেজগুলিকে আলাদা করে এবং পাঠ্যের নতুন উদাহরণগুলিকে প্যারাফ্রেজ করা বা না হিসাবে শ্রেণীবদ্ধ করতে ব্যবহার করা যেতে পারে।
6. এন-গ্রাম বিশ্লেষণ
এন-গ্রাম হল শব্দের গোষ্ঠী যা একে অপরের ঠিক পাশে থাকে। আপনি যখন পরীক্ষা করেন যে এই গোষ্ঠীগুলি বিভিন্ন পাঠ্যে কত ঘন ঘন উপস্থিত হয় এবং তাদের তুলনা করে, আপনি একই বাক্যাংশ বা ক্রম খুঁজে পেতে পারেন। যদি অনেকগুলি অনুরূপ নিদর্শন থাকে তবে এর অর্থ হতে পারে যে পাঠ্যটি প্যারাফ্রেজ করা হয়েছে।
7. ডুপ্লিকেট সনাক্তকরণ কাছাকাছি
চুরির পরীক্ষকরা কার্যকরভাবে প্যারাফ্রেজিং সনাক্ত করার শেষ উপায়।
কাছাকাছি-সদৃশ সনাক্তকরণ অ্যালগরিদমগুলি প্রায়শই টেক্সট সেগমেন্টগুলিকে চিহ্নিত করতে প্যারাফ্রেজিং সনাক্তকরণে নিযুক্ত করা হয় যা উচ্চ মাত্রার সাদৃশ্য প্রদর্শন করে বা প্রায় অভিন্ন। এই অ্যালগরিদমগুলি বিশেষভাবে বিশদ স্তরে পাঠ্যের সাদৃশ্যের তুলনার মাধ্যমে প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করার জন্য তৈরি করা হয়েছে।
চৌর্যবৃত্তি প্রতিরোধ সফ্টওয়্যার দ্বারা সাধারণত কোন পদ্ধতি ব্যবহার করা হয়?
পেশাদার চুরি প্রতিরোধ পরিষেবাগুলি দ্বারা ব্যবহৃত প্রযুক্তিগত সমাধানগুলি সাধারণত এন-গ্রাম বিশ্লেষণের উপর নির্ভর করে। এন-গ্রাম-ভিত্তিক প্রযুক্তি ব্যবহার করে, এই পরিষেবাগুলি একটি উল্লেখযোগ্যভাবে উচ্চ নির্ভুলতার হার অর্জন করে। চুরির পরীক্ষকদের প্যারাফ্রেজিং সনাক্ত করার এটি একটি সর্বোত্তম উপায়, যা পুনরায় লেখা হয়েছে সঠিক শব্দগুলি সনাক্তকরণ এবং হাইলাইট করতে সক্ষম করে।
চুরির পরীক্ষকরা কীভাবে প্যারাফ্রেজিং সনাক্ত করে তার মেকানিক্স
চুরি প্রতিরোধ পরিষেবাগুলি সাধারণত নথির তুলনা করার জন্য আঙুলের ছাপ দেওয়ার কৌশল ব্যবহার করে। এতে যাচাই করার জন্য নথি থেকে প্রয়োজনীয় n-গ্রাম বের করা এবং তাদের ডাটাবেসের সমস্ত নথির n-গ্রামের সাথে তুলনা করা জড়িত।
উদাহরণ
ধরা যাক একটি বাক্য আছে: « Le mont Olympe est la plus haute montagne de Grèce. »
সার্জারির n-গ্রাম (উদাহরণস্বরূপ 3-গ্রাম) এই বাক্যটির হবে:
- লে মন্ট অলিম্পে
- মন্ট অলিম্প ইস্ট
- অলিম্প est লা
- সবচেয়ে
- লা প্লাস হাউট
- প্লাস হাউট মন্টাগনে
- Haute montagne de
- montagne de Grèce
কেস 1. প্রতিস্থাপন
শব্দটি অন্য শব্দ দ্বারা প্রতিস্থাপিত হলে, এখনও কিছু n-গ্রাম মিল এবং আরও বিশ্লেষণ করে শব্দ প্রতিস্থাপন সনাক্ত করা সম্ভব।
পরিবর্তিত বাক্য: " পর্বত অলিম্পে এস্ট লা প্লাস হাউট মন্টাগন দে Péloponnèse. »
আসল 3-গ্রাম | 3-গ্রাম পরিবর্তিত পাঠ্য |
লে মন্ট অলিম্পে মন্ট অলিম্প ইস্ট অলিম্প est লা সবচেয়ে লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce | Le পর্বত স্বর্গ পর্বত অলিম্প ইস্ট অলিম্প est লা সবচেয়ে লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de মন্টাগন ডি Péloponnèse |
কেস 2. শব্দের ক্রম পরিবর্তন করা হয়েছে (বা বাক্য, অনুচ্ছেদ)
যখন বাক্যের ক্রম পরিবর্তন করা হয়, তখনও কিছু 3-গ্রাম মেলে তাই পরিবর্তন সনাক্ত করা সম্ভব।
পরিবর্তিত বাক্য: « La plus haute montagne de Grèce est Le mont Olympe. »
আসল 3-গ্রাম | 3-গ্রাম পরিবর্তিত পাঠ্য |
লে মন্ট অলিম্পে মন্ট অলিম্প ইস্ট অলিম্প est লা সবচেয়ে লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce | লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce ডি গ্রেস এস্ট গ্রেস এস্ট লে ইস্ট লে মন্ট লে মন্ট অলিম্পে |
কেস 3. নতুন শব্দ যোগ করা হয়েছে
যখন নতুন শব্দ যোগ করা হয়, তখনও কিছু 3-গ্রাম মেলে তাই পরিবর্তন শনাক্ত করা সম্ভব।
পরিবর্তিত বাক্য: « Le mont Olympe est অনেক দূর থেকে লা প্লাস হাউট মন্টাগন ডি গ্রেস। »
আসল 3-গ্রাম | 3-গ্রাম পরিবর্তিত পাঠ্য |
লে মন্ট অলিম্পে মন্ট অলিম্প ইস্ট অলিম্প est লা সবচেয়ে লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce | লে মন্ট অলিম্পে মন্ট অলিম্প ইস্ট অলিম্প ইস্ট ডি est de loin অনেক দূরে কটি লা প্লাস লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce |
কেস 4. কিছু শব্দ মুছে ফেলা হয়েছে
যখন শব্দটি সরানো হয়, তখনও কিছু 3-গ্রাম মেলে তাই পরিবর্তন সনাক্ত করা সম্ভব।
পরিবর্তিত বাক্য: « L'Olympe est la plus haute montagne de Grèce. »
আসল 3-গ্রাম | 3-গ্রাম পরিবর্তিত পাঠ্য |
লে মন্ট অলিম্পে মন্ট অলিম্প ইস্ট অলিম্প est লা সবচেয়ে লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce | L'Olympe est la সবচেয়ে লা প্লাস হাউট প্লাস হাউট মন্টাগনে Haute montagne de montagne de Grèce |
বাস্তব বিশ্বের উদাহরণ
একটি প্রকৃত নথিতে যাচাইকরণ সমাপ্ত হওয়ার পরে, প্যারাফ্রেজ করা বিভাগগুলি প্রায়ই বিঘ্নিত চিহ্নগুলির মাধ্যমে চিহ্নিত করা হয়। এই বাধাগুলি, পরিবর্তিত শব্দগুলিকে নির্দেশ করে, দৃশ্যমানতা এবং পার্থক্য বাড়ানোর জন্য হাইলাইট করা হয়েছে৷
নীচে, আপনি একটি বাস্তব নথির উদাহরণ পাবেন।
- প্রথম উদ্ধৃতিটি একটি ফাইল থেকে আসে যা ব্যবহার করে যাচাই করা হয়েছে অক্সসিকো চুরি প্রতিরোধ পরিষেবা:
- দ্বিতীয় উদ্ধৃতি মূল উৎস নথি থেকে:
একটি গভীর বিশ্লেষণের পরে এটি স্পষ্ট যে নথির নির্বাচিত অংশ নিম্নলিখিত পরিবর্তনগুলি করে ব্যাখ্যা করা হয়েছিল:
মূল পাঠ্য | প্যারাফ্রেজড টেক্সট | পরিবর্তন |
উদ্ভাবন সমর্থন করে এছাড়াও চিহ্নিত করা হয় | ব্যাক আপ উদ্ভাবন সংজ্ঞায়িত ছাড়াও হয় | প্রতিস্থাপন |
অর্থনৈতিক এবং সামাজিক জ্ঞান, দক্ষ সিস্টেম | অর্থনৈতিক এবং সামাজিক সচেতনতা, দক্ষ সংগঠন | প্রতিস্থাপন |
প্রস্তাব (ধারনা) | সুপারিশ | প্রতিস্থাপন, মুছে ফেলা |
মনোভাব | ভঙ্গি | প্রতিস্থাপন |
সাফল্য | বিজয়ী | প্রতিস্থাপন |
প্রক্রিয়া (Perenc, Holub-Ivan | জ্ঞানীয় প্রক্রিয়া (পেরেঙ্ক, হলুব - ইভান | যোগ |
প্রো-ইনোভেশন | অনুকূল | প্রতিস্থাপন |
একটি জলবায়ু তৈরি | : একটি শর্ত তৈরি করা | প্রতিস্থাপন |
অনুকূল | সমৃদ্ধ | প্রতিস্থাপন |
জ্ঞান বিকাশ | উন্নয়ন সচেতনতা | প্রতিস্থাপন |
উপসংহার
চৌর্যবৃত্তি, প্যারাফ্রেজিংয়ের ক্ষেত্রে প্রায়শই সনাক্ত করা যায় না, একাডেমিয়ায় একটি উল্লেখযোগ্য উদ্বেগ হিসাবে রয়ে গেছে। প্রযুক্তিগত অগ্রগতি চুরির পরীক্ষকদের কার্যকরভাবে প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করার ক্ষমতা দিয়ে সজ্জিত করেছে। বিশেষত, চুরির পরীক্ষকরা স্ট্রিং ম্যাচিং, কোসাইন সাদৃশ্য এবং এন-গ্রাম বিশ্লেষণের মতো বিভিন্ন পদ্ধতির মাধ্যমে প্যারাফ্রেজিং সনাক্ত করে। উল্লেখযোগ্যভাবে, এন-গ্রাম বিশ্লেষণ তার উচ্চ নির্ভুলতার হারের জন্য দাঁড়িয়েছে। এই অগ্রগতিগুলি চুরি করা এবং প্যারাফ্রেজ করা উপাদানগুলি সনাক্ত না হওয়ার সম্ভাবনাকে উল্লেখযোগ্যভাবে হ্রাস করে, যার ফলে একাডেমিক অখণ্ডতা বৃদ্ধি পায়। |