চুরির পরীক্ষকরা কীভাবে প্যারাফ্রেজিং সনাক্ত করে?

()

চুরির সাথে অন্য কারো ধারণা, শব্দ বা চিত্রের জন্য ক্রেডিট নেওয়া জড়িত, একটি অনুশীলন বিবেচনা করা হয় অনৈতিক একাডেমিক এবং পেশাদার পরিবেশে। এটা এমন ছাত্রদের অলক্ষ্যে যেতে পারে যারা ভুলবশত অন্য কারো শব্দ সঠিকভাবে উল্লেখ না করে পুনরায় শব্দ করে ফেলতে পারে। যেহেতু উদ্ধৃতি চিহ্নগুলি ব্যবহার করা হয় না যখন কিছু প্যারাফ্রেজ করা হয়, এটি সহজেই একজন প্রুফরিডারের হাত থেকে বাঁচতে পারে এবং চূড়ান্ত খসড়ায় যেতে পারে। যাইহোক, এটি সম্পূর্ণরূপে অপ্রাপ্য নয়, বিশেষ করে যেহেতু চুরির পরীক্ষকরা আজকাল আরও দক্ষতার সাথে প্যারাফ্রেজিং সনাক্ত করে।

প্যারাফ্রেজিং সনাক্ত করা একটি চ্যালেঞ্জিং কাজ হতে পারে, কারণ এতে পাঠ্যের মধ্যে মিল এবং পার্থক্য সনাক্ত করা জড়িত। পরবর্তী বিভাগে, আমরা প্যারাফ্রেজিংয়ের উদাহরণগুলি বোঝার জন্য নিযুক্ত সাধারণ পদ্ধতি এবং কৌশলগুলি সম্পর্কে একটি বিস্তৃত আলোচনা করব।

চুরির পরীক্ষকরা কীভাবে প্যারাফ্রেজিং সনাক্ত করে: উপযুক্ত পদ্ধতিগুলি অন্বেষণ করা হয়েছে

আজকের শিক্ষাগত ল্যান্ডস্কেপে, চৌর্যবৃত্তির চেকারগুলি ক্রমবর্ধমানভাবে উন্নত হয়েছে, শুধুমাত্র অনুলিপি করা পাঠ্যকে পতাকাঙ্কিত করার বাইরে গিয়ে প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করতেও। এই নিবন্ধটি এই সরঞ্জামগুলিকে কার্যকরভাবে প্যারাফ্রেজিং সনাক্ত করার অনুমতি দেওয়ার পদ্ধতিগুলি অন্বেষণ করে৷

1. স্ট্রিং ম্যাচিং

এই পদ্ধতিতে অক্ষর বা শব্দ স্তরে পাঠ্যের তুলনা করা হয় যাতে সঠিক মিলগুলি চিহ্নিত করা যায়। দুটি পাঠ্যের মধ্যে অক্ষর ক্রম বা শব্দ চয়নে উচ্চ মাত্রার সাদৃশ্য প্যারাফ্রেজিংয়ের সংকেত দিতে পারে। এই সরঞ্জামগুলি জটিল অ্যালগরিদম নিয়োগ করে যা এমনকি শব্দের প্রাসঙ্গিক অর্থও বিবেচনা করতে পারে, যা চুরি করা, প্যারাফ্রেজ করা উপাদানগুলিকে সনাক্ত করা ক্রমশ কঠিন করে তোলে।

2. কোসাইন সাদৃশ্য

কোসাইন সাদৃশ্য হল এমন একটি পদ্ধতি যার মাধ্যমে চুরির পরীক্ষকরা প্যারাফ্রেজিং সনাক্ত করে। এটি একটি উচ্চ-মাত্রিক স্থানের ভেক্টর উপস্থাপনার মধ্যে কোণের উপর ভিত্তি করে দুটি পাঠ্যের মধ্যে সাদৃশ্য পরিমাপ করে। শব্দ ফ্রিকোয়েন্সি বা এমবেডিংয়ের ভেক্টর হিসাবে পাঠ্যগুলিকে উপস্থাপন করে, এই সরঞ্জামগুলি প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করার তাদের ক্ষমতাকে আরও পরিমার্জিত করতে কোসাইন সাদৃশ্য স্কোর গণনা করতে পারে।

3. শব্দ প্রান্তিককরণ মডেল

এই মডেলগুলি তাদের চিঠিপত্র সনাক্ত করতে দুটি পাঠ্যের মধ্যে শব্দ বা বাক্যাংশগুলিকে সারিবদ্ধ করে। সারিবদ্ধ অংশগুলির তুলনা করে, আপনি মিলিত অনুক্রমের মিল এবং পার্থক্যের উপর ভিত্তি করে প্যারাফ্রেজিং সনাক্ত করতে পারেন।

4. শব্দার্থগত বিশ্লেষণ

এই পদ্ধতিতে পাঠ্যের শব্দ এবং বাক্যাংশের অর্থ এবং প্রসঙ্গ বিশ্লেষণ করা জড়িত। প্রচ্ছন্ন শব্দার্থিক বিশ্লেষণ (LSA), শব্দ এম্বেডিং (যেমন Word2Vec বা GloVe) বা BERT-এর মতো গভীর শিক্ষার মডেলের মতো কৌশলগুলি শব্দের মধ্যে শব্দার্থিক সম্পর্ককে ক্যাপচার করতে পারে এবং তাদের শব্দার্থিক উপস্থাপনার সাদৃশ্যের উপর ভিত্তি করে প্যারাফ্রেজিং সনাক্ত করতে পারে।

5। মেশিন লার্নিং

তত্ত্বাবধানে মেশিন লার্নিং অ্যালগরিদমগুলিকে প্যারাফ্রেসড এবং নন-প্যারাফ্রেজড জোড়া পাঠ্যের লেবেলযুক্ত ডেটাসেটগুলিতে প্রশিক্ষণ দেওয়া যেতে পারে। এই মডেলগুলি প্যাটার্ন এবং বৈশিষ্ট্যগুলি শিখতে পারে যা প্যারাফ্রেজগুলিকে আলাদা করে এবং পাঠ্যের নতুন উদাহরণগুলিকে প্যারাফ্রেজ করা বা না হিসাবে শ্রেণীবদ্ধ করতে ব্যবহার করা যেতে পারে।

6. এন-গ্রাম বিশ্লেষণ

এন-গ্রাম হল শব্দের গোষ্ঠী যা একে অপরের ঠিক পাশে থাকে। আপনি যখন পরীক্ষা করেন যে এই গোষ্ঠীগুলি বিভিন্ন পাঠ্যে কত ঘন ঘন উপস্থিত হয় এবং তাদের তুলনা করে, আপনি একই বাক্যাংশ বা ক্রম খুঁজে পেতে পারেন। যদি অনেকগুলি অনুরূপ নিদর্শন থাকে তবে এর অর্থ হতে পারে যে পাঠ্যটি প্যারাফ্রেজ করা হয়েছে।

7. ডুপ্লিকেট সনাক্তকরণ কাছাকাছি

চুরির পরীক্ষকরা কার্যকরভাবে প্যারাফ্রেজিং সনাক্ত করার শেষ উপায়।

কাছাকাছি-সদৃশ সনাক্তকরণ অ্যালগরিদমগুলি প্রায়শই টেক্সট সেগমেন্টগুলিকে চিহ্নিত করতে প্যারাফ্রেজিং সনাক্তকরণে নিযুক্ত করা হয় যা উচ্চ মাত্রার সাদৃশ্য প্রদর্শন করে বা প্রায় অভিন্ন। এই অ্যালগরিদমগুলি বিশেষভাবে বিশদ স্তরে পাঠ্যের সাদৃশ্যের তুলনার মাধ্যমে প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করার জন্য তৈরি করা হয়েছে।

চৌর্যবৃত্তি প্রতিরোধ সফ্টওয়্যার দ্বারা সাধারণত কোন পদ্ধতি ব্যবহার করা হয়?

পেশাদার চুরি প্রতিরোধ পরিষেবাগুলি দ্বারা ব্যবহৃত প্রযুক্তিগত সমাধানগুলি সাধারণত এন-গ্রাম বিশ্লেষণের উপর নির্ভর করে। এন-গ্রাম-ভিত্তিক প্রযুক্তি ব্যবহার করে, এই পরিষেবাগুলি একটি উল্লেখযোগ্যভাবে উচ্চ নির্ভুলতার হার অর্জন করে। চুরির পরীক্ষকদের প্যারাফ্রেজিং সনাক্ত করার এটি একটি সর্বোত্তম উপায়, যা পুনরায় লেখা হয়েছে সঠিক শব্দগুলি সনাক্তকরণ এবং হাইলাইট করতে সক্ষম করে।

চুরির পরীক্ষকরা কীভাবে প্যারাফ্রেজিং সনাক্ত করে তার মেকানিক্স

চুরি প্রতিরোধ পরিষেবাগুলি সাধারণত নথির তুলনা করার জন্য আঙুলের ছাপ দেওয়ার কৌশল ব্যবহার করে। এতে যাচাই করার জন্য নথি থেকে প্রয়োজনীয় n-গ্রাম বের করা এবং তাদের ডাটাবেসের সমস্ত নথির n-গ্রামের সাথে তুলনা করা জড়িত।

ছাত্র-পঠন-কীভাবে-চোরা-চোরা-পরীক্ষক-সনাক্ত-প্যারাফ্রেজিং

উদাহরণ

ধরা যাক একটি বাক্য আছে: « Le mont Olympe est la plus haute montagne de Grèce. »

সার্জারির n-গ্রাম (উদাহরণস্বরূপ 3-গ্রাম) এই বাক্যটির হবে:

  • লে মন্ট অলিম্পে
  • মন্ট অলিম্প ইস্ট
  • অলিম্প est লা
  • সবচেয়ে
  • লা প্লাস হাউট
  • প্লাস হাউট মন্টাগনে
  • Haute montagne de
  • montagne de Grèce

কেস 1. প্রতিস্থাপন

শব্দটি অন্য শব্দ দ্বারা প্রতিস্থাপিত হলে, এখনও কিছু n-গ্রাম মিল এবং আরও বিশ্লেষণ করে শব্দ প্রতিস্থাপন সনাক্ত করা সম্ভব।

পরিবর্তিত বাক্য:  " পর্বত অলিম্পে এস্ট লা প্লাস হাউট মন্টাগন দে Péloponnèse. »

আসল 3-গ্রাম3-গ্রাম পরিবর্তিত পাঠ্য
লে মন্ট অলিম্পে
মন্ট অলিম্প ইস্ট
অলিম্প est লা
সবচেয়ে
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce
Le পর্বত স্বর্গ
পর্বত অলিম্প ইস্ট
অলিম্প est লা
সবচেয়ে
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
মন্টাগন ডি Péloponnèse

কেস 2. শব্দের ক্রম পরিবর্তন করা হয়েছে (বা বাক্য, অনুচ্ছেদ)

যখন বাক্যের ক্রম পরিবর্তন করা হয়, তখনও কিছু 3-গ্রাম মেলে তাই পরিবর্তন সনাক্ত করা সম্ভব।

পরিবর্তিত বাক্য: « La plus haute montagne de Grèce est Le mont Olympe. »

আসল 3-গ্রাম3-গ্রাম পরিবর্তিত পাঠ্য
লে মন্ট অলিম্পে
মন্ট অলিম্প ইস্ট
অলিম্প est লা
সবচেয়ে
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce
ডি গ্রেস এস্ট
গ্রেস এস্ট লে
ইস্ট লে মন্ট
লে মন্ট অলিম্পে

কেস 3. নতুন শব্দ যোগ করা হয়েছে

যখন নতুন শব্দ যোগ করা হয়, তখনও কিছু 3-গ্রাম মেলে তাই পরিবর্তন শনাক্ত করা সম্ভব।

পরিবর্তিত বাক্য: « Le mont Olympe est অনেক দূর থেকে লা প্লাস হাউট মন্টাগন ডি গ্রেস। »

আসল 3-গ্রাম3-গ্রাম পরিবর্তিত পাঠ্য
লে মন্ট অলিম্পে
মন্ট অলিম্প ইস্ট
অলিম্প est লা
সবচেয়ে
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce
লে মন্ট অলিম্পে
মন্ট অলিম্প ইস্ট
অলিম্প ইস্ট ডি
est de loin
অনেক দূরে
কটি লা প্লাস
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce

কেস 4. কিছু শব্দ মুছে ফেলা হয়েছে

যখন শব্দটি সরানো হয়, তখনও কিছু 3-গ্রাম মেলে তাই পরিবর্তন সনাক্ত করা সম্ভব।

পরিবর্তিত বাক্য: « L'Olympe est la plus haute montagne de Grèce. »

আসল 3-গ্রাম3-গ্রাম পরিবর্তিত পাঠ্য
লে মন্ট অলিম্পে
মন্ট অলিম্প ইস্ট
অলিম্প est লা
সবচেয়ে
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce
L'Olympe est la
সবচেয়ে
লা প্লাস হাউট
প্লাস হাউট মন্টাগনে
Haute montagne de
montagne de Grèce

বাস্তব বিশ্বের উদাহরণ

একটি প্রকৃত নথিতে যাচাইকরণ সমাপ্ত হওয়ার পরে, প্যারাফ্রেজ করা বিভাগগুলি প্রায়ই বিঘ্নিত চিহ্নগুলির মাধ্যমে চিহ্নিত করা হয়। এই বাধাগুলি, পরিবর্তিত শব্দগুলিকে নির্দেশ করে, দৃশ্যমানতা এবং পার্থক্য বাড়ানোর জন্য হাইলাইট করা হয়েছে৷

নীচে, আপনি একটি বাস্তব নথির উদাহরণ পাবেন।

  • প্রথম উদ্ধৃতিটি একটি ফাইল থেকে আসে যা ব্যবহার করে যাচাই করা হয়েছে অক্সসিকো চুরি প্রতিরোধ পরিষেবা:
  • দ্বিতীয় উদ্ধৃতি মূল উৎস নথি থেকে:

একটি গভীর বিশ্লেষণের পরে এটি স্পষ্ট যে নথির নির্বাচিত অংশ নিম্নলিখিত পরিবর্তনগুলি করে ব্যাখ্যা করা হয়েছিল:

মূল পাঠ্যপ্যারাফ্রেজড টেক্সটপরিবর্তন
উদ্ভাবন সমর্থন করে এছাড়াও চিহ্নিত করা হয় ব্যাক আপ উদ্ভাবন সংজ্ঞায়িত ছাড়াও হয়প্রতিস্থাপন
অর্থনৈতিক এবং সামাজিক জ্ঞান, দক্ষ সিস্টেম অর্থনৈতিক এবং সামাজিক সচেতনতা, দক্ষ সংগঠনপ্রতিস্থাপন
প্রস্তাব (ধারনা)সুপারিশপ্রতিস্থাপন, মুছে ফেলা
মনোভাবভঙ্গিপ্রতিস্থাপন
সাফল্যবিজয়ীপ্রতিস্থাপন
প্রক্রিয়া (Perenc, Holub-Ivanজ্ঞানীয় প্রক্রিয়া (পেরেঙ্ক, হলুব - ইভানযোগ
প্রো-ইনোভেশনঅনুকূলপ্রতিস্থাপন
একটি জলবায়ু তৈরি: একটি শর্ত তৈরি করাপ্রতিস্থাপন
অনুকূলসমৃদ্ধপ্রতিস্থাপন
জ্ঞান বিকাশউন্নয়ন সচেতনতাপ্রতিস্থাপন

উপসংহার

চৌর্যবৃত্তি, প্যারাফ্রেজিংয়ের ক্ষেত্রে প্রায়শই সনাক্ত করা যায় না, একাডেমিয়ায় একটি উল্লেখযোগ্য উদ্বেগ হিসাবে রয়ে গেছে। প্রযুক্তিগত অগ্রগতি চুরির পরীক্ষকদের কার্যকরভাবে প্যারাফ্রেজ করা বিষয়বস্তু সনাক্ত করার ক্ষমতা দিয়ে সজ্জিত করেছে। বিশেষত, চুরির পরীক্ষকরা স্ট্রিং ম্যাচিং, কোসাইন সাদৃশ্য এবং এন-গ্রাম বিশ্লেষণের মতো বিভিন্ন পদ্ধতির মাধ্যমে প্যারাফ্রেজিং সনাক্ত করে। উল্লেখযোগ্যভাবে, এন-গ্রাম বিশ্লেষণ তার উচ্চ নির্ভুলতার হারের জন্য দাঁড়িয়েছে। এই অগ্রগতিগুলি চুরি করা এবং প্যারাফ্রেজ করা উপাদানগুলি সনাক্ত না হওয়ার সম্ভাবনাকে উল্লেখযোগ্যভাবে হ্রাস করে, যার ফলে একাডেমিক অখণ্ডতা বৃদ্ধি পায়।

তথ্য জানার ক্ষেত্রে এই পোস্টটি কতটা সাহায্যকারী বলে মনে করছেন?

রেটিং দেয়ার জন্য নীচের তারকা চিহ্নে ক্লিক করুন!

গড় রেটিং / 5। ভোট গণনা:

এখন পর্যন্ত কোনও ভোট নেই! এই পোস্টটি রেটিং প্রথম হন।

আমরা দুঃখিত যে এই পোস্টটি আপনার জন্য দরকারী ছিল না!

আমাদের এই পোস্ট উন্নত করা যাক!

আমরা কিভাবে এই পোস্ট উন্নত করতে পারেন বলুন?