साहित्यिक चोरी में किसी और के विचारों, शब्दों या छवियों का श्रेय लेना शामिल है, जिसे एक प्रथा माना जाता है अनैतिक शैक्षणिक और व्यावसायिक वातावरण में। यह उन छात्रों द्वारा ध्यान नहीं दिया जा सकता है जो गलती से किसी और के शब्दों को उचित कारण बताए बिना दोबारा लिख सकते हैं। चूंकि किसी चीज़ की व्याख्या करते समय उद्धरण चिह्नों का उपयोग नहीं किया जाता है, इसलिए यह आसानी से प्रूफ़रीडर की पकड़ से बच सकता है और अंतिम ड्राफ्ट में जा सकता है। हालाँकि, यह पूरी तरह से अप्राप्य नहीं है, विशेषकर चूँकि साहित्यिक चोरी जाँचकर्ता आजकल अधिक कुशलता से व्याख्या का पता लगाते हैं।
व्याख्या का पता लगाना एक चुनौतीपूर्ण कार्य हो सकता है, क्योंकि इसमें पाठों के बीच समानता और अंतर की पहचान करना शामिल है। अगले अनुभागों में, हम व्याख्या के उदाहरणों को समझने के लिए उपयोग की जाने वाली सामान्य विधियों और तकनीकों के बारे में व्यापक चर्चा करेंगे।
साहित्यिक चोरी जांचकर्ता कैसे व्याख्या का पता लगाते हैं: उपयुक्त तरीकों का पता लगाया गया
आज के शैक्षिक परिदृश्य में, साहित्यिक चोरी जांचकर्ता तेजी से उन्नत हो गए हैं, जो केवल कॉपी किए गए पाठ को फ़्लैग करने से आगे बढ़कर व्याख्या की गई सामग्री का भी पता लगा रहे हैं। यह आलेख उन तरीकों की पड़ताल करता है जो इन उपकरणों को प्रभावी ढंग से व्याख्या की पहचान करने की अनुमति देते हैं।
1. स्ट्रिंग मिलान
इस पद्धति में सटीक मिलान का पता लगाने के लिए वर्ण या शब्द स्तर पर पाठ की तुलना करना शामिल है। दो पाठों के बीच वर्ण अनुक्रमों या शब्द विकल्पों में उच्च स्तर की समानता व्याख्या का संकेत दे सकती है। ये उपकरण जटिल एल्गोरिदम का उपयोग करते हैं जो शब्दों के प्रासंगिक अर्थ पर भी विचार कर सकते हैं, जिससे साहित्यिक चोरी, व्याख्या की गई सामग्री का पता न चल पाना कठिन हो जाता है।
2. कोसाइन समानता
कोसाइन समानता उन तरीकों में से एक है जिसके द्वारा साहित्यिक चोरी जांचकर्ता व्याख्या का पता लगाते हैं। यह उच्च-आयामी स्थान में उनके वेक्टर प्रतिनिधित्व के बीच के कोण के आधार पर दो पाठों के बीच समानता को मापता है। पाठों को शब्द आवृत्तियों या एम्बेडिंग के वैक्टर के रूप में प्रस्तुत करके, ये उपकरण व्याख्यात्मक सामग्री का पता लगाने की उनकी क्षमता को और अधिक परिष्कृत करने के लिए कोसाइन समानता स्कोर की गणना कर सकते हैं।
3. शब्द संरेखण मॉडल
ये मॉडल दो पाठों के बीच उनके पत्राचार की पहचान करने के लिए शब्दों या वाक्यांशों को संरेखित करते हैं। संरेखित खंडों की तुलना करके, आप मिलान किए गए अनुक्रमों में समानता और अंतर के आधार पर व्याख्या का पता लगा सकते हैं।
4. शब्दार्थ विश्लेषण
इस दृष्टिकोण में ग्रंथों में शब्दों और वाक्यांशों के अर्थ और संदर्भ का विश्लेषण करना शामिल है। अव्यक्त सिमेंटिक विश्लेषण (एलएसए), शब्द एम्बेडिंग (जैसे Word2Vec या GloVe), या BERT जैसे गहन शिक्षण मॉडल जैसी तकनीकें शब्दों के बीच सिमेंटिक संबंधों को पकड़ सकती हैं और उनके सिमेंटिक अभ्यावेदन की समानता के आधार पर व्याख्या की पहचान कर सकती हैं।
5। मशीन सीखने
पर्यवेक्षित मशीन लर्निंग एल्गोरिदम को पाठों के पैराफ्रेज़्ड और गैर-पैराफ़्रेज़्ड जोड़े के लेबल किए गए डेटासेट पर प्रशिक्षित किया जा सकता है। ये मॉडल ऐसे पैटर्न और विशेषताएं सीख सकते हैं जो पैराफ़्रेज़ को अलग करते हैं और पाठ के नए उदाहरणों को पैराफ़्रेज़ किए गए या नहीं के रूप में वर्गीकृत करने के लिए उपयोग किया जा सकता है।
6. एन-ग्राम विश्लेषण
एन-ग्राम शब्दों के समूह हैं जो एक दूसरे के ठीक बगल में होते हैं। जब आप जाँचते हैं कि ये समूह अलग-अलग पाठों में कितनी बार दिखाई देते हैं और उनकी तुलना करते हैं, तो आप समान वाक्यांश या अनुक्रम पा सकते हैं। यदि कई समान पैटर्न हैं, तो इसका मतलब यह हो सकता है कि पाठ को व्याख्यायित किया गया होगा।
7. डुप्लिकेट डिटेक्शन के पास
साहित्यिक चोरी जांचकर्ता प्रभावी ढंग से व्याख्या का पता लगाने का आखिरी तरीका है।
नियर-डुप्लिकेट डिटेक्शन एल्गोरिदम को अक्सर पाठ खंडों को इंगित करने के लिए पैराफ़्रेसिंग डिटेक्शन में नियोजित किया जाता है जो उच्च स्तर की समानता प्रदर्शित करते हैं या लगभग समान होते हैं। ये एल्गोरिदम विशेष रूप से विस्तृत स्तर पर पाठ समानता की तुलना के माध्यम से व्याख्या की गई सामग्री को पहचानने के लिए तैयार किए गए हैं।
साहित्यिक चोरी रोकथाम सॉफ़्टवेयर द्वारा आमतौर पर कौन सी विधि का उपयोग किया जाता है?
पेशेवर साहित्यिक चोरी रोकथाम सेवाओं द्वारा उपयोग किए जाने वाले तकनीकी समाधान आमतौर पर एन-ग्राम विश्लेषण पर निर्भर करते हैं। एन-ग्राम-आधारित प्रौद्योगिकी का लाभ उठाकर, ये सेवाएँ उल्लेखनीय रूप से उच्च परिशुद्धता दर प्राप्त करती हैं। यह उन सर्वोत्तम तरीकों में से एक है जिससे साहित्यिक चोरी जांचकर्ता व्याख्या का पता लगा सकते हैं, जिससे दोबारा लिखे गए सटीक शब्दों की पहचान और हाइलाइटिंग सक्षम हो जाती है।
साहित्यिक चोरी जांचकर्ता कैसे व्याख्यात्मकता का पता लगाते हैं इसकी यांत्रिकी
साहित्यिक चोरी रोकथाम सेवाएँ आमतौर पर दस्तावेज़ों की तुलना करने के लिए फ़िंगरप्रिंटिंग तकनीक का उपयोग करती हैं। इसमें सत्यापित किए जाने वाले दस्तावेज़ों से आवश्यक एन-ग्राम निकालना और उनके डेटाबेस में सभी दस्तावेज़ों के एन-ग्राम के साथ उनकी तुलना करना शामिल है।
उदाहरण
मान लीजिए कि एक वाक्य है: « ले मोंट ओलम्पे इस्ट ला प्लस हाउते मोंटेग्ने डे ग्रेस। »
RSI एन-ग्रामgram (उदाहरण के लिए 3-ग्राम) इस वाक्य का होगा:
- ले मोंट ओलम्पे
- मोंट ओलम्पे स्था
- ओलम्पे इस्ट ला
- सबसे अधिक है
- ला प्लस हाउते
- प्लस हाउते मोंटगैन
- हाउते मोंटेग्ने डे
- मोंटेग्ने डी ग्रेस
केस 1. प्रतिस्थापन
यदि शब्द को दूसरे शब्द से बदल दिया जाए, तब भी कुछ एन-ग्रामgram मिलान करें और आगे के विश्लेषण से प्रतिस्थापन शब्द का पता लगाना संभव है।
बदला हुआ वाक्य: « Le पहाड़ों ओलम्पे इस्ट ला प्लस हाउते मोंटेग्ने डे Peloponnese। "
मूल 3-ग्राम | 3-ग्राम परिवर्तित पाठ |
ले मोंट ओलम्पे मोंट ओलम्पे स्था ओलम्पे इस्ट ला सबसे अधिक है ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस | Le पहाड़ों ओलिंप पहाड़ों ओलम्पे स्था ओलम्पे इस्ट ला सबसे अधिक है ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे पहाड़ का Peloponnese |
केस 2. शब्दों (या वाक्यों, पैराग्राफों) का क्रम बदल दिया
जब वाक्य का क्रम बदला जाता है, तब भी कुछ 3-ग्राम मेल खाते हैं इसलिए परिवर्तन का पता लगाना संभव है।
बदला हुआ वाक्य: « ला प्लस हाउते मोंटेग्ने डे ग्रेस इस्ट ले मोंट ओलम्पे। »
मूल 3-ग्राम | 3-ग्राम परिवर्तित पाठ |
ले मोंट ओलम्पे मोंट ओलम्पे स्था ओलम्पे इस्ट ला सबसे अधिक है ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस | ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस डी ग्रेस स्था ग्रेस इस्ट ले इस्ट ले मोंट ले मोंट ओलम्पे |
केस 3. नए शब्द जोड़े गए
जब नए शब्द जोड़े जाते हैं, तब भी कुछ 3-ग्राम मेल खाते हैं इसलिए परिवर्तन का पता लगाना संभव है।
बदला हुआ वाक्य: « ले मोंट ओलम्पे स्था दूर तक ला प्लस हाउते मोंटेग्ने डे ग्रेस। »
मूल 3-ग्राम | 3-ग्राम परिवर्तित पाठ |
ले मोंट ओलम्पे मोंट ओलम्पे स्था ओलम्पे इस्ट ला सबसे अधिक है ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस | ले मोंट ओलम्पे मोंट ओलम्पे स्था ओलम्पे इस्ट डे यह दूर है बहुत दूर लोन ला प्लस ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस |
केस 4. कुछ शब्द हटा दिए गए
जब शब्द हटा दिया जाता है, तब भी कुछ 3-ग्राम मेल खाते हैं, इसलिए परिवर्तन का पता लगाना संभव है।
बदला हुआ वाक्य: « एल'ओलंप एक प्लस हाउते मोंटेग्ने डे ग्रेस है। »
मूल 3-ग्राम | 3-ग्राम परिवर्तित पाठ |
ले मोंट ओलम्पे मोंट ओलम्पे स्था ओलम्पे इस्ट ला सबसे अधिक है ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस | एल'ओलम्पे इस्ट ला सबसे अधिक है ला प्लस हाउते प्लस हाउते मोंटगैन हाउते मोंटेग्ने डे मोंटेग्ने डी ग्रेस |
वास्तविक दुनिया उदाहरण
किसी वास्तविक दस्तावेज़ में सत्यापन पूरा होने पर, व्याख्या किए गए अनुभागों को अक्सर बाधित चिह्नों के माध्यम से पहचाना जाता है। बदले हुए शब्दों को दर्शाने वाले इन व्यवधानों को दृश्यता और विशिष्टता बढ़ाने के लिए हाइलाइट किया जाता है।
नीचे, आपको वास्तविक दस्तावेज़ का एक उदाहरण मिलेगा।
- पहला अंश एक फ़ाइल से आता है जिसे का उपयोग करके सत्यापित किया गया है OXSICO साहित्यिक चोरी रोकथाम सेवा:
- दूसरा अंश मूल स्रोत दस्तावेज़ से है:
गहन विश्लेषण के बाद यह स्पष्ट है कि दस्तावेज़ के चयनित भाग को निम्नलिखित परिवर्तन करके व्याख्यायित किया गया था:
मूल पाठ | संक्षिप्त पाठ | परिवर्तन |
नवाचार का समर्थन भी विशेषता है | बैक अप इनोवेशन को भी परिभाषित किया गया है | प्रतिस्थापन |
आर्थिक और सामाजिक ज्ञान, कुशल प्रणालियाँ | आर्थिक और सामाजिक जागरूकता, कुशल संगठन | प्रतिस्थापन |
प्रस्ताव (विचार) | सिफ़ारिश करना | प्रतिस्थापन, विलोपन |
नजरिए | आसन | प्रतिस्थापन |
सफलता | विजेता | प्रतिस्थापन |
प्रक्रिया (पेरेन्क, होलुब-इवान | संज्ञानात्मक प्रक्रिया (पेरेन्क, होलुब - इवान | इसके अलावा |
समर्थक नवाचार | अनुकूल | प्रतिस्थापन |
एक माहौल बनाना | : एक शर्त बनाना | प्रतिस्थापन |
अनुकूल | समृद्ध | प्रतिस्थापन |
ज्ञान का विकास करना | विकास जागरूकता | प्रतिस्थापन |
निष्कर्ष
साहित्यिक चोरी, जो व्याख्या के मामलों में अक्सर पकड़ में नहीं आती, शिक्षा जगत में एक महत्वपूर्ण चिंता बनी हुई है। तकनीकी प्रगति ने साहित्यिक चोरी जांचकर्ताओं को प्रभावी ढंग से व्याख्या की गई सामग्री की पहचान करने की क्षमता से सुसज्जित किया है। विशेष रूप से, साहित्यिक चोरी जांचकर्ता स्ट्रिंग मिलान, कोसाइन समानता और एन-ग्राम विश्लेषण जैसे विभिन्न तरीकों के माध्यम से व्याख्या का पता लगाते हैं। विशेष रूप से, एन-ग्राम विश्लेषण अपनी उच्च परिशुद्धता दर के लिए जाना जाता है। ये प्रगति साहित्यिक चोरी और व्याख्या की गई सामग्री के पकड़ में न आने की संभावना को काफी हद तक कम कर देती है, जिससे शैक्षणिक अखंडता में वृद्धि होती है। |