साहित्यिक चोरीमा अरू कसैको विचार, शब्द वा छविहरूको श्रेय लिनु समावेश छ, जुन अभ्यास मानिन्छ अनैतिक शैक्षिक र व्यावसायिक वातावरणमा। यो विद्यार्थीहरू द्वारा अनपेक्षित हुन सक्छ जसले गलतीले उचित एट्रिब्युशन बिना कसैको शब्दहरू दोहोर्याउन सक्छ। कुनै कुरालाई व्याख्या गर्दा उद्धरण चिन्हहरू प्रयोग नगरिएको हुनाले, यो सजिलैसँग प्रूफरीडरको पकडबाट उम्कन र अन्तिम मस्यौदामा जान सक्छ। यद्यपि, यो पूर्णतया अप्राप्य छैन, विशेष गरी जब साहित्यिक चोरी जाँचकर्ताहरूले आजकल अधिक कुशलतापूर्वक paraphrasing पत्ता लगाउँछन्।
paraphrasing पत्ता लगाउन एक चुनौतीपूर्ण कार्य हुन सक्छ, किनकि यसले पाठहरू बीच समानता र भिन्नताहरू पहिचान गर्न समावेश गर्दछ। यसपछिका खण्डहरूमा, हामी paraphrasing को उदाहरणहरू बुझ्न प्रयोग गरिने सामान्य विधिहरू र प्रविधिहरूको बारेमा विस्तृत छलफल गर्नेछौं।
साहित्यिक चोरी जाँचकर्ताहरूले पाराफ्रेजिङ कसरी पत्ता लगाउँछन्: उपयुक्त विधिहरू अन्वेषण गरियो
आजको शैक्षिक परिदृश्यमा, साहित्यिक चोरी जाँचकर्ताहरू बढ्दो रूपमा उन्नत भएका छन्, प्रतिलिपि गरिएको पाठलाई फ्ल्याग गर्नेभन्दा बाहिर गएर व्याख्या गरिएको सामग्री पत्ता लगाउन पनि। यस लेखले यी उपकरणहरूलाई प्रभावकारी रूपमा paraphrasing पहिचान गर्न अनुमति दिने विधिहरू अन्वेषण गर्दछ।
1. स्ट्रिङ मिलान
यो विधिले अक्षर वा शब्द स्तरमा पाठहरूलाई सही मिल्दो इंगित गर्नको लागि तुलना गर्ने समावेश गर्दछ। क्यारेक्टर अनुक्रम वा दुई पाठहरू बीच शब्द छनोटहरूमा समानताको उच्च डिग्रीले paraphrasing संकेत गर्न सक्छ। यी उपकरणहरूले जटिल एल्गोरिदमहरू प्रयोग गर्छन् जसले शब्दहरूको प्रासंगिक अर्थलाई पनि विचार गर्न सक्छ, यसले चोरीकृत, पाराफ्रेज गरिएको सामग्रीलाई पत्ता लगाउन गाह्रो बनाउँछ।
2. कोसाइन समानता
कोसाइन समानता एक तरिका हो जसद्वारा साहित्यिक चोरी जाँचकर्ताहरूले paraphrasing पत्ता लगाउँछन्। यसले उच्च-आयामी स्पेसमा तिनीहरूको भेक्टर प्रतिनिधित्वहरू बीचको कोणमा आधारित दुई पाठहरू बीचको समानता मापन गर्दछ। शब्द फ्रिक्वेन्सी वा इम्बेडिङहरूको भेक्टरको रूपमा पाठहरूलाई प्रतिनिधित्व गरेर, यी उपकरणहरूले paraphrased सामग्री पत्ता लगाउन तिनीहरूको क्षमता थप परिष्कृत गर्न कोसाइन समानता स्कोर गणना गर्न सक्छन्।
3. शब्द पङ्क्तिबद्ध मोडेलहरू
यी मोडेलहरूले शब्दहरू वा वाक्यांशहरूलाई तिनीहरूको पत्राचार पहिचान गर्न दुई पाठहरू बीच पङ्क्तिबद्ध गर्दछ। पङ्क्तिबद्ध खण्डहरू तुलना गरेर, तपाईंले मिल्दो अनुक्रमहरूमा समानता र भिन्नताहरूमा आधारित paraphrasing पत्ता लगाउन सक्नुहुन्छ।
4. सिमान्टिक विश्लेषण
यस दृष्टिकोणले पदहरूमा शब्दहरू र वाक्यांशहरूको अर्थ र सन्दर्भको विश्लेषण समावेश गर्दछ। लेटेन्ट सिमेन्टिक एनालिसिस (LSA), शब्द इम्बेडिङहरू (जस्तै Word2Vec वा GloVe) जस्ता प्रविधिहरू, वा BERT जस्ता गहिरो सिकाइ मोडेलहरूले शब्दहरू बीचको सिमान्टिक सम्बन्धहरू खिच्न सक्छन् र तिनीहरूको सिमान्टिक प्रतिनिधित्वहरूको समानताको आधारमा पाराफ्रेजिङ पहिचान गर्न सक्छन्।
5। मिसिन शिक्षा
पर्यवेक्षित मेशिन लर्निङ एल्गोरिदमहरू पाठहरूको paraphrased र गैर-paraphrased जोडीहरूको लेबल गरिएको डेटासेटहरूमा प्रशिक्षित गर्न सकिन्छ। यी मोडेलहरूले ढाँचाहरू र विशेषताहरू सिक्न सक्छन् जुन प्याराफ्रेजहरू छुट्याउन सक्छ र पाठको नयाँ उदाहरणहरूलाई paraphrased वा होइन भनेर वर्गीकरण गर्न प्रयोग गर्न सकिन्छ।
6. एन-ग्राम विश्लेषण
N-gram शब्दहरूको समूह हो जुन एकअर्काको छेउमा छन्। जब तपाइँ यी समूहहरू विभिन्न पाठहरूमा कति पटक देखा पर्दछ जाँच गर्नुहुन्छ र तिनीहरूलाई तुलना गर्नुहुन्छ, तपाइँ समान वाक्यांश वा अनुक्रमहरू फेला पार्न सक्नुहुन्छ। यदि त्यहाँ धेरै समान ढाँचाहरू छन् भने, यसको मतलब यो हुन सक्छ कि पाठलाई व्याख्या गरिएको हुन सक्छ।
7. नक्कल पत्ता लगाउने नजिक
साहित्यिक चोरी जाँचकर्ताहरूले प्रभावकारी रूपमा प्याराफ्रेजिङ पत्ता लगाउने अन्तिम तरिका।
नजिकको-डुप्लिकेट पत्ता लगाउने एल्गोरिदमहरू प्राय: समानताको उच्च डिग्री प्रदर्शन गर्ने वा लगभग उस्तै हुने पाठ खण्डहरूलाई पिनपोइन्ट गर्न paraphrasing पत्ता लगाउन प्रयोग गरिन्छ। यी एल्गोरिदमहरू विशेष रूपमा विस्तृत स्तरमा पाठ समानताको तुलना मार्फत paraphrased सामग्री पहिचान गर्न बनाइएका छन्।
साहित्यिक चोरी रोकथाम सफ्टवेयर द्वारा सामान्यतया कुन विधि प्रयोग गरिन्छ?
व्यावसायिक साहित्यिक चोरी रोकथाम सेवाहरू द्वारा प्रयोग गरिएका प्राविधिक समाधानहरू सामान्यतया एन-ग्राम विश्लेषणमा निर्भर हुन्छन्। एन-ग्राम-आधारित टेक्नोलोजीको लाभ उठाएर, यी सेवाहरूले उल्लेखनीय रूपमा उच्च परिशुद्धता दर प्राप्त गर्छन्। यो साहित्यिक चोरी जाँचकर्ताहरूले पुन: लेखिएका सही शब्दहरूको पहिचान र हाइलाइटिङ सक्षम पार्दै paraphrasing पत्ता लगाउने उत्तम तरिकाहरू मध्ये एक हो।
साहित्यिक चोरी जाँचकर्ताहरूले पाराफ्रेजिङ पत्ता लगाउने तरिकाको मेकानिक्स
साहित्यिक चोरी रोकथाम सेवाहरूले सामान्यतया कागजातहरू तुलना गर्न फिंगरप्रिन्टिङ प्रविधि प्रयोग गर्छन्। यसमा प्रमाणीकरण गर्नका लागि कागजातहरूबाट आवश्यक एन-ग्रामहरू निकाल्ने र तिनीहरूको डाटाबेसमा रहेका सबै कागजातहरूको एन-ग्रामहरूसँग तुलना गर्ने समावेश छ।
उदाहरणका
मानौं त्यहाँ एउटा वाक्य छ: « Le mont Olympe est la plus haute montagne de Grèce। »
यो n-ग्राम (उदाहरणका लागि 3 ग्राम) यस वाक्यको हुनेछ:
- ले मोन्ट ओलम्पे
- mont Olympe est
- Olympe est la
- सबैभन्दा बढी हो
- ला प्लस हाउटे
- प्लस हाउटे मोन्टाग्ने
- haute montagne de
- montagne de Grèce
केस १. प्रतिस्थापन
यदि शब्दलाई अन्य शब्दले प्रतिस्थापन गरेको छ भने, अझै पनि केही n-ग्राम मेल खान्छ र थप विश्लेषण गरेर शब्द प्रतिस्थापन पत्ता लगाउन सम्भव छ।
वाक्य परिवर्तन: "The पर्वत Olympe est la plus haute montagne de Péloponnèse। »
मूल 3 ग्राम | 3-ग्राम परिवर्तन गरिएको पाठ |
ले मोन्ट ओलम्पे mont Olympe est Olympe est la सबैभन्दा बढी हो ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce | Le पर्वत Olympus पर्वत ओलम्प इस्ट Olympe est la सबैभन्दा बढी हो ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de Montagne de Péloponnèse |
केस 2. शब्दहरूको क्रम परिवर्तन गरियो (वा वाक्यहरू, अनुच्छेदहरू)
जब वाक्यको क्रम परिवर्तन हुन्छ, अझै पनि केहि 3-ग्राम मिल्छ त्यसैले यो परिवर्तन पत्ता लगाउन सम्भव छ।
वाक्य परिवर्तन: « La plus haute montagne de Grèce est Le mont Olympe। »
मूल 3 ग्राम | 3-ग्राम परिवर्तन गरिएको पाठ |
ले मोन्ट ओलम्पे mont Olympe est Olympe est la सबैभन्दा बढी हो ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce | ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont ले मोन्ट ओलम्पे |
केस ३. नयाँ शब्दहरू थपियो
जब नयाँ शब्दहरू थपिन्छन्, त्यहाँ अझै पनि केही 3-ग्रामहरू छन् जुन मेल खान्छ त्यसैले यो परिवर्तन पत्ता लगाउन सम्भव छ।
वाक्य परिवर्तन: « Le mont Olympe est कमर la plus haute montagne de Grèce। »
मूल 3 ग्राम | 3-ग्राम परिवर्तन गरिएको पाठ |
ले मोन्ट ओलम्पे mont Olympe est Olympe est la सबैभन्दा बढी हो ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce | ले मोन्ट ओलम्पे mont Olympe est Olympe est de est de lain धेरै टाढा कमर ला प्लस ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce |
केस 4. केही शब्दहरू मेटाइयो
जब शब्द हटाइन्छ, त्यहाँ अझै पनि केहि 3-ग्रामहरू छन् जुन मेल खान्छ त्यसैले यो परिवर्तन पत्ता लगाउन सम्भव छ।
वाक्य परिवर्तन: « L'Olympe est la plus haute montagne de Grèce हो। »
मूल 3 ग्राम | 3-ग्राम परिवर्तन गरिएको पाठ |
ले मोन्ट ओलम्पे mont Olympe est Olympe est la सबैभन्दा बढी हो ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce | L'Olympe est la सबैभन्दा बढी हो ला प्लस हाउटे प्लस हाउटे मोन्टाग्ने haute montagne de montagne de Grèce |
वास्तविक विश्व उदाहरण
वास्तविक कागजातमा प्रमाणिकरण पूरा भएपछि, पाराफ्रेज गरिएका खण्डहरू प्रायः अवरोधित चिन्हहरू मार्फत पहिचान गरिन्छ। यी अवरोधहरू, परिवर्तन गरिएका शब्दहरूलाई सङ्केत गर्दै, दृश्यता र भिन्नता बढाउन हाइलाइट गरिएका छन्।
तल, तपाईंले वास्तविक कागजातको उदाहरण पाउनुहुनेछ।
- पहिलो अंश एउटा फाइलबाट आउँछ जुन प्रयोग गरेर प्रमाणित गरिएको छ OXSICO साहित्यिक चोरी रोकथाम सेवा:
- दोस्रो अंश मूल स्रोत कागजातबाट हो:
गहिरो विश्लेषण पछि यो स्पष्ट हुन्छ कि कागजातको चयन गरिएको भाग निम्न परिवर्तनहरू गरेर व्याख्या गरिएको थियो:
मूल पाठ | व्याख्या गरिएको पाठ | परिवर्तन |
समर्थन नवीनता पनि विशेषता छ | ब्याक अप नवीनता परिभाषित बाहेक छ | प्रतिस्थापन |
आर्थिक र सामाजिक ज्ञान, कुशल प्रणाली | आर्थिक र सामाजिक जागरूकता, कुशल संगठन | प्रतिस्थापन |
प्रस्ताव (विचार) | सिफारिस | प्रतिस्थापन, मेटाउने |
आचरण | पोषण | प्रतिस्थापन |
सफलता | विजेता | प्रतिस्थापन |
प्रक्रिया (Perenc, Holub-Ivan | संज्ञानात्मक प्रक्रिया (Perenc, Holub - Ivan | थप |
नवीनता समर्थक | अनुकूल | प्रतिस्थापन |
एक वातावरण सिर्जना | : अवस्था सिर्जना गर्दै | प्रतिस्थापन |
अनुकूल | समृद्ध | प्रतिस्थापन |
ज्ञान विकास गर्दै | विकास जागरूकता | प्रतिस्थापन |
निष्कर्ष
साहित्यिक चोरी, प्रायः पैराफ्रेजिङका मामिलामा पत्ता नलागेको, शैक्षिक क्षेत्रमा एक महत्त्वपूर्ण चिन्ताको रूपमा रहेको छ। प्राविधिक प्रगतिहरूले साहित्यिक चोरी जाँचकर्ताहरूलाई प्रभावकारी रूपमा व्याख्या गरिएको सामग्री पहिचान गर्ने क्षमताको साथ सुसज्जित गरेको छ। विशेष रूपमा, साहित्यिक चोरी जाँचकर्ताहरूले विभिन्न विधिहरू जस्तै स्ट्रिङ मिलान, कोसाइन समानता, र एन-ग्राम विश्लेषणहरू मार्फत व्याख्या पत्ता लगाउँछन्। उल्लेखनीय रूपमा, एन-ग्राम विश्लेषण यसको उच्च परिशुद्धता दरको लागि बाहिर खडा छ। यी प्रगतिहरूले पर्याप्त रूपमा चोरी र व्याख्या गरिएको सामग्री पत्ता नलाग्ने सम्भावनालाई कम गर्छ, जसले गर्दा शैक्षिक अखण्डता बढ्छ। |