સાહિત્યચોરીમાં કોઈ બીજાના વિચારો, શબ્દો અથવા છબીઓ માટે ક્રેડિટ લેવાનો સમાવેશ થાય છે, જે પ્રથા ગણવામાં આવે છે અનૈતિક શૈક્ષણિક અને વ્યાવસાયિક વાતાવરણમાં. તે એવા વિદ્યાર્થીઓ દ્વારા ધ્યાન આપવામાં ન આવે કે જેઓ આકસ્મિક રીતે યોગ્ય એટ્રિબ્યુશન વિના કોઈના શબ્દોને ફરીથી લખી શકે છે. જ્યારે કોઈ વસ્તુની વ્યાખ્યા કરવામાં આવે ત્યારે અવતરણ ચિહ્નોનો ઉપયોગ થતો નથી, તેથી તે સરળતાથી પ્રૂફરીડરની પકડમાંથી છટકી શકે છે અને અંતિમ ડ્રાફ્ટમાં જઈ શકે છે. જો કે, તે સંપૂર્ણપણે અપ્રાપ્ય નથી, ખાસ કરીને કારણ કે સાહિત્યચોરી તપાસનારાઓ આજકાલ વધુ કાર્યક્ષમ રીતે પેરાફ્રેસિંગ શોધી કાઢે છે.
પેરાફ્રેસિંગ શોધવું એ એક પડકારજનક કાર્ય હોઈ શકે છે, કારણ કે તેમાં પાઠો વચ્ચે સમાનતા અને તફાવતોને ઓળખવાનો સમાવેશ થાય છે. ત્યારપછીના વિભાગોમાં, અમે પેરાફ્રેસિંગના ઉદાહરણોને સમજવા માટે ઉપયોગમાં લેવાતી સામાન્ય પદ્ધતિઓ અને તકનીકો વિશે વ્યાપક ચર્ચા કરીશું.
સાહિત્યચોરી ચેકર્સ પેરાફ્રેસિંગ કેવી રીતે શોધી શકે છે: યોગ્ય પદ્ધતિઓની શોધ કરી
આજના શૈક્ષણિક લેન્ડસ્કેપમાં, સાહિત્યચોરી તપાસનારાઓ વધુને વધુ અદ્યતન બની ગયા છે, જે ફક્ત નકલ કરેલ ટેક્સ્ટને ફ્લેગિંગથી આગળ વધીને પેરાફ્રેઝ કરેલી સામગ્રીને પણ શોધી કાઢે છે. આ લેખ એવી પદ્ધતિઓની શોધ કરે છે જે આ સાધનોને અસરકારક રીતે પેરાફ્રેસિંગને ઓળખવા માટે પરવાનગી આપે છે.
1. શબ્દમાળા મેચિંગ
આ પદ્ધતિમાં અક્ષર અથવા શબ્દ સ્તરે લખાણોની તુલના ચોક્કસ મેચોને નિર્દેશિત કરવાનો સમાવેશ થાય છે. બે ગ્રંથો વચ્ચેના અક્ષર અનુક્રમો અથવા શબ્દ પસંદગીમાં ઉચ્ચ ડિગ્રી સમાનતા પેરાફ્રેસિંગનો સંકેત આપી શકે છે. આ ટૂલ્સ જટિલ ગાણિતીક નિયમોનો ઉપયોગ કરે છે જે શબ્દોના સંદર્ભાત્મક અર્થને પણ ધ્યાનમાં લઈ શકે છે, જેનાથી ચોરીછૂપીથી લખાયેલી, પેરાફ્રેઝ કરેલી સામગ્રીને શોધી ન શકાય તેવું વધુને વધુ મુશ્કેલ બનાવે છે.
2. કોસાઇન સમાનતા
કોસાઇન સમાનતા એ પદ્ધતિઓમાંની એક છે જેના દ્વારા સાહિત્યચોરી તપાસનારાઓ પેરાફ્રેસિંગ શોધી કાઢે છે. તે ઉચ્ચ-પરિમાણીય અવકાશમાં તેમની વેક્ટર રજૂઆતો વચ્ચેના ખૂણાના આધારે બે પાઠો વચ્ચેની સમાનતાને માપે છે. ટેક્સ્ટને વર્ડ ફ્રીક્વન્સીઝ અથવા એમ્બેડિંગ્સના વેક્ટર તરીકે રજૂ કરીને, આ ટૂલ્સ પેરાફ્રેઝ કરેલી સામગ્રીને શોધવાની તેમની ક્ષમતાને વધુ શુદ્ધ કરવા માટે કોસાઇન સમાનતા સ્કોરની ગણતરી કરી શકે છે.
3. શબ્દ સંરેખણ મોડેલો
આ મોડેલો તેમના પત્રવ્યવહારને ઓળખવા માટે શબ્દો અથવા શબ્દસમૂહોને બે પાઠો વચ્ચે ગોઠવે છે. સંરેખિત સેગમેન્ટ્સની સરખામણી કરીને, તમે મેળ ખાતા સિક્વન્સમાં સમાનતા અને તફાવતોના આધારે પેરાફ્રેસિંગ શોધી શકો છો.
4. સિમેન્ટીક વિશ્લેષણ
આ અભિગમમાં ગ્રંથોમાંના શબ્દો અને શબ્દસમૂહોના અર્થ અને સંદર્ભનું વિશ્લેષણ કરવાનો સમાવેશ થાય છે. સુપ્ત સિમેન્ટીક એનાલિસિસ (LSA), વર્ડ એમ્બેડિંગ્સ (જેમ કે Word2Vec અથવા GloVe) જેવી તકનીકો અથવા BERT જેવા ડીપ લર્નિંગ મોડલ્સ શબ્દો વચ્ચેના સિમેન્ટીક સંબંધોને કેપ્ચર કરી શકે છે અને તેમની સિમેન્ટીક રજૂઆતોની સમાનતાના આધારે પેરાફ્રેસિંગને ઓળખી શકે છે.
5. મશીન લર્નિંગ
નિરીક્ષિત મશીન લર્નિંગ અલ્ગોરિધમ્સને પેરાફ્રેઝ્ડ અને નોન-પેરાફ્રેઝ્ડ જોડીના લેબલવાળા ડેટાસેટ્સ પર તાલીમ આપી શકાય છે. આ મોડેલો પેરાફ્રેઝને અલગ પાડતી પેટર્ન અને સુવિધાઓ શીખી શકે છે અને ટેક્સ્ટના નવા દાખલાઓને પેરાફ્રેઝ કે નહીં તરીકે વર્ગીકૃત કરવા માટે ઉપયોગમાં લઈ શકાય છે.
6. એન-ગ્રામ વિશ્લેષણ
એન-ગ્રામ એ શબ્દોના જૂથો છે જે એકબીજાની બરાબર બાજુમાં છે. જ્યારે તમે તપાસો કે આ જૂથો વિવિધ ગ્રંથોમાં કેટલી વાર દેખાય છે અને તેમની તુલના કરો છો, ત્યારે તમે સમાન શબ્દસમૂહો અથવા ક્રમ શોધી શકો છો. જો ત્યાં ઘણી સમાન પેટર્ન હોય, તો તેનો અર્થ એ થઈ શકે છે કે લખાણનો પરાક્રમ કરવામાં આવ્યો હશે.
7. ડુપ્લિકેટ શોધની નજીક
છેલ્લી રીત કે જે સાહિત્યચોરી ચેકર્સ અસરકારક રીતે પેરાફ્રેસિંગને શોધી કાઢે છે.
નજીકના-ડુપ્લિકેટ ડિટેક્શન એલ્ગોરિધમ્સ વારંવાર ટેક્સ્ટ સેગમેન્ટ્સને નિર્દેશિત કરવા માટે પેરાફ્રેસિંગ ડિટેક્શનમાં નિયુક્ત કરવામાં આવે છે જે ઉચ્ચ ડિગ્રી સમાનતા દર્શાવે છે અથવા લગભગ સમાન છે. આ ગાણિતીક નિયમો ખાસ કરીને વિગતવાર સ્તર પર ટેક્સ્ટની સમાનતાની સરખામણી દ્વારા પેરાફ્રેઝ કરેલી સામગ્રીને ઓળખવા માટે બનાવવામાં આવ્યા છે.
સાહિત્યચોરી નિવારણ સોફ્ટવેર દ્વારા સામાન્ય રીતે કઈ પદ્ધતિનો ઉપયોગ કરવામાં આવે છે?
વ્યાવસાયિક સાહિત્યચોરી નિવારણ સેવાઓ દ્વારા ઉપયોગમાં લેવાતા તકનીકી ઉકેલો સામાન્ય રીતે n-ગ્રામ વિશ્લેષણ પર આધાર રાખે છે. n-ગ્રામ-આધારિત તકનીકનો લાભ લઈને, આ સેવાઓ નોંધપાત્ર રીતે ઉચ્ચ ચોકસાઇ દર હાંસલ કરે છે. સાહિત્યચોરી તપાસનારાઓ પેરાફ્રેસિંગને શોધી કાઢવાની આ એક શ્રેષ્ઠ રીત છે, જે ફરીથી લખવામાં આવેલા ચોક્કસ શબ્દોની ઓળખ અને હાઇલાઇટિંગને સક્ષમ કરે છે.
સાહિત્યચોરી ચેકર્સ પેરાફ્રેસિંગને કેવી રીતે શોધી કાઢે છે તેનું મિકેનિક્સ
સાહિત્યચોરી નિવારણ સેવાઓ સામાન્ય રીતે દસ્તાવેજોની તુલના કરવા માટે ફિંગરપ્રિન્ટિંગ તકનીકનો ઉપયોગ કરે છે. આમાં ચકાસવા માટેના દસ્તાવેજોમાંથી જરૂરી n-ગ્રામ કાઢવાનો અને તેમના ડેટાબેઝમાંના તમામ દસ્તાવેજોના n-ગ્રામ સાથે સરખામણી કરવાનો સમાવેશ થાય છે.
ઉદાહરણ
ચાલો કહીએ કે એક વાક્ય છે: « Le mont Olympe est la plus haute montagne de Grèce. »
આ n-ગ્રામ (ઉદાહરણ તરીકે 3-ગ્રામ) આ વાક્ય હશે:
- લે મોન્ટ ઓલિમ્પ
- મોન્ટ ઓલિમ્પ એસ્ટ
- ઓલિમ્પ એસ્ટ લા
- સૌથી વધુ છે
- la plus haute
- વત્તા હૌટ મોન્ટાગ્ને
- હૌટ મોન્ટાગ્ને દ
- મોન્ટાગ્ને ડી ગ્રેસ
કેસ 1. રિપ્લેસમેન્ટ
જો શબ્દ અન્ય શબ્દ દ્વારા બદલવામાં આવે છે, હજુ પણ કેટલાક n-ગ્રામ મેળ ખાય છે અને વધુ વિશ્લેષણ દ્વારા શબ્દ રિપ્લેસમેન્ટ શોધવાનું શક્ય છે.
વાક્ય બદલ્યું: "ધ પર્વત ઓલિમ્પ એસ્ટ લા વત્તા હૌટ મોન્ટાગ્ને દ પેલોપોનેસ. »
મૂળ 3-ગ્રામ | 3-ગ્રામ બદલાયેલ ટેક્સ્ટ |
લે મોન્ટ ઓલિમ્પ મોન્ટ ઓલિમ્પ એસ્ટ ઓલિમ્પ એસ્ટ લા સૌથી વધુ છે la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ | Le પર્વત ઓલિમ્પસ પર્વત ઓલિમ્પ એસ્ટ ઓલિમ્પ એસ્ટ લા સૌથી વધુ છે la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને દ પેલોપોનેસ |
કેસ 2. શબ્દોનો ક્રમ બદલ્યો (અથવા વાક્યો, ફકરા)
જ્યારે વાક્યનો ક્રમ બદલાય છે, ત્યારે હજુ પણ કેટલાક 3-ગ્રામ મેળ ખાય છે જેથી ફેરફારને શોધી શકાય.
વાક્ય બદલ્યું: « લા પ્લસ હૌટ મોન્ટાગ્ને ડી ગ્રેસ એસ્ટ લે મોન્ટ ઓલિમ્પ. »
મૂળ 3-ગ્રામ | 3-ગ્રામ બદલાયેલ ટેક્સ્ટ |
લે મોન્ટ ઓલિમ્પ મોન્ટ ઓલિમ્પ એસ્ટ ઓલિમ્પ એસ્ટ લા સૌથી વધુ છે la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ | લા વત્તા હૌટે વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ ડી ગ્રેસ એસ્ટ ગ્રેસ એસ્ટ લે એસ્ટ લે મોન્ટ લે મોન્ટ ઓલિમ્પ |
કેસ 3. નવા શબ્દો ઉમેર્યા
જ્યારે નવા શબ્દો ઉમેરવામાં આવે છે, ત્યારે હજુ પણ કેટલાક 3-ગ્રામ છે જે મેળ ખાય છે જેથી ફેરફારને શોધી શકાય છે.
વાક્ય બદલ્યું: « લે મોન્ટ ઓલિમ્પ એસ્ટ ડી કમર લા વત્તા હૌટ મોન્ટાગ્ને ડી ગ્રેસ. »
મૂળ 3-ગ્રામ | 3-ગ્રામ બદલાયેલ ટેક્સ્ટ |
લે મોન્ટ ઓલિમ્પ મોન્ટ ઓલિમ્પ એસ્ટ ઓલિમ્પ એસ્ટ લા સૌથી વધુ છે la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ | લે મોન્ટ ઓલિમ્પ મોન્ટ ઓલિમ્પ એસ્ટ ઓલિમ્પ એસ્ટ ડી એસ્ટ ડી કમર દૂર કમર લા પ્લસ la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ |
કેસ 4. કેટલાક શબ્દો કાઢી નાખ્યા
જ્યારે શબ્દ દૂર કરવામાં આવે છે, ત્યાં હજુ પણ કેટલાક 3-ગ્રામ છે જે મેળ ખાય છે જેથી ફેરફારને શોધી શકાય છે.
વાક્ય બદલ્યું: « L'Olympe est la plus haute montagne de Grèce. »
મૂળ 3-ગ્રામ | 3-ગ્રામ બદલાયેલ ટેક્સ્ટ |
લે મોન્ટ ઓલિમ્પ મોન્ટ ઓલિમ્પ એસ્ટ ઓલિમ્પ એસ્ટ લા સૌથી વધુ છે la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ | L'Olympe est la સૌથી વધુ છે la plus haute વત્તા હૌટ મોન્ટાગ્ને હૌટ મોન્ટાગ્ને દ મોન્ટાગ્ને ડી ગ્રેસ |
વાસ્તવિક દુનિયાનું ઉદાહરણ
વાસ્તવિક દસ્તાવેજમાં ચકાસણી પૂર્ણ થયા પછી, વિક્ષેપિત ચિહ્નો દ્વારા વારંવાર પેરાફ્રેઝ કરેલ વિભાગોને ઓળખવામાં આવે છે. આ વિક્ષેપો, બદલાયેલા શબ્દોને દર્શાવતા, દૃશ્યતા અને તફાવતને વધારવા માટે પ્રકાશિત કરવામાં આવે છે.
નીચે, તમને વાસ્તવિક દસ્તાવેજનું ઉદાહરણ મળશે.
- પ્રથમ અવતરણ એ ફાઇલમાંથી આવે છે જે ની મદદથી ચકાસવામાં આવી છે ઓક્સીકો સાહિત્યચોરી નિવારણ સેવા:
- બીજો અવતરણ મૂળ સ્રોત દસ્તાવેજમાંથી છે:
ઊંડા વિશ્લેષણ પછી તે સ્પષ્ટ થાય છે કે દસ્તાવેજના પસંદ કરેલા ભાગને નીચેના ફેરફારો કરીને સમજાવવામાં આવ્યો હતો:
મૂળ લખાણ | પેરાફ્રેઝ કરેલ ટેક્સ્ટ | ફેરફારો |
નવીનતાને ટેકો આપે છે પણ લાક્ષણિકતા છે | બેકઅપ નવીનતા વ્યાખ્યાયિત ઉપરાંત છે | પુરવણી |
આર્થિક અને સામાજિક જ્ઞાન, કાર્યક્ષમ સિસ્ટમો | આર્થિક અને સામાજિક જાગૃતિ, કાર્યક્ષમ સંસ્થા | પુરવણી |
દરખાસ્તો (વિચારો) | ભલામણ | બદલી, કાઢી નાખવું |
વલણ | પોશ્ચર | પુરવણી |
સફળતા | વિજેતા | પુરવણી |
પ્રક્રિયા (Perenc, Holub-Ivan | જ્ઞાનાત્મક પ્રક્રિયા (Perenc, Holub - Ivan | વધુમાં |
નવીનતા તરફી | અનુકૂળ | પુરવણી |
વાતાવરણ બનાવવું | : શરત બનાવવી | પુરવણી |
અનુકૂળ | સમૃધ્ધ | પુરવણી |
જ્ઞાનનો વિકાસ | વિકાસ જાગૃતિ | પુરવણી |
ઉપસંહાર
સાહિત્યચોરી, જે અવારનવાર પેરાફ્રેસિંગના કેસોમાં શોધી શકાતી નથી, તે એકેડેમીયામાં નોંધપાત્ર ચિંતાનો વિષય છે. ટેક્નોલોજીકલ એડવાન્સિસે સાહિત્યચોરી તપાસનારાઓને અસરકારક રીતે વ્યાખ્યાયિત સામગ્રીને ઓળખવાની ક્ષમતા સાથે સજ્જ કર્યા છે. ખાસ કરીને, સાહિત્યચોરી તપાસનારાઓ સ્ટ્રિંગ મેચિંગ, કોસાઇન સમાનતા અને એન-ગ્રામ વિશ્લેષણ જેવી વિવિધ પદ્ધતિઓ દ્વારા પેરાફ્રેસિંગ શોધી કાઢે છે. નોંધનીય રીતે, n-ગ્રામ વિશ્લેષણ તેના ઉચ્ચ ચોકસાઇ દર માટે અલગ પડે છે. આ એડવાન્સમેન્ટ્સ ચોરીછૂપીથી લખાયેલી અને પરાક્રમિત સામગ્રીની શોધ ન થાય તેવી શક્યતાને નોંધપાત્ર રીતે ઘટાડે છે, જેનાથી શૈક્ષણિક અખંડિતતા વધે છે. |