മറ്റൊരാളുടെ ആശയങ്ങൾ, വാക്കുകൾ അല്ലെങ്കിൽ ഇമേജുകൾ എന്നിവയുടെ ക്രെഡിറ്റ് എടുക്കുന്നത് കോപ്പിയടിയിൽ ഉൾപ്പെടുന്നു, പരിഗണിക്കപ്പെടുന്ന ഒരു സമ്പ്രദായം അനീതി അക്കാദമിക്, പ്രൊഫഷണൽ പരിതസ്ഥിതികളിൽ. ശരിയായ ആട്രിബ്യൂഷനില്ലാതെ മറ്റൊരാളുടെ വാക്കുകൾ അബദ്ധത്തിൽ പുനർനിർമ്മിച്ചേക്കാവുന്ന വിദ്യാർത്ഥികൾക്ക് ഇത് ശ്രദ്ധിക്കപ്പെടാതെ പോകാം. എന്തെങ്കിലും പാരഫ്രേസ് ചെയ്യുമ്പോൾ ഉദ്ധരണി ചിഹ്നങ്ങൾ ഉപയോഗിക്കാത്തതിനാൽ, അത് ഒരു പ്രൂഫ് റീഡറുടെ പിടിയിൽ നിന്ന് എളുപ്പത്തിൽ രക്ഷപ്പെടാനും അന്തിമ ഡ്രാഫ്റ്റിലേക്ക് പോകാനും കഴിയും. എന്നിരുന്നാലും, ഇത് പൂർണ്ണമായും അസാധ്യമല്ല, പ്രത്യേകിച്ചും കോപ്പിയടി പരിശോധിക്കുന്നവർ പാരാഫ്രേസിംഗ് കൂടുതൽ കാര്യക്ഷമമായി കണ്ടെത്തുന്നതിനാൽ.
വാചകങ്ങൾ തമ്മിലുള്ള സമാനതകളും വ്യത്യാസങ്ങളും തിരിച്ചറിയുന്നത് ഉൾപ്പെടുന്നതിനാൽ പാരാഫ്രേസിംഗ് കണ്ടെത്തുന്നത് ഒരു വെല്ലുവിളി നിറഞ്ഞ ജോലിയാണ്. തുടർന്നുള്ള വിഭാഗങ്ങളിൽ, പാരാഫ്രേസിംഗിന്റെ ഉദാഹരണങ്ങൾ തിരിച്ചറിയാൻ ഉപയോഗിക്കുന്ന പൊതുവായ രീതികളെയും സാങ്കേതികതകളെയും കുറിച്ചുള്ള സമഗ്രമായ ചർച്ചയിലേക്ക് ഞങ്ങൾ കടക്കും.
കോപ്പിയടി പരിശോധിക്കുന്നവർ എങ്ങനെയാണ് പാരാഫ്രേസിംഗ് കണ്ടെത്തുന്നത്: അനുയോജ്യമായ രീതികൾ പര്യവേക്ഷണം ചെയ്തു
ഇന്നത്തെ വിദ്യാഭ്യാസ ഭൂപ്രകൃതിയിൽ, കോപ്പിയടി പരിശോധിക്കുന്നവർ, പകർത്തിയ വാചകം ഫ്ലാഗുചെയ്യുക എന്നതിനപ്പുറം പാരാഫ്രേസ് ചെയ്ത ഉള്ളടക്കം കണ്ടെത്തുന്നതിലേക്ക് പോകുന്നു. പാരാഫ്രേസിംഗ് ഫലപ്രദമായി തിരിച്ചറിയാൻ ഈ ഉപകരണങ്ങളെ അനുവദിക്കുന്ന രീതികൾ ഈ ലേഖനം പര്യവേക്ഷണം ചെയ്യുന്നു.
1. സ്ട്രിംഗ് പൊരുത്തപ്പെടുത്തൽ
കൃത്യമായ പൊരുത്തങ്ങൾ ചൂണ്ടിക്കാണിക്കാൻ അക്ഷര തലത്തിലോ പദ തലത്തിലോ വാചകങ്ങൾ താരതമ്യം ചെയ്യുന്നത് ഈ രീതിയിൽ ഉൾപ്പെടുന്നു. രണ്ട് ടെക്സ്റ്റുകൾക്കിടയിലുള്ള പ്രതീക സീക്വൻസുകളിലോ വാക്ക് ചോയ്സുകളിലോ ഉയർന്ന അളവിലുള്ള സാമ്യം പാരാഫ്രേസിംഗിനെ സൂചിപ്പിക്കാം. ഈ ഉപകരണങ്ങൾ സങ്കീർണ്ണമായ അൽഗോരിതങ്ങൾ ഉപയോഗിക്കുന്നു, അത് വാക്കുകളുടെ സന്ദർഭോചിതമായ അർത്ഥം പോലും പരിഗണിക്കുന്നു, ഇത് കോപ്പിയടിച്ചതും പാരാഫ്രേസ് ചെയ്തതുമായ മെറ്റീരിയലുകൾ കണ്ടെത്താതിരിക്കുന്നത് കൂടുതൽ ബുദ്ധിമുട്ടാക്കുന്നു.
2. കോസൈൻ സമാനത
കോസൈൻ സാമ്യതയാണ് കോപ്പിയറിസം ചെക്കർമാർ പാരാഫ്രേസിംഗ് കണ്ടെത്തുന്ന രീതികളിലൊന്ന്. ഉയർന്ന അളവിലുള്ള സ്ഥലത്ത് അവയുടെ വെക്റ്റർ പ്രതിനിധാനങ്ങൾ തമ്മിലുള്ള കോണിനെ അടിസ്ഥാനമാക്കി രണ്ട് പാഠങ്ങൾ തമ്മിലുള്ള സമാനത ഇത് അളക്കുന്നു. പദങ്ങളുടെ ആവൃത്തികളുടെയോ ഉൾച്ചേർക്കലുകളുടെയോ വെക്റ്ററുകളായി ടെക്സ്റ്റുകളെ പ്രതിനിധീകരിക്കുന്നതിലൂടെ, പാരാഫ്രേസ് ചെയ്ത ഉള്ളടക്കം കണ്ടെത്താനുള്ള അവയുടെ കഴിവ് കൂടുതൽ പരിഷ്കരിക്കുന്നതിന് ഈ ഉപകരണങ്ങൾക്ക് കോസൈൻ സാമ്യത സ്കോർ കണക്കാക്കാനാകും.
3. വേഡ് അലൈൻമെന്റ് മോഡലുകൾ
ഈ മോഡലുകൾ രണ്ട് പാഠങ്ങൾക്കിടയിൽ പദങ്ങളോ ശൈലികളോ അവയുടെ കത്തിടപാടുകൾ തിരിച്ചറിയാൻ വിന്യസിക്കുന്നു. വിന്യസിച്ച സെഗ്മെന്റുകൾ താരതമ്യം ചെയ്യുന്നതിലൂടെ, പൊരുത്തപ്പെടുന്ന ശ്രേണികളിലെ സമാനതകളും വ്യത്യാസങ്ങളും അടിസ്ഥാനമാക്കി നിങ്ങൾക്ക് പാരാഫ്രേസിംഗ് കണ്ടെത്താനാകും.
4. സെമാന്റിക് വിശകലനം
ടെക്സ്റ്റുകളിലെ വാക്കുകളുടെയും വാക്യങ്ങളുടെയും അർത്ഥവും സന്ദർഭവും വിശകലനം ചെയ്യുന്നതാണ് ഈ സമീപനം. ലാറ്റന്റ് സെമാന്റിക് അനാലിസിസ് (LSA), വേഡ് എംബെഡിംഗുകൾ (Word2Vec അല്ലെങ്കിൽ GloVe പോലുള്ളവ), അല്ലെങ്കിൽ BERT പോലുള്ള ആഴത്തിലുള്ള പഠന മാതൃകകൾ പോലെയുള്ള സാങ്കേതിക വിദ്യകൾക്ക് വാക്കുകൾ തമ്മിലുള്ള സെമാന്റിക് ബന്ധങ്ങൾ ക്യാപ്ചർ ചെയ്യാനും അവയുടെ സെമാന്റിക് പ്രാതിനിധ്യങ്ങളുടെ സമാനതയെ അടിസ്ഥാനമാക്കി പാരാഫ്രേസിംഗ് തിരിച്ചറിയാനും കഴിയും.
5. മെഷീൻ ലേണിംഗ്
മേൽനോട്ടത്തിലുള്ള മെഷീൻ ലേണിംഗ് അൽഗോരിതങ്ങൾ പാരാഫ്രേസ് ചെയ്തതും അല്ലാത്തതുമായ ജോഡി ടെക്സ്റ്റുകളുടെ ലേബൽ ചെയ്ത ഡാറ്റാസെറ്റുകളിൽ പരിശീലിപ്പിക്കാൻ കഴിയും. ഈ മോഡലുകൾക്ക് പാരാഫ്രെയ്സുകളെ വേർതിരിക്കുന്ന പാറ്റേണുകളും സവിശേഷതകളും പഠിക്കാൻ കഴിയും, കൂടാതെ ടെക്സ്റ്റിന്റെ പുതിയ സന്ദർഭങ്ങളെ പാരാഫ്രേസ് ചെയ്തതോ അല്ലാത്തതോ ആയി തരംതിരിക്കാൻ ഉപയോഗിക്കാം.
6. എൻ-ഗ്രാം വിശകലനം
N-grams എന്നത് പരസ്പരം അടുത്തിരിക്കുന്ന പദങ്ങളുടെ കൂട്ടമാണ്. ഈ ഗ്രൂപ്പുകൾ വ്യത്യസ്ത ഗ്രന്ഥങ്ങളിൽ എത്ര തവണ പ്രത്യക്ഷപ്പെടുന്നുവെന്ന് പരിശോധിച്ച് അവ താരതമ്യം ചെയ്യുമ്പോൾ, സമാന ശൈലികളോ സീക്വൻസുകളോ നിങ്ങൾക്ക് കണ്ടെത്താനാകും. സമാനമായ നിരവധി പാറ്റേണുകൾ ഉണ്ടെങ്കിൽ, വാചകം പാരാഫ്രേസ് ചെയ്തിരിക്കാം എന്നാണ് ഇതിനർത്ഥം.
7. ഡ്യൂപ്ലിക്കേറ്റ് കണ്ടെത്തലിന് സമീപം
കോപ്പിയടി പരിശോധിക്കുന്നവർ പാരാഫ്രേസിംഗ് ഫലപ്രദമായി കണ്ടെത്തുന്ന അവസാന മാർഗം.
ഉയർന്ന അളവിലുള്ള സാമ്യത കാണിക്കുന്ന അല്ലെങ്കിൽ ഏതാണ്ട് സമാനമായ ടെക്സ്റ്റ് സെഗ്മെന്റുകൾ കൃത്യമായി കണ്ടെത്തുന്നതിന് പാരാഫ്രേസിംഗ് കണ്ടെത്തലിൽ നിയർ-ഡ്യൂപ്ലിക്കേറ്റ് ഡിറ്റക്ഷൻ അൽഗോരിതങ്ങൾ പതിവായി ഉപയോഗിക്കുന്നു. ഈ അൽഗോരിതങ്ങൾ വിശദമായ തലത്തിൽ വാചക സാമ്യം താരതമ്യം ചെയ്യുന്നതിലൂടെ പാരാഫ്രേസ് ചെയ്ത ഉള്ളടക്കം തിരിച്ചറിയാൻ പ്രത്യേകം തയ്യാറാക്കിയതാണ്.
മോഷണം തടയുന്നതിനുള്ള സോഫ്റ്റ്വെയർ സാധാരണയായി ഉപയോഗിക്കുന്ന രീതി ഏതാണ്?
പ്രൊഫഷണൽ കോപ്പിയടി തടയൽ സേവനങ്ങൾ ഉപയോഗിക്കുന്ന സാങ്കേതിക പരിഹാരങ്ങൾ സാധാരണയായി എൻ-ഗ്രാം വിശകലനത്തെ ആശ്രയിക്കുന്നു. എൻ-ഗ്രാം അധിഷ്ഠിത സാങ്കേതികവിദ്യ പ്രയോജനപ്പെടുത്തുന്നതിലൂടെ, ഈ സേവനങ്ങൾ വളരെ ഉയർന്ന കൃത്യതയുള്ള നിരക്ക് കൈവരിക്കുന്നു. കോപ്പിയടി പരിശോധിക്കുന്നവർ പാരാഫ്രേസിംഗ് കണ്ടുപിടിക്കുന്നതിനുള്ള ഏറ്റവും മികച്ച മാർഗമാണിത്, തിരുത്തിയെഴുതിയ കൃത്യമായ വാക്കുകൾ തിരിച്ചറിയാനും ഹൈലൈറ്റ് ചെയ്യാനും ഇത് സാധ്യമാക്കുന്നു.
കോപ്പിയടി പരിശോധിക്കുന്നവർ പാരാഫ്രേസിംഗ് എങ്ങനെ കണ്ടെത്തുന്നു എന്നതിന്റെ മെക്കാനിക്സ്
ഡോക്യുമെന്റുകൾ താരതമ്യം ചെയ്യാൻ വിരലടയാള സാങ്കേതികതയാണ് കോപ്പിയടി തടയൽ സേവനങ്ങൾ സാധാരണയായി ഉപയോഗിക്കുന്നത്. പരിശോധിച്ചുറപ്പിക്കേണ്ട പ്രമാണങ്ങളിൽ നിന്ന് ആവശ്യമായ n-ഗ്രാമുകൾ വേർതിരിച്ചെടുക്കുന്നതും അവയുടെ ഡാറ്റാബേസുകളിലെ എല്ലാ പ്രമാണങ്ങളുടെയും n-ഗ്രാമുകളുമായി താരതമ്യം ചെയ്യുന്നതും ഇതിൽ ഉൾപ്പെടുന്നു.
ഉദാഹരണം
ഒരു വാചകം ഉണ്ടെന്ന് പറയാം: « Le mont Olympe est la plus haute montagne de Grèce. »
ദി n-ഗ്രാം (ഉദാഹരണത്തിന് 3-ഗ്രാം) ഈ വാചകം ഇതായിരിക്കും:
- ലെ മോണ്ട് ഒളിമ്പെ
- മോണ്ട് ഒളിമ്പെ എസ്റ്റ്
- ഒളിമ്പെ എസ്റ്റ് ലാ
- ഏറ്റവും കൂടുതൽ
- ലാ പ്ലസ് ഹോട്ട്
- കൂടാതെ ഹോട്ട് മോണ്ടേൻ
- ഹോട്ട് മോണ്ടാഗ്നെ ഡി
- montagne de Grece
കേസ് 1. മാറ്റിസ്ഥാപിക്കൽ
വാക്കിന് പകരം മറ്റൊരു വാക്ക് നൽകിയാൽ, ഇപ്പോഴും ചിലത് n-ഗ്രാം പൊരുത്തപ്പെടുത്തുക, കൂടുതൽ വിശകലനത്തിലൂടെ വാക്ക് മാറ്റിസ്ഥാപിക്കൽ കണ്ടെത്തുന്നത് സാധ്യമാണ്.
മാറ്റിയ വാചകം: "ആ പർവ്വതം Olympe est la plus haute montagne de പെലോപ്പൊന്നീസ്. »
യഥാർത്ഥ 3-ഗ്രാം | 3-ഗ്രാം മാറ്റിയ വാചകം |
ലെ മോണ്ട് ഒളിമ്പെ മോണ്ട് ഒളിമ്പെ എസ്റ്റ് ഒളിമ്പെ എസ്റ്റ് ലാ ഏറ്റവും കൂടുതൽ ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece | Le പർവ്വതം ഒളിമ്പസ് പർവ്വതം ഒളിമ്പ് എസ് ഒളിമ്പെ എസ്റ്റ് ലാ ഏറ്റവും കൂടുതൽ ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി മൊണ്ടേനെ ഡി പെലോപ്പൊന്നീസ് |
കേസ് 2. വാക്കുകളുടെ ക്രമം മാറ്റി (അല്ലെങ്കിൽ വാക്യങ്ങൾ, ഖണ്ഡികകൾ)
വാക്യത്തിന്റെ ക്രമം മാറ്റുമ്പോൾ, ഇപ്പോഴും ചില 3-ഗ്രാം പൊരുത്തപ്പെടുന്നു, അതിനാൽ മാറ്റം കണ്ടെത്താൻ കഴിയും.
മാറ്റിയ വാചകം: « ലാ പ്ലസ് ഹോട്ട് മോണ്ടാഗ്നെ ഡി ഗ്രെസ് എസ്റ്റ് ലെ മോണ്ട് ഒളിമ്പെ. »
യഥാർത്ഥ 3-ഗ്രാം | 3-ഗ്രാം മാറ്റിയ വാചകം |
ലെ മോണ്ട് ഒളിമ്പെ മോണ്ട് ഒളിമ്പെ എസ്റ്റ് ഒളിമ്പെ എസ്റ്റ് ലാ ഏറ്റവും കൂടുതൽ ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece | ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece ഡി ഗ്രീസ് എസ്റ്റ് ഗ്രീസ് എസ്റ്റ് ലെ ലെ മോണ്ട് ലെ മോണ്ട് ഒളിമ്പെ |
കേസ് 3. പുതിയ വാക്കുകൾ ചേർത്തു
പുതിയ വാക്കുകൾ ചേർക്കുമ്പോൾ, ഇപ്പോഴും പൊരുത്തപ്പെടുന്ന 3-ഗ്രാം ഉള്ളതിനാൽ മാറ്റം കണ്ടെത്താനാകും.
മാറ്റിയ വാചകം: "ലെ മോണ്ട് ഒളിമ്പെ എസ്റ്റ് ദൂരെ നിന്നും ലാ പ്ലസ് ഹോട്ട് മോണ്ടാഗ്നെ ഡി ഗ്രീസ്. »
യഥാർത്ഥ 3-ഗ്രാം | 3-ഗ്രാം മാറ്റിയ വാചകം |
ലെ മോണ്ട് ഒളിമ്പെ മോണ്ട് ഒളിമ്പെ എസ്റ്റ് ഒളിമ്പെ എസ്റ്റ് ലാ ഏറ്റവും കൂടുതൽ ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece | ലെ മോണ്ട് ഒളിമ്പെ മോണ്ട് ഒളിമ്പെ എസ്റ്റ് ഒളിമ്പെ എസ്റ്റ് ഡി എസ്റ്റ് ഡി ലോയിൻ ദൂരെ ലോയിൻ ലാ പ്ലസ് ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece |
കേസ് 4. ചില വാക്കുകൾ ഇല്ലാതാക്കി
വാക്ക് നീക്കം ചെയ്യുമ്പോൾ, പൊരുത്തപ്പെടുന്ന ചില 3-ഗ്രാം ഇപ്പോഴും ഉള്ളതിനാൽ മാറ്റം കണ്ടെത്താനാകും.
മാറ്റിയ വാചകം: « L'Olympe est la plus haute montagne de Grèce. »
യഥാർത്ഥ 3-ഗ്രാം | 3-ഗ്രാം മാറ്റിയ വാചകം |
ലെ മോണ്ട് ഒളിമ്പെ മോണ്ട് ഒളിമ്പെ എസ്റ്റ് ഒളിമ്പെ എസ്റ്റ് ലാ ഏറ്റവും കൂടുതൽ ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece | L'Olympe est la ഏറ്റവും കൂടുതൽ ലാ പ്ലസ് ഹോട്ട് കൂടാതെ ഹോട്ട് മോണ്ടേൻ ഹോട്ട് മോണ്ടാഗ്നെ ഡി montagne de Grece |
യഥാർത്ഥ ലോക ഉദാഹരണം
ഒരു യഥാർത്ഥ ഡോക്യുമെന്റിൽ സ്ഥിരീകരണം പൂർത്തിയാകുമ്പോൾ, പാരാഫ്രേസ് ചെയ്ത വിഭാഗങ്ങൾ പലപ്പോഴും തടസ്സപ്പെട്ട അടയാളങ്ങളിലൂടെ തിരിച്ചറിയുന്നു. മാറിയ വാക്കുകളെ സൂചിപ്പിക്കുന്ന ഈ തടസ്സങ്ങൾ ദൃശ്യപരതയും വ്യതിരിക്തതയും വർദ്ധിപ്പിക്കുന്നതിന് ഹൈലൈറ്റ് ചെയ്യുന്നു.
ചുവടെ, ഒരു യഥാർത്ഥ പ്രമാണത്തിന്റെ ഒരു ഉദാഹരണം നിങ്ങൾ കണ്ടെത്തും.
- ഉപയോഗിച്ച് പരിശോധിച്ചുറപ്പിച്ച ഒരു ഫയലിൽ നിന്നാണ് ആദ്യ ഉദ്ധരണി വരുന്നത് ഓക്സിക്കോ മോഷണം തടയൽ സേവനം:
- രണ്ടാമത്തെ ഉദ്ധരണി യഥാർത്ഥ ഉറവിട പ്രമാണത്തിൽ നിന്നുള്ളതാണ്:
ആഴത്തിലുള്ള വിശകലനത്തിന് ശേഷം, പ്രമാണത്തിന്റെ തിരഞ്ഞെടുത്ത ഭാഗം ഇനിപ്പറയുന്ന മാറ്റങ്ങൾ വരുത്തിക്കൊണ്ട് പാരാഫ്രേസ് ചെയ്തതായി വ്യക്തമാണ്:
യഥാർത്ഥ വാചകം | പരാവർത്തനം ചെയ്ത വാചകം | മാറ്റങ്ങൾ |
നവീകരണത്തെ പിന്തുണയ്ക്കുന്നു എന്നതും സവിശേഷതയാണ് | ബാക്കപ്പ് ഇന്നൊവേഷൻ നിർവചിക്കപ്പെട്ടിരിക്കുന്നു | മാറ്റിസ്ഥാപിക്കുക |
സാമ്പത്തികവും സാമൂഹികവുമായ അറിവ്, കാര്യക്ഷമമായ സംവിധാനങ്ങൾ | സാമ്പത്തികവും സാമൂഹികവുമായ അവബോധം, കാര്യക്ഷമമായ സംഘടന | മാറ്റിസ്ഥാപിക്കുക |
നിർദ്ദേശങ്ങൾ (ആശയങ്ങൾ) | ശുപാർശ | മാറ്റിസ്ഥാപിക്കൽ, ഇല്ലാതാക്കൽ |
മനോഭാവം | ഭിന്നിപ്പുകൾ | മാറ്റിസ്ഥാപിക്കുക |
വിജയം | വിജയി | മാറ്റിസ്ഥാപിക്കുക |
പ്രക്രിയ (പെരെൻക്, ഹോലുബ്-ഇവാൻ | വൈജ്ഞാനിക പ്രക്രിയ (പെരെൻക്, ഹോലുബ് - ഇവാൻ | ചേർത്ത |
നവീകരണത്തിന് അനുകൂലമായത് | ഹിതകരമായ | മാറ്റിസ്ഥാപിക്കുക |
ഒരു കാലാവസ്ഥ സൃഷ്ടിക്കുന്നു | : ഒരു അവസ്ഥ സൃഷ്ടിക്കുന്നു | മാറ്റിസ്ഥാപിക്കുക |
ഹിതകരമായ | സമൃദ്ധമായ | മാറ്റിസ്ഥാപിക്കുക |
അറിവ് വികസിപ്പിക്കുന്നു | വികസന അവബോധം | മാറ്റിസ്ഥാപിക്കുക |
തീരുമാനം
പാരാഫ്രേസിംഗ് കേസുകളിൽ പലപ്പോഴും കണ്ടെത്താനാകാത്ത കോപ്പിയടി, അക്കാദമികരംഗത്ത് ഒരു പ്രധാന ആശങ്കയായി തുടരുന്നു. പാരാഫ്രേസ് ചെയ്ത ഉള്ളടക്കം ഫലപ്രദമായി തിരിച്ചറിയാനുള്ള കഴിവുള്ള സാങ്കേതിക മുന്നേറ്റങ്ങൾ കോപ്പിയടി പരിശോധിക്കുന്നവരെ സജ്ജീകരിച്ചിരിക്കുന്നു. പ്രത്യേകിച്ചും, സ്ട്രിംഗ് മാച്ചിംഗ്, കോസൈൻ സാമ്യം, എൻ-ഗ്രാം വിശകലനം തുടങ്ങിയ വിവിധ രീതികളിലൂടെ കോപ്പിയടി പരിശോധനക്കാർ പാരാഫ്രേസിംഗ് കണ്ടെത്തുന്നു. ശ്രദ്ധേയമായി, n-ഗ്രാം വിശകലനം അതിന്റെ ഉയർന്ന കൃത്യത നിരക്കിൽ വേറിട്ടുനിൽക്കുന്നു. ഈ മുന്നേറ്റങ്ങൾ കോപ്പിയടിച്ചതും പാരഫ്രേസ് ചെയ്തതുമായ വസ്തുക്കൾ കണ്ടെത്തപ്പെടാതെ പോകാനുള്ള സാധ്യതയെ ഗണ്യമായി കുറയ്ക്കുകയും അതുവഴി അക്കാദമിക് സമഗ്രത വർദ്ധിപ്പിക്കുകയും ചെയ്യുന്നു. |