கருத்துத் திருட்டுச் சரிபார்ப்பவர்கள் எவ்வாறு பாராஃப்ரேஸிங்கைக் கண்டறிவார்கள்?

திருட்டு-சரிபார்ப்பவர்கள்-கண்டறிதல்-பத்திமொழியாக்கம் எப்படி
()

கருத்துத் திருட்டு என்பது வேறொருவரின் கருத்துக்கள், வார்த்தைகள் அல்லது படங்களுக்கு கடன் வாங்குவதை உள்ளடக்கியது, இது ஒரு நடைமுறையாக கருதப்படுகிறது ஒழுக்கமற்ற கல்வி மற்றும் தொழில்முறை சூழல்களில். சரியான பண்புக்கூறு இல்லாமல் தற்செயலாக வேறொருவரின் வார்த்தைகளை மீண்டும் எழுதும் மாணவர்களால் இது கவனிக்கப்படாமல் போகலாம். மேற்கோள் குறிகள் எதையாவது உரைக்கும்போது பயன்படுத்தப்படுவதில்லை என்பதால், அது சரிபார்ப்பவரின் பிடியில் இருந்து தப்பித்து இறுதி வரைவுக்குச் செல்லலாம். இருப்பினும், இது முற்றிலும் சாத்தியமற்றது அல்ல, குறிப்பாக கருத்துத் திருட்டு சரிபார்ப்பவர்கள் தற்காலத்தில் மிகவும் திறமையாக பாராஃப்ரேஸிங்கைக் கண்டறிவதால்.

உரைகளுக்கு இடையே உள்ள ஒற்றுமைகள் மற்றும் வேறுபாடுகளைக் கண்டறிவது போன்றவற்றைக் கண்டறிவது ஒரு சவாலான பணியாகும். பின்வரும் பிரிவுகளில், பாராஃப்ரேஸிங்கின் நிகழ்வுகளைக் கண்டறிவதற்குப் பயன்படுத்தப்படும் பொதுவான முறைகள் மற்றும் நுட்பங்களைப் பற்றிய ஒரு விரிவான விவாதத்தில் ஆராய்வோம்.

கருத்துத் திருட்டு சரிபார்ப்பவர்கள் எவ்வாறு பராஃப்ரேஸிங்கைக் கண்டறிகின்றனர்: பொருத்தமான முறைகள் ஆராயப்பட்டன

இன்றைய கல்வி நிலப்பரப்பில், கருத்துத் திருட்டுச் சரிபார்ப்பவர்கள் பெருகிய முறையில் மேம்பட்டுள்ளனர், நகலெடுக்கப்பட்ட உரையை மட்டும் கொடியிடுவதைத் தாண்டி, பாராஃப்ரேஸ் செய்யப்பட்ட உள்ளடக்கத்தைக் கண்டறிவதற்கும் செல்கிறது. இந்த கருவிகள் பாராஃப்ரேஸிங்கை திறம்பட அடையாளம் காண அனுமதிக்கும் முறைகளை இந்தக் கட்டுரை ஆராய்கிறது.

திருட்டு-சரிபார்ப்பவர்கள்-கண்டறிதல்-பரிமாற்றம்

1. சரம் பொருத்தம்

இந்த முறையானது, சரியான பொருத்தங்களைக் குறிக்க எழுத்து அல்லது சொல் அளவில் உரைகளை ஒப்பிடுவதை உள்ளடக்குகிறது. இரண்டு உரைகளுக்கு இடையே உள்ள எழுத்து வரிசைகள் அல்லது சொல் தேர்வுகளில் அதிக அளவு ஒற்றுமை பாராஃப்ரேஸிங்கைக் குறிக்கலாம். இந்த கருவிகள் சிக்கலான வழிமுறைகளைப் பயன்படுத்துகின்றன, அவை சொற்களின் சூழ்நிலைப் பொருளைக் கூட கருத்தில் கொள்ளலாம், இது திருட்டு, பாராஃப்ரேஸ் செய்யப்பட்ட பொருள் கண்டறியப்படாமல் போவதை கடினமாக்குகிறது.

2. கொசைன் ஒற்றுமை

கோசைன் ஒற்றுமை என்பது கருத்துத் திருட்டு சரிபார்ப்பவர்கள் பாராஃப்ரேஸிங்கைக் கண்டறியும் முறைகளில் ஒன்றாகும். உயர் பரிமாண இடைவெளியில் அவற்றின் திசையன் பிரதிநிதித்துவங்களுக்கு இடையே உள்ள கோணத்தின் அடிப்படையில் இரண்டு உரைகளுக்கு இடையே உள்ள ஒற்றுமையை இது அளவிடுகிறது. வார்த்தை அதிர்வெண்கள் அல்லது உட்பொதிவுகளின் திசையன்களாக உரைகளை பிரதிநிதித்துவப்படுத்துவதன் மூலம், இந்த கருவிகள் பாராஃப்ரேஸ் செய்யப்பட்ட உள்ளடக்கத்தைக் கண்டறியும் திறனை மேலும் செம்மைப்படுத்த கொசைன் ஒற்றுமை மதிப்பெண்ணைக் கணக்கிடலாம்.

3. வார்த்தை சீரமைப்பு மாதிரிகள்

இந்த மாதிரிகள் இரண்டு உரைகளுக்கு இடையே உள்ள வார்த்தைகள் அல்லது சொற்றொடர்களை அவற்றின் கடிதங்களை அடையாளம் காணச் செய்கின்றன. சீரமைக்கப்பட்ட பிரிவுகளை ஒப்பிடுவதன் மூலம், பொருந்திய வரிசைகளில் உள்ள ஒற்றுமைகள் மற்றும் வேறுபாடுகளின் அடிப்படையில் பாராஃப்ரேஸிங்கை நீங்கள் கண்டறியலாம்.

4. சொற்பொருள் பகுப்பாய்வு

இந்த அணுகுமுறை உரைகளில் உள்ள சொற்கள் மற்றும் சொற்றொடர்களின் பொருள் மற்றும் சூழலை பகுப்பாய்வு செய்வதை உள்ளடக்கியது. மறைந்த சொற்பொருள் பகுப்பாய்வு (LSA), சொல் உட்பொதிப்புகள் (Word2Vec அல்லது GloVe போன்றவை) அல்லது BERT போன்ற ஆழமான கற்றல் மாதிரிகள் போன்ற நுட்பங்கள் சொற்களுக்கு இடையே உள்ள சொற்பொருள் உறவுகளைப் பிடிக்கலாம் மற்றும் அவற்றின் சொற்பொருள் பிரதிநிதித்துவங்களின் ஒற்றுமையின் அடிப்படையில் பாராஃப்ரேஸிங்கை அடையாளம் காண முடியும்.

5. இயந்திர கற்றல்

மேற்பார்வையிடப்பட்ட இயந்திர கற்றல் அல்காரிதம்கள் உரைகளின் பெயரிடப்பட்ட மற்றும் பாராஃப்ரேஸ் செய்யப்படாத ஜோடிகளின் தரவுத்தொகுப்புகளில் பயிற்சியளிக்கப்படலாம். இந்த மாதிரிகள் பாராஃப்ரேஸ்களை வேறுபடுத்தும் வடிவங்கள் மற்றும் அம்சங்களைக் கற்றுக்கொள்ளலாம் மற்றும் உரையின் புதிய நிகழ்வுகளை பாராஃப்ரேஸ் அல்லது இல்லை என வகைப்படுத்த பயன்படுத்தலாம்.

6. என்-கிராம் பகுப்பாய்வு

N-grams என்பது ஒன்றோடொன்று இருக்கும் சொற்களின் குழுக்கள். இந்தக் குழுக்கள் எத்தனை முறை வெவ்வேறு நூல்களில் தோன்றும் என்பதைச் சரிபார்த்து அவற்றை ஒப்பிட்டுப் பார்த்தால், இதே போன்ற சொற்றொடர்கள் அல்லது தொடர்களைக் காணலாம். ஒரே மாதிரியான பல வடிவங்கள் இருந்தால், அந்த உரையை எழுத்துப்பிழை செய்திருக்கலாம் என்று அர்த்தம்.

7. அருகில் நகல் கண்டறிதல்

கருத்துத் திருட்டு சரிபார்ப்பவர்கள் பாராஃப்ரேஸிங்கை திறம்பட கண்டறியும் கடைசி வழி.

கிட்டதட்ட நகல் கண்டறிதல் அல்காரிதம்கள், அதிக அளவு ஒற்றுமையைக் காட்டும் அல்லது ஏறக்குறைய ஒரே மாதிரியான உரைப் பகுதிகளைக் குறிக்க, பாராஃப்ரேசிங் கண்டறிதலில் அடிக்கடி பயன்படுத்தப்படுகின்றன. இந்த அல்காரிதம்கள், உரை ஒற்றுமையை ஒரு விரிவான அளவில் ஒப்பிட்டுப் பார்ப்பதன் மூலம் உரைநடை உள்ளடக்கத்தை அடையாளம் காண வடிவமைக்கப்பட்டுள்ளது.

பொதுவாக கருத்துத் திருட்டு தடுப்பு மென்பொருளால் பயன்படுத்தப்படும் முறை எது?

தொழில்முறை திருட்டு தடுப்பு சேவைகளால் பயன்படுத்தப்படும் தொழில்நுட்ப தீர்வுகள் பொதுவாக n-கிராம் பகுப்பாய்வை நம்பியுள்ளன. n-கிராம் அடிப்படையிலான தொழில்நுட்பத்தை மேம்படுத்துவதன் மூலம், இந்த சேவைகள் குறிப்பிடத்தக்க உயர் துல்லிய விகிதத்தை அடைகின்றன. கருத்துத் திருட்டு சரிபார்ப்பவர்கள் பாராஃப்ரேஸிங்கைக் கண்டறிவதற்கான சிறந்த வழிகளில் இதுவும் ஒன்றாகும், இது மீண்டும் எழுதப்பட்ட சரியான சொற்களை அடையாளம் காணவும் சிறப்பிக்கவும் உதவுகிறது.

கருத்துத் திருட்டு சரிபார்ப்பவர்கள் பாராஃப்ரேஸிங்கை எவ்வாறு கண்டறிவார்கள் என்பதற்கான இயக்கவியல்

திருட்டுத் தடுப்புச் சேவைகள் பொதுவாக ஆவணங்களை ஒப்பிட்டுப் பார்க்க கைரேகை நுட்பத்தைப் பயன்படுத்துகின்றன. சரிபார்க்கப்பட வேண்டிய ஆவணங்களிலிருந்து தேவையான n-கிராம்களைப் பிரித்தெடுப்பது மற்றும் அவற்றின் தரவுத்தளங்களில் உள்ள அனைத்து ஆவணங்களின் n-கிராம்களுடன் அவற்றை ஒப்பிடுவதும் இதில் அடங்கும்.

மாணவர்கள்-படித்தல்-எப்படி-திருட்டு-சரிபார்ப்பவர்கள்-கண்டறிதல்-பராபிராசிங்

உதாரணமாக

ஒரு வாக்கியம் உள்ளது என்று வைத்துக்கொள்வோம்: « Le mont Olympe est la plus haute montagne de Grèce. »

தி n-கிராம்கள் (உதாரணமாக 3 கிராம்) இந்த வாக்கியத்தில் இருக்கும்:

  • Le mont Olympe
  • mont Olympe est
  • ஒலிம்பே எஸ்ட் லா
  • மிக அதிகமான
  • லா பிளஸ் ஹாட்
  • மேலும் ஹாட் மாண்டேன்
  • ஹாட் மாண்டேக்னே டி
  • மாண்டாக்னே டி கிரீஸ்

வழக்கு 1. மாற்று

வார்த்தைக்கு பதிலாக வேறு வார்த்தை இருந்தால், இன்னும் சில n-கிராம்கள் பொருந்தும் மற்றும் மேலும் பகுப்பாய்வு மூலம் வார்த்தை மாற்றத்தைக் கண்டறிய முடியும்.

மாற்றப்பட்ட வாக்கியம்:  " மலை ஒலிம்பே எஸ்ட் லா பிளஸ் ஹாட் மாண்டேக்னே டி பெலோபொன்னீஸ். »

அசல் 3 கிராம்3-கிராம் மாற்றப்பட்ட உரை
Le mont Olympe
mont Olympe est
ஒலிம்பே எஸ்ட் லா
மிக அதிகமான
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்
Le மலை ஒலிம்பஸ்
மலை ஒலிம்பே எஸ்ட்
ஒலிம்பே எஸ்ட் லா
மிக அதிகமான
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டேக்னே டி பெலோபொன்னீஸ்

வழக்கு 2. வார்த்தைகளின் வரிசையை மாற்றியது (அல்லது வாக்கியங்கள், பத்திகள்)

வாக்கியத்தின் வரிசையை மாற்றும்போது, ​​இன்னும் சில 3-கிராம்கள் பொருந்துவதால் மாற்றத்தைக் கண்டறிய முடியும்.

மாற்றப்பட்ட வாக்கியம்: « La plus haute montagne de Grèce est Le mont Olympe. »

அசல் 3 கிராம்3-கிராம் மாற்றப்பட்ட உரை
Le mont Olympe
mont Olympe est
ஒலிம்பே எஸ்ட் லா
மிக அதிகமான
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்
டி கிரீஸ் எஸ்ட்
Grece est Le
est Le mont
Le mont Olympe

வழக்கு 3. புதிய சொற்கள் சேர்க்கப்பட்டன

புதிய சொற்கள் சேர்க்கப்படும் போது, ​​இன்னும் சில 3-கிராம்கள் பொருந்துகின்றன, எனவே மாற்றத்தைக் கண்டறிய முடியும்.

மாற்றப்பட்ட வாக்கியம்: « Le mont Olympe est இடுப்பு லா பிளஸ் ஹாட் மாண்டேக்னே டி கிரீஸ். »

அசல் 3 கிராம்3-கிராம் மாற்றப்பட்ட உரை
Le mont Olympe
mont Olympe est
ஒலிம்பே எஸ்ட் லா
மிக அதிகமான
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்
Le mont Olympe
mont Olympe est
ஒலிம்பே எஸ்ட் டி
இதுவரை உள்ளது
தொலைவில்
இடுப்பு லா பிளஸ்
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்

வழக்கு 4. சில வார்த்தைகள் நீக்கப்பட்டது

வார்த்தை நீக்கப்பட்டால், இன்னும் சில 3-கிராம்கள் பொருந்துகின்றன, எனவே மாற்றத்தைக் கண்டறிய முடியும்.

மாற்றப்பட்ட வாக்கியம்: « L'Olympe est la plus haute montagne de Grèce. »

அசல் 3 கிராம்3-கிராம் மாற்றப்பட்ட உரை
Le mont Olympe
mont Olympe est
ஒலிம்பே எஸ்ட் லா
மிக அதிகமான
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்
L'Olympe est la
மிக அதிகமான
லா பிளஸ் ஹாட்
மேலும் ஹாட் மாண்டேன்
ஹாட் மாண்டேக்னே டி
மாண்டாக்னே டி கிரீஸ்

நிஜ உலக உதாரணம்

ஒரு உண்மையான ஆவணத்தில் சரிபார்ப்பு முடிந்ததும், குறுக்கீடு செய்யப்பட்ட குறிகள் மூலம் பெரும்பாலும் பாராஃப்ரேஸ் செய்யப்பட்ட பிரிவுகள் அடையாளம் காணப்படுகின்றன. மாற்றப்பட்ட சொற்களைக் குறிக்கும் இந்த குறுக்கீடுகள், தெரிவுநிலை மற்றும் வேறுபாட்டை மேம்படுத்த தனிப்படுத்தப்படுகின்றன.

கீழே, நீங்கள் ஒரு உண்மையான ஆவணத்தின் உதாரணத்தைக் காண்பீர்கள்.

  • முதல் பகுதி, ஐப் பயன்படுத்தி சரிபார்க்கப்பட்ட கோப்பிலிருந்து வருகிறது ஆக்ஸிகோ திருட்டு தடுப்பு சேவை:
  • இரண்டாவது பகுதி அசல் மூல ஆவணத்திலிருந்து:
திருட்டு-அறிக்கை

ஒரு ஆழமான பகுப்பாய்விற்குப் பிறகு, ஆவணத்தின் தேர்ந்தெடுக்கப்பட்ட பகுதி பின்வரும் மாற்றங்களைச் செய்வதன் மூலம் சுருக்கமாக மாற்றப்பட்டது என்பது தெளிவாகிறது:

அசல் உரைபகுத்தறிவு உரைமாற்றங்கள்
புதுமையை ஆதரிக்கிறது பேக்கப் புதுமை வரையறுக்கப்பட்டுள்ளதுமாற்று
பொருளாதார மற்றும் சமூக அறிவு, திறமையான அமைப்புகள் பொருளாதார மற்றும் சமூக விழிப்புணர்வு, திறமையான அமைப்புமாற்று
முன்மொழிவுகள் (யோசனைகள்)பரிந்துரைமாற்று, நீக்குதல்
அணுகுமுறைகளைதோரணைகள்மாற்று
வெற்றிவெற்றிமாற்று
செயல்முறை (Perenc, Holub-Ivanஅறிவாற்றல் செயல்முறை (Perenc, Holub - Ivanகூட்டல்
சார்பு புதுமைசாதகமானமாற்று
ஒரு காலநிலையை உருவாக்குகிறது: ஒரு நிபந்தனையை உருவாக்குதல்மாற்று
சாதகமானவளமானமாற்று
அறிவை வளர்க்கும்வளர்ச்சி விழிப்புணர்வுமாற்று

தீர்மானம்

கருத்துத் திருட்டு, அடிக்கடி கண்டறியப்படாமல் இருப்பது, கல்வித்துறையில் குறிப்பிடத்தக்க கவலையாக உள்ளது. தொழிநுட்ப முன்னேற்றங்கள் கருத்துத் திருட்டுச் சரிபார்ப்புக் கருவிகளைக் கொண்டு, உரைநடை உள்ளடக்கத்தை திறம்பட அடையாளம் காணும் திறனைக் கொண்டுள்ளன. குறிப்பாக, திருட்டு சரிபார்ப்பவர்கள் சரம் பொருத்தம், கொசைன் ஒற்றுமை மற்றும் n-கிராம் பகுப்பாய்வு போன்ற பல்வேறு முறைகள் மூலம் பாராஃப்ரேஸிங்கைக் கண்டறிகின்றனர். குறிப்பிடத்தக்க வகையில், n-gram பகுப்பாய்வு அதன் உயர் துல்லிய விகிதத்திற்காக தனித்து நிற்கிறது. இந்த முன்னேற்றங்கள் கணிசமான அளவில் திருட்டு மற்றும் உரைநடை பொருள் கண்டறியப்படாமல் போகும் வாய்ப்பைக் குறைக்கிறது, இதன் மூலம் கல்வி ஒருமைப்பாடு அதிகரிக்கிறது.

இந்த இடுகை எவ்வளவு பயனுள்ளதாக இருந்தது?

அதை மதிப்பிட ஒரு நட்சத்திரத்தைக் கிளிக் செய்க!

சராசரி மதிப்பீடு / 5. வாக்கு எண்ணிக்கை:

இதுவரை வாக்குகள் இல்லை! இந்த இடுகையை முதலில் மதிப்பிடுங்கள்.

இந்த இடுகை உங்களுக்கு பயனுள்ளதாக இல்லை என்று வருந்துகிறோம்!

இந்த இடுகையை மேம்படுத்துவோம்!

இந்த இடுகையை எவ்வாறு மேம்படுத்தலாம் என்று சொல்லுங்கள்?