ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය හඳුනා ගන්නේ කෙසේද?

කොල්ලකෑම-පරීක්ෂා කරන්නන්-හඳුනාගන්න-පරිපද කිරීම
()

කොල්ලකෑම යනු වෙනත් කෙනෙකුගේ අදහස්, වචන හෝ රූප සඳහා ණය ලබා ගැනීමයි සදාචාරාත්මක නොවේ අධ්යයන හා වෘත්තීය පරිසරයන් තුළ. නිසි ආරෝපණයකින් තොරව වෙනත් කෙනෙකුගේ වචන අහම්බෙන් නැවත නැවත ප්‍රකාශ කළ හැකි සිසුන්ට එය නොපෙනී යා හැකිය. යමක් පරාවර්තනය කරන විට උද්ධෘත ලකුණු භාවිතා නොකරන බැවින්, එය පහසුවෙන් සෝදුපත් කියවන්නෙකුගේ ග්‍රහණයෙන් මිදී අවසාන කෙටුම්පතට යා හැකිය. කෙසේ වෙතත්, එය සම්පුර්ණයෙන්ම සාක්ෂාත් කරගත නොහැකි දෙයක් නොවේ, විශේෂයෙන් අද කාලයේ ප්‍රාප්තිකරණය වඩාත් කාර්යක්ෂමව ප්‍රකාශන පරික්‍ෂකයින් හඳුනා ගන්නා බැවින්.

පාඨ අතර සමානකම් සහ වෙනස්කම් හඳුනාගැනීම ඇතුළත් වන බැවින්, පරාවර්තනය හඳුනා ගැනීම අභියෝගාත්මක කාර්යයක් විය හැකිය. ඊළඟ කොටස්වලදී, අපි පරාවර්තනය කිරීමේ අවස්ථා හඳුනා ගැනීම සඳහා භාවිතා කරන පොදු ක්‍රම සහ ශිල්පීය ක්‍රම පිළිබඳ පුළුල් සාකච්ඡාවකට පිවිසෙමු.

ප්‍රාප්තිය පරික්‍ෂා කරන්නන් පරාවර්තනය හඳුනා ගන්නේ කෙසේද: සුදුසු ක්‍රම ගවේෂණය කර ඇත

වර්තමාන අධ්‍යාපනික භූ දර්ශනය තුළ, පිටපත් කරන ලද පෙළ සලකුණු කිරීමෙන් ඔබ්බට ගොස් පරාවර්තනය කළ අන්තර්ගතයන් හඳුනා ගැනීම දක්වා කොල්ලකෑම් පරීක්ෂකයන් වඩ වඩාත් දියුණු වී ඇත. මෙම ලිපිය මගින් මෙම මෙවලම්වලට පරාවර්තනය ඵලදායි ලෙස හඳුනා ගැනීමට ඉඩ සලසන ක්‍රම ගවේෂණය කරයි.

කොල්ලකෑම-පරීක්ෂකයින්-හඳුනාගැනීම-පරිපද කිරීම

1. නූල් ගැලපීම

මෙම ක්‍රමයට නිශ්චිත ගැළපීම් හඳුනා ගැනීම සඳහා අක්ෂර හෝ වචන මට්ටමින් පෙළ සංසන්දනය කිරීම ඇතුළත් වේ. අක්ෂර අනුපිළිවෙලෙහි ඉහළ මට්ටමේ සමානකමක් හෝ පාඨ දෙකක් අතර වචන තේරීම් පරාවර්තනය සංඥා කළ හැකිය. මෙම මෙවලම් වචනවල සන්දර්භීය අර්ථය පවා සලකා බැලිය හැකි සංකීර්ණ ඇල්ගොරිතම භාවිතා කරයි, එය සොරකම් කරන ලද, පරාවර්තක ද්‍රව්‍ය හඳුනා නොගැනීම වඩ වඩාත් දුෂ්කර කරයි.

2. කොසයින් සමානතාව

කොසයින් සමානතාවය යනු ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය හඳුනා ගන්නා එක් ක්‍රමයකි. එය ඉහළ මාන අවකාශයක ඒවායේ දෛශික නිරූපණයන් අතර කෝණය මත පදනම්ව පෙළ දෙකක් අතර සමානකම් මනිනු ලබයි. වචන සංඛ්‍යාතවල හෝ කාවැද්දීමේ දෛශික ලෙස පෙළ නිරූපණය කිරීමෙන්, මෙම මෙවලම්වලට පරාවර්තක අන්තර්ගතය හඳුනා ගැනීමට ඇති හැකියාව තවදුරටත් පිරිපහදු කිරීම සඳහා කොසයින් සමානතා ලකුණු ගණනය කළ හැකිය.

3. වචන පෙළගැස්වීමේ ආකෘති

මෙම ආකෘති පාඨ දෙකක් අතර වචන හෝ වාක්‍ය ඛණ්ඩ ඒවායේ ලිපි හුවමාරු හඳුනා ගැනීමට පෙළගස්වයි. පෙළගස්වන ලද කොටස් සංසන්දනය කිරීමෙන්, ඔබට ගැලපෙන අනුපිළිවෙලෙහි සමානකම් සහ වෙනස්කම් මත පදනම්ව පරාවර්තනය හඳුනාගත හැකිය.

4. අර්ථකථන විශ්ලේෂණය

මෙම ප්‍රවේශයට පාඨවල වචන සහ වාක්‍ය ඛණ්ඩවල අර්ථය සහ සන්දර්භය විශ්ලේෂණය කිරීම ඇතුළත් වේ. ගුප්ත අර්ථ විශ්ලේෂණ (LSA), වචන කාවැද්දීම (Word2Vec හෝ GloVe වැනි) වැනි තාක්ෂණික ක්‍රම හෝ BERT වැනි ගැඹුරු ඉගෙනුම් ආකෘතීන්ට වචන අතර අර්ථ සම්බන්ධතා ග්‍රහණය කර ගැනීමටත් ඒවායේ අර්ථ නිරූපණයන්හි සමානතාව මත පදනම්ව පරාවර්තනය හඳුනා ගැනීමටත් හැකිය.

5. යන්ත්ර ඉගෙනුම්

අධීක්‍ෂණය කරන ලද යන්ත්‍ර ඉගෙනුම් ඇල්ගොරිතම පරාවර්තනය කරන ලද සහ පරාවර්තක නොවන පෙළ යුගලවල ලේබල් කළ දත්ත කට්ටල මත පුහුණු කළ හැක. මෙම ආකෘතීන්ට ව්‍යංගාර්ථයන් වෙන්කර හඳුනාගත හැකි රටා සහ විශේෂාංග ඉගෙන ගත හැකි අතර නව පාඨ නිදසුන් පරාවර්තනය කළ හෝ නැති ලෙස වර්ගීකරණය කිරීමට භාවිත කළ හැක.

6. N-ග්රෑම් විශ්ලේෂණය

N-gram යනු එකිනෙකට යාබදව ඇති වචන සමූහයකි. මෙම කණ්ඩායම් විවිධ පාඨවල කොපමණ වාරයක් දිස්වේදැයි පරීක්ෂා කර ඒවා සංසන්දනය කරන විට, ඔබට සමාන වාක්‍ය ඛණ්ඩ හෝ අනුපිළිවෙල සොයාගත හැකිය. සමාන රටා බොහොමයක් තිබේ නම්, එයින් අදහස් කරන්නේ පාඨය පරාවර්තනය කර ඇති බවයි.

7. ආසන්නයේ අනුපිටපත් හඳුනාගැනීම

ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය ඵලදායී ලෙස හඳුනා ගන්නා අවසාන ක්‍රමය.

ආසන්න අනුපිටපත් හඳුනාගැනීමේ ඇල්ගොරිතම නිතර නිතර භාවිතා කරනුයේ පරාවර්තන හඳුනාගැනීමේදී ඉහළ මට්ටමේ සමානකමක් පෙන්වන හෝ බොහෝ දුරට සමාන වන පෙළ කොටස් හඳුනාගැනීමටය. මෙම ඇල්ගොරිතම විශේෂයෙන් සකස් කර ඇත්තේ විස්තරාත්මක මට්ටමකින් පෙළ සමානකම් සංසන්දනය කිරීම හරහා පරාවර්තක අන්තර්ගතය හඳුනා ගැනීමට ය.

සොරකම් වැළැක්වීමේ මෘදුකාංගය සාමාන්‍යයෙන් භාවිතා කරන ක්‍රමය කුමක්ද?

වෘත්තීය කොල්ලකෑම් වැළැක්වීමේ සේවාවන් විසින් භාවිතා කරන තාක්ෂණික විසඳුම් සාමාන්යයෙන් n-gram විශ්ලේෂණය මත රඳා පවතී. n-gram-පාදක තාක්ෂණය උපයෝගී කර ගැනීමෙන්, මෙම සේවාවන් කැපී පෙනෙන ලෙස ඉහළ නිරවද්‍යතා අනුපාතයක් ලබා ගනී. මෙය ප්‍රතිලිපිත නිවැරදි වචන හඳුනා ගැනීමට සහ උද්දීපනය කිරීමට හැකි වන පරිදි ප්‍රාචීරකරණය හඳුනා ගැනීමට හැකි හොඳම ක්‍රමයකි.

ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය හඳුනා ගන්නා ආකාරය පිළිබඳ යාන්ත්‍ර විද්‍යාව

කොල්ලකෑම් වැළැක්වීමේ සේවාවන් සාමාන්‍යයෙන් ලේඛන සංසන්දනය කිරීම සඳහා ඇඟිලි සලකුණු තාක්ෂණය භාවිතා කරයි. සත්‍යාපනය කළ යුතු ලේඛනවලින් අවශ්‍ය n-ග්‍රෑම් උකහා ගැනීම සහ ඒවායේ දත්ත සමුදායේ ඇති සියලුම ලේඛනවල n-ග්‍රෑම් සමඟ සංසන්දනය කිරීම මෙයට ඇතුළත් වේ.

සිසුන්-කියවීම-කොහොමද-කොච්චර කොල්ලකෑම්-පරීක්ෂකයින්-අනාවරණය-පරිපද කිරීම

උදාහරණයක්

වාක්‍යයක් ඇතැයි කියමු: « Le mont Olympe est la plus haute montagne de Grèce. »

එම n-ග්රෑම් (උදාහරණයක් ලෙස ග්රෑම් 3) මෙම වාක්යයේ වනු ඇත:

  • Le mont Olympe
  • mont Olympe est
  • Olympe est la
  • වඩාත්ම වේ
  • la plus haute
  • ප්ලස් haute montagne
  • haute montagne de
  • montagne de Grèce

නඩුව 1. ප්රතිස්ථාපනය

වචනය වෙනත් වචනයෙන් ආදේශ කරන්නේ නම්, තවමත් සමහරක් n-ග්රෑම් ගැලපීම සහ එය තවදුරටත් විශ්ලේෂණය කිරීමෙන් වචනය ආදේශනය හඳුනා ගැනීමට හැකි වේ.

වෙනස් කළ වාක්‍යය:  "ඒ කඳු Olympe est la plus haute montagne de Péloponnèse. »

මුල් 3 ග්රෑම්වෙනස් කළ පෙළ ග්‍රෑම් 3ක්
Le mont Olympe
mont Olympe est
Olympe est la
වඩාත්ම වේ
la plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce
Le කඳු ඔලිම්පස්
කඳු Olympe est
Olympe est la
වඩාත්ම වේ
la plus haute
ප්ලස් haute montagne
haute montagne de
මොන්ටේන් ද Péloponnèse

අවස්ථාව 2. වචන (හෝ වාක්‍ය, ඡේද) අනුපිළිවෙල වෙනස් කරන ලදී

වාක්‍යයේ අනුපිළිවෙල වෙනස් කළ විට, තවමත් ග්‍රෑම් 3ක් ගැළපෙන බැවින් වෙනස හඳුනා ගත හැක.

වෙනස් කළ වාක්‍යය: « La plus haute montagne de Grèce est Le mont Olympe. »

මුල් 3 ග්රෑම්වෙනස් කළ පෙළ ග්‍රෑම් 3ක්
Le mont Olympe
mont Olympe est
Olympe est la
වඩාත්ම වේ
la plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce
La plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce
ද ග්‍රීස් est
Grece est Le
est Le mont
Le mont Olympe

නඩුව 3. නව වචන එකතු කරන ලදී

නව වචන එකතු කළ විට, තවමත් ගැළපෙන ග්‍රෑම් 3ක් ඇති බැවින් වෙනස හඳුනා ගැනීමට හැකි වේ.

වෙනස් කළ වාක්‍යය: « Le mont Olympe est දුර සිට la plus haute montagne de Grèce. »

මුල් 3 ග්රෑම්වෙනස් කළ පෙළ ග්‍රෑම් 3ක්
Le mont Olympe
mont Olympe est
Olympe est la
වඩාත්ම වේ
la plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce
Le mont Olympe
mont Olympe est
Olympe est de
est de loin
බොහෝ දුරින්
loin la plus
la plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce

නඩුව 4. සමහර වචන මකා ඇත

වචනය ඉවත් කළ විට, තවමත් ගැළපෙන ග්‍රෑම් 3 ක් ඇති බැවින් වෙනස හඳුනා ගැනීමට හැකි වේ.

වෙනස් කළ වාක්‍යය: « L'Olympe est la plus haute montagne de Grèce. »

මුල් 3 ග්රෑම්වෙනස් කළ පෙළ ග්‍රෑම් 3ක්
Le mont Olympe
mont Olympe est
Olympe est la
වඩාත්ම වේ
la plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce
L'Olympe est la
වඩාත්ම වේ
la plus haute
ප්ලස් haute montagne
haute montagne de
montagne de Grèce

සැබෑ ලෝක උදාහරණය

සත්‍ය ලේඛනයක සත්‍යාපනය අවසන් වූ පසු, පරාවර්තක කොටස් බොහෝ විට බාධා කළ සලකුණු හරහා හඳුනා ගැනේ. වෙනස් වූ වචන හඟවන මෙම බාධා කිරීම් දෘශ්‍යතාව සහ වෙනස වැඩි දියුණු කිරීම සඳහා උද්දීපනය කෙරේ.

පහත, ඔබ සැබෑ ලේඛනයක උදාහරණයක් සොයා ගනු ඇත.

  • පළමු උපුටා ගැනීම පැමිණෙන්නේ භාවිතා කර සත්‍යාපනය කර ඇති ගොනුවකිනි ඔක්සිකෝ කොල්ලකෑම් වැළැක්වීමේ සේවාව:
  • දෙවන උපුටා ගැනීම මුල් මූලාශ්‍ර ලේඛනයෙන්:
කොල්ලකෑම-වාර්තාව

ගැඹුරු විශ්ලේෂණයකින් පසු, ලේඛනයේ තෝරාගත් කොටස පහත සඳහන් වෙනස්කම් සිදු කිරීමෙන් පරාවර්තනය කර ඇති බව පෙනේ:

මුල් පෙළපරිවර්තන පෙළවෙනස්කම්
නවෝත්පාදනයට සහය දක්වයි උපස්ථ නවෝත්පාදනය ඊට අමතරව අර්ථ දක්වා ඇතආදේශ කිරීම
ආර්ථික හා සමාජ දැනුම, කාර්යක්ෂම පද්ධති ආර්ථික හා සමාජීය දැනුවත්භාවය, කාර්යක්ෂම සංවිධානයආදේශ කිරීම
යෝජනා (අදහස්)නිර්දේශයආදේශ කිරීම, මකා දැමීම
ආකල්පවිචාර බුද්ධියෙන්ආදේශ කිරීම
සාර්ථකත්වයජයග්රාහකයා වියආදේශ කිරීම
ක්රියාවලිය (Perenc, Holub-Ivanසංජානන ක්රියාවලිය (Perenc, Holub - Ivanඊට අමතරව
නවෝත්පාදනයට ගැතිහිතකරආදේශ කිරීම
දේශගුණයක් නිර්මාණය කිරීම: කොන්දේසියක් නිර්මාණය කිරීමආදේශ කිරීම
හිතකරසමෘද්ධිමත්ආදේශ කිරීම
දැනුම වර්ධනය කිරීමසංවර්ධන දැනුවත් කිරීමආදේශ කිරීම

නිගමනය

ප්‍රාචීනකරණයේ අවස්ථා වලදී නිතර හඳුනා නොගත් කොල්ලකෑම, ශාස්ත්‍රීය ක්ෂේත්‍රයේ සැලකිය යුතු සැලකිල්ලක් ලෙස පවතී. තාක්‍ෂණික ප්‍රගතිය මගින් ප්‍රතික්‍ෂේප කරන ලද අන්තර්ගතයන් ඵලදායී ලෙස හඳුනාගැනීමේ හැකියාව ඇති කොල්ලකෑම් පරීක්‍ෂකයන් සන්නද්ධ කර ඇත. විශේෂයෙන්, ප්ලේජියාරිසම් පරීක්ෂකයන් තන්තු ගැලපීම, කෝසයින් සමානතාවය සහ n-ග්‍රෑම් විශ්ලේෂණය වැනි විවිධ ක්‍රම හරහා පරාවර්තනය හඳුනා ගනී. සැලකිය යුතු ලෙස, n-gram විශ්ලේෂණය එහි ඉහළ නිරවද්‍යතා අනුපාතය සඳහා කැපී පෙනේ. මෙම ප්‍රගමනයන් විසින් සොරකම් කරන ලද සහ පරාවර්තක ද්‍රව්‍ය හඳුනා නොගැනීමේ සම්භාවිතාව සැලකිය යුතු ලෙස අඩු කරයි, එමගින් ශාස්ත්‍රීය අඛණ්ඩතාව වැඩි කරයි.

මෙම තනතුර කෙතරම් ප්‍රයෝජනවත්ද?

එය ඇගයීමට තරුවක් මත ක්ලික් කරන්න!

සාමාන්ය ශ්රේණිගත / 5. ඡන්ද ගණන් කිරීම:

මෙතෙක් ඡන්ද නැත! මෙම තනතුර ශ්‍රේණිගත කළ පළමු පුද්ගලයා වන්න.

මෙම ලිපිය ඔබට ප්‍රයෝජනවත් නොවීම ගැන අපට කණගාටුයි!

අපි මෙම ලිපිය වැඩි දියුණු කරමු!

අපට මෙම තනතුර වැඩි දියුණු කළ හැක්කේ කෙසේදැයි අපට කියන්න?