කොල්ලකෑම යනු වෙනත් කෙනෙකුගේ අදහස්, වචන හෝ රූප සඳහා ණය ලබා ගැනීමයි සදාචාරාත්මක නොවේ අධ්යයන හා වෘත්තීය පරිසරයන් තුළ. නිසි ආරෝපණයකින් තොරව වෙනත් කෙනෙකුගේ වචන අහම්බෙන් නැවත නැවත ප්රකාශ කළ හැකි සිසුන්ට එය නොපෙනී යා හැකිය. යමක් පරාවර්තනය කරන විට උද්ධෘත ලකුණු භාවිතා නොකරන බැවින්, එය පහසුවෙන් සෝදුපත් කියවන්නෙකුගේ ග්රහණයෙන් මිදී අවසාන කෙටුම්පතට යා හැකිය. කෙසේ වෙතත්, එය සම්පුර්ණයෙන්ම සාක්ෂාත් කරගත නොහැකි දෙයක් නොවේ, විශේෂයෙන් අද කාලයේ ප්රාප්තිකරණය වඩාත් කාර්යක්ෂමව ප්රකාශන පරික්ෂකයින් හඳුනා ගන්නා බැවින්.
පාඨ අතර සමානකම් සහ වෙනස්කම් හඳුනාගැනීම ඇතුළත් වන බැවින්, පරාවර්තනය හඳුනා ගැනීම අභියෝගාත්මක කාර්යයක් විය හැකිය. ඊළඟ කොටස්වලදී, අපි පරාවර්තනය කිරීමේ අවස්ථා හඳුනා ගැනීම සඳහා භාවිතා කරන පොදු ක්රම සහ ශිල්පීය ක්රම පිළිබඳ පුළුල් සාකච්ඡාවකට පිවිසෙමු.
ප්රාප්තිය පරික්ෂා කරන්නන් පරාවර්තනය හඳුනා ගන්නේ කෙසේද: සුදුසු ක්රම ගවේෂණය කර ඇත
වර්තමාන අධ්යාපනික භූ දර්ශනය තුළ, පිටපත් කරන ලද පෙළ සලකුණු කිරීමෙන් ඔබ්බට ගොස් පරාවර්තනය කළ අන්තර්ගතයන් හඳුනා ගැනීම දක්වා කොල්ලකෑම් පරීක්ෂකයන් වඩ වඩාත් දියුණු වී ඇත. මෙම ලිපිය මගින් මෙම මෙවලම්වලට පරාවර්තනය ඵලදායි ලෙස හඳුනා ගැනීමට ඉඩ සලසන ක්රම ගවේෂණය කරයි.
1. නූල් ගැලපීම
මෙම ක්රමයට නිශ්චිත ගැළපීම් හඳුනා ගැනීම සඳහා අක්ෂර හෝ වචන මට්ටමින් පෙළ සංසන්දනය කිරීම ඇතුළත් වේ. අක්ෂර අනුපිළිවෙලෙහි ඉහළ මට්ටමේ සමානකමක් හෝ පාඨ දෙකක් අතර වචන තේරීම් පරාවර්තනය සංඥා කළ හැකිය. මෙම මෙවලම් වචනවල සන්දර්භීය අර්ථය පවා සලකා බැලිය හැකි සංකීර්ණ ඇල්ගොරිතම භාවිතා කරයි, එය සොරකම් කරන ලද, පරාවර්තක ද්රව්ය හඳුනා නොගැනීම වඩ වඩාත් දුෂ්කර කරයි.
2. කොසයින් සමානතාව
කොසයින් සමානතාවය යනු ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය හඳුනා ගන්නා එක් ක්රමයකි. එය ඉහළ මාන අවකාශයක ඒවායේ දෛශික නිරූපණයන් අතර කෝණය මත පදනම්ව පෙළ දෙකක් අතර සමානකම් මනිනු ලබයි. වචන සංඛ්යාතවල හෝ කාවැද්දීමේ දෛශික ලෙස පෙළ නිරූපණය කිරීමෙන්, මෙම මෙවලම්වලට පරාවර්තක අන්තර්ගතය හඳුනා ගැනීමට ඇති හැකියාව තවදුරටත් පිරිපහදු කිරීම සඳහා කොසයින් සමානතා ලකුණු ගණනය කළ හැකිය.
3. වචන පෙළගැස්වීමේ ආකෘති
මෙම ආකෘති පාඨ දෙකක් අතර වචන හෝ වාක්ය ඛණ්ඩ ඒවායේ ලිපි හුවමාරු හඳුනා ගැනීමට පෙළගස්වයි. පෙළගස්වන ලද කොටස් සංසන්දනය කිරීමෙන්, ඔබට ගැලපෙන අනුපිළිවෙලෙහි සමානකම් සහ වෙනස්කම් මත පදනම්ව පරාවර්තනය හඳුනාගත හැකිය.
4. අර්ථකථන විශ්ලේෂණය
මෙම ප්රවේශයට පාඨවල වචන සහ වාක්ය ඛණ්ඩවල අර්ථය සහ සන්දර්භය විශ්ලේෂණය කිරීම ඇතුළත් වේ. ගුප්ත අර්ථ විශ්ලේෂණ (LSA), වචන කාවැද්දීම (Word2Vec හෝ GloVe වැනි) වැනි තාක්ෂණික ක්රම හෝ BERT වැනි ගැඹුරු ඉගෙනුම් ආකෘතීන්ට වචන අතර අර්ථ සම්බන්ධතා ග්රහණය කර ගැනීමටත් ඒවායේ අර්ථ නිරූපණයන්හි සමානතාව මත පදනම්ව පරාවර්තනය හඳුනා ගැනීමටත් හැකිය.
5. යන්ත්ර ඉගෙනුම්
අධීක්ෂණය කරන ලද යන්ත්ර ඉගෙනුම් ඇල්ගොරිතම පරාවර්තනය කරන ලද සහ පරාවර්තක නොවන පෙළ යුගලවල ලේබල් කළ දත්ත කට්ටල මත පුහුණු කළ හැක. මෙම ආකෘතීන්ට ව්යංගාර්ථයන් වෙන්කර හඳුනාගත හැකි රටා සහ විශේෂාංග ඉගෙන ගත හැකි අතර නව පාඨ නිදසුන් පරාවර්තනය කළ හෝ නැති ලෙස වර්ගීකරණය කිරීමට භාවිත කළ හැක.
6. N-ග්රෑම් විශ්ලේෂණය
N-gram යනු එකිනෙකට යාබදව ඇති වචන සමූහයකි. මෙම කණ්ඩායම් විවිධ පාඨවල කොපමණ වාරයක් දිස්වේදැයි පරීක්ෂා කර ඒවා සංසන්දනය කරන විට, ඔබට සමාන වාක්ය ඛණ්ඩ හෝ අනුපිළිවෙල සොයාගත හැකිය. සමාන රටා බොහොමයක් තිබේ නම්, එයින් අදහස් කරන්නේ පාඨය පරාවර්තනය කර ඇති බවයි.
7. ආසන්නයේ අනුපිටපත් හඳුනාගැනීම
ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය ඵලදායී ලෙස හඳුනා ගන්නා අවසාන ක්රමය.
ආසන්න අනුපිටපත් හඳුනාගැනීමේ ඇල්ගොරිතම නිතර නිතර භාවිතා කරනුයේ පරාවර්තන හඳුනාගැනීමේදී ඉහළ මට්ටමේ සමානකමක් පෙන්වන හෝ බොහෝ දුරට සමාන වන පෙළ කොටස් හඳුනාගැනීමටය. මෙම ඇල්ගොරිතම විශේෂයෙන් සකස් කර ඇත්තේ විස්තරාත්මක මට්ටමකින් පෙළ සමානකම් සංසන්දනය කිරීම හරහා පරාවර්තක අන්තර්ගතය හඳුනා ගැනීමට ය.
සොරකම් වැළැක්වීමේ මෘදුකාංගය සාමාන්යයෙන් භාවිතා කරන ක්රමය කුමක්ද?
වෘත්තීය කොල්ලකෑම් වැළැක්වීමේ සේවාවන් විසින් භාවිතා කරන තාක්ෂණික විසඳුම් සාමාන්යයෙන් n-gram විශ්ලේෂණය මත රඳා පවතී. n-gram-පාදක තාක්ෂණය උපයෝගී කර ගැනීමෙන්, මෙම සේවාවන් කැපී පෙනෙන ලෙස ඉහළ නිරවද්යතා අනුපාතයක් ලබා ගනී. මෙය ප්රතිලිපිත නිවැරදි වචන හඳුනා ගැනීමට සහ උද්දීපනය කිරීමට හැකි වන පරිදි ප්රාචීරකරණය හඳුනා ගැනීමට හැකි හොඳම ක්රමයකි.
ප්ලේජියාරිසම් පරීක්ෂකයන් පරාවර්තනය හඳුනා ගන්නා ආකාරය පිළිබඳ යාන්ත්ර විද්යාව
කොල්ලකෑම් වැළැක්වීමේ සේවාවන් සාමාන්යයෙන් ලේඛන සංසන්දනය කිරීම සඳහා ඇඟිලි සලකුණු තාක්ෂණය භාවිතා කරයි. සත්යාපනය කළ යුතු ලේඛනවලින් අවශ්ය n-ග්රෑම් උකහා ගැනීම සහ ඒවායේ දත්ත සමුදායේ ඇති සියලුම ලේඛනවල n-ග්රෑම් සමඟ සංසන්දනය කිරීම මෙයට ඇතුළත් වේ.
උදාහරණයක්
වාක්යයක් ඇතැයි කියමු: « Le mont Olympe est la plus haute montagne de Grèce. »
එම n-ග්රෑම් (උදාහරණයක් ලෙස ග්රෑම් 3) මෙම වාක්යයේ වනු ඇත:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- වඩාත්ම වේ
- la plus haute
- ප්ලස් haute montagne
- haute montagne de
- montagne de Grèce
නඩුව 1. ප්රතිස්ථාපනය
වචනය වෙනත් වචනයෙන් ආදේශ කරන්නේ නම්, තවමත් සමහරක් n-ග්රෑම් ගැලපීම සහ එය තවදුරටත් විශ්ලේෂණය කිරීමෙන් වචනය ආදේශනය හඳුනා ගැනීමට හැකි වේ.
වෙනස් කළ වාක්යය: "ඒ කඳු Olympe est la plus haute montagne de Péloponnèse. »
මුල් 3 ග්රෑම් | වෙනස් කළ පෙළ ග්රෑම් 3ක් |
Le mont Olympe mont Olympe est Olympe est la වඩාත්ම වේ la plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce | Le කඳු ඔලිම්පස් කඳු Olympe est Olympe est la වඩාත්ම වේ la plus haute ප්ලස් haute montagne haute montagne de මොන්ටේන් ද Péloponnèse |
අවස්ථාව 2. වචන (හෝ වාක්ය, ඡේද) අනුපිළිවෙල වෙනස් කරන ලදී
වාක්යයේ අනුපිළිවෙල වෙනස් කළ විට, තවමත් ග්රෑම් 3ක් ගැළපෙන බැවින් වෙනස හඳුනා ගත හැක.
වෙනස් කළ වාක්යය: « La plus haute montagne de Grèce est Le mont Olympe. »
මුල් 3 ග්රෑම් | වෙනස් කළ පෙළ ග්රෑම් 3ක් |
Le mont Olympe mont Olympe est Olympe est la වඩාත්ම වේ la plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce | La plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce ද ග්රීස් est Grece est Le est Le mont Le mont Olympe |
නඩුව 3. නව වචන එකතු කරන ලදී
නව වචන එකතු කළ විට, තවමත් ගැළපෙන ග්රෑම් 3ක් ඇති බැවින් වෙනස හඳුනා ගැනීමට හැකි වේ.
වෙනස් කළ වාක්යය: « Le mont Olympe est දුර සිට la plus haute montagne de Grèce. »
මුල් 3 ග්රෑම් | වෙනස් කළ පෙළ ග්රෑම් 3ක් |
Le mont Olympe mont Olympe est Olympe est la වඩාත්ම වේ la plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin බොහෝ දුරින් loin la plus la plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce |
නඩුව 4. සමහර වචන මකා ඇත
වචනය ඉවත් කළ විට, තවමත් ගැළපෙන ග්රෑම් 3 ක් ඇති බැවින් වෙනස හඳුනා ගැනීමට හැකි වේ.
වෙනස් කළ වාක්යය: « L'Olympe est la plus haute montagne de Grèce. »
මුල් 3 ග්රෑම් | වෙනස් කළ පෙළ ග්රෑම් 3ක් |
Le mont Olympe mont Olympe est Olympe est la වඩාත්ම වේ la plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce | L'Olympe est la වඩාත්ම වේ la plus haute ප්ලස් haute montagne haute montagne de montagne de Grèce |
සැබෑ ලෝක උදාහරණය
සත්ය ලේඛනයක සත්යාපනය අවසන් වූ පසු, පරාවර්තක කොටස් බොහෝ විට බාධා කළ සලකුණු හරහා හඳුනා ගැනේ. වෙනස් වූ වචන හඟවන මෙම බාධා කිරීම් දෘශ්යතාව සහ වෙනස වැඩි දියුණු කිරීම සඳහා උද්දීපනය කෙරේ.
පහත, ඔබ සැබෑ ලේඛනයක උදාහරණයක් සොයා ගනු ඇත.
- පළමු උපුටා ගැනීම පැමිණෙන්නේ භාවිතා කර සත්යාපනය කර ඇති ගොනුවකිනි ඔක්සිකෝ කොල්ලකෑම් වැළැක්වීමේ සේවාව:
- දෙවන උපුටා ගැනීම මුල් මූලාශ්ර ලේඛනයෙන්:
ගැඹුරු විශ්ලේෂණයකින් පසු, ලේඛනයේ තෝරාගත් කොටස පහත සඳහන් වෙනස්කම් සිදු කිරීමෙන් පරාවර්තනය කර ඇති බව පෙනේ:
මුල් පෙළ | පරිවර්තන පෙළ | වෙනස්කම් |
නවෝත්පාදනයට සහය දක්වයි | උපස්ථ නවෝත්පාදනය ඊට අමතරව අර්ථ දක්වා ඇත | ආදේශ කිරීම |
ආර්ථික හා සමාජ දැනුම, කාර්යක්ෂම පද්ධති | ආර්ථික හා සමාජීය දැනුවත්භාවය, කාර්යක්ෂම සංවිධානය | ආදේශ කිරීම |
යෝජනා (අදහස්) | නිර්දේශය | ආදේශ කිරීම, මකා දැමීම |
ආකල්ප | විචාර බුද්ධියෙන් | ආදේශ කිරීම |
සාර්ථකත්වය | ජයග්රාහකයා විය | ආදේශ කිරීම |
ක්රියාවලිය (Perenc, Holub-Ivan | සංජානන ක්රියාවලිය (Perenc, Holub - Ivan | ඊට අමතරව |
නවෝත්පාදනයට ගැති | හිතකර | ආදේශ කිරීම |
දේශගුණයක් නිර්මාණය කිරීම | : කොන්දේසියක් නිර්මාණය කිරීම | ආදේශ කිරීම |
හිතකර | සමෘද්ධිමත් | ආදේශ කිරීම |
දැනුම වර්ධනය කිරීම | සංවර්ධන දැනුවත් කිරීම | ආදේශ කිරීම |
නිගමනය
ප්රාචීනකරණයේ අවස්ථා වලදී නිතර හඳුනා නොගත් කොල්ලකෑම, ශාස්ත්රීය ක්ෂේත්රයේ සැලකිය යුතු සැලකිල්ලක් ලෙස පවතී. තාක්ෂණික ප්රගතිය මගින් ප්රතික්ෂේප කරන ලද අන්තර්ගතයන් ඵලදායී ලෙස හඳුනාගැනීමේ හැකියාව ඇති කොල්ලකෑම් පරීක්ෂකයන් සන්නද්ධ කර ඇත. විශේෂයෙන්, ප්ලේජියාරිසම් පරීක්ෂකයන් තන්තු ගැලපීම, කෝසයින් සමානතාවය සහ n-ග්රෑම් විශ්ලේෂණය වැනි විවිධ ක්රම හරහා පරාවර්තනය හඳුනා ගනී. සැලකිය යුතු ලෙස, n-gram විශ්ලේෂණය එහි ඉහළ නිරවද්යතා අනුපාතය සඳහා කැපී පෙනේ. මෙම ප්රගමනයන් විසින් සොරකම් කරන ලද සහ පරාවර්තක ද්රව්ය හඳුනා නොගැනීමේ සම්භාවිතාව සැලකිය යුතු ලෙස අඩු කරයි, එමගින් ශාස්ත්රීය අඛණ්ඩතාව වැඩි කරයි. |