የሌብነት አራሚዎች ገለፃን እንዴት ያውቁታል?

እንዴት-ማስመሰል-አረጋጊዎች-ማወቂያ-አተረጓጎም
()

ማጭበርበር ለሌላ ሰው ሃሳቦች፣ ቃላት ወይም ምስሎች እውቅና መስጠትን ያካትታል፣ ይህም ግምት ውስጥ የሚገባ ሥነ ምግባር የጎደለው በአካዳሚክ እና በሙያዊ አካባቢዎች. በስህተት የሌላ ሰውን ቃል ያለአግባብ መድገም በሚችሉ ተማሪዎች ሳይስተዋል አይቀርም። የጥቅስ ምልክቶች አንድ ነገር ሲገለጽ ጥቅም ላይ የማይውል በመሆኑ በቀላሉ ከአራሚው እጅ አምልጦ ወደ መጨረሻው ረቂቅ ሊሄድ ይችላል። ነገር ግን፣ ሙሉ በሙሉ ሊደረስበት የማይችል አይደለም፣ በተለይ በአሁኑ ጊዜ የውሸት አራሚዎች ገለፃን በብቃት ስለሚያውቁ።

በጽሁፎች መካከል ያለውን ተመሳሳይነት እና ልዩነት ለይቶ ማወቅን ስለሚያካትት የቃላት አተረጓጎም መለየት ፈታኝ ስራ ሊሆን ይችላል። በሚቀጥሉት ክፍሎች፣ የቃላት አተረጓጎም ሁኔታዎችን ለመለየት ጥቅም ላይ ስለሚውሉ የተለመዱ ዘዴዎች እና ቴክኒኮች ወደ አጠቃላይ ውይይት እንቃኛለን።

የውሸት አራሚዎች እንዴት ገለጻ ማድረግን ይገነዘባሉ፡ ተስማሚ ዘዴዎች ተዳሰዋል

በዛሬው ትምህርታዊ ገጽታ፣ የተገለበጠ ጽሑፍን ከመጠቆም ባለፈ፣ የተገለበጠ ይዘትን እስከመፈለግ ድረስ፣ የክህደት ፈታኞች ከጊዜ ወደ ጊዜ እየጨመሩ መጥተዋል። ይህ ጽሑፍ እነዚህ መሳሪያዎች የቃላት አነጋገርን በብቃት እንዲለዩ የሚያስችሏቸውን ዘዴዎች ይዳስሳል።

ማጭበርበር-ማረጋገጫዎች-ማወቂያ-አተረጓጎም

1. ሕብረቁምፊ ማዛመድ

ይህ ዘዴ ትክክለኛ ተዛማጆችን ለመጠቆም ጽሑፎችን በቁምፊ ወይም በቃላት ደረጃ ማወዳደርን ያካትታል። በቁምፊ ቅደም ተከተሎች ውስጥ ያለው ከፍተኛ ተመሳሳይነት ወይም በሁለት ጽሑፎች መካከል ያለው የቃላት ምርጫ ሐረጎችን ሊያመለክት ይችላል። እነዚህ መሳሪያዎች የቃላትን ዐውደ-ጽሑፋዊ ትርጉም እንኳን ሊያጤኑ የሚችሉ ውስብስብ ስልተ ቀመሮችን ይጠቀማሉ፣ ይህም ለሌብነት የተተረጎመ፣ በግንባር ቀደምነት የተተረጎመ ነገር ሳይታወቅ ለመቀጠል አስቸጋሪ ያደርገዋል።

2. የኮሳይን ተመሳሳይነት

የኮሳይን መመሳሰል የፕላጊያሪዝም ተቆጣጣሪዎች የቃላት አጠራርን የሚያውቁበት አንዱ ዘዴ ነው። ከፍተኛ መጠን ባለው ቦታ ላይ ባለው የቬክተር ውክልናዎቻቸው መካከል ባለው አንግል ላይ በመመስረት በሁለት ጽሑፎች መካከል ያለውን ተመሳሳይነት ይለካል። ጽሑፎችን እንደ የቃላት ድግግሞሾች ወይም መክተቶች ቬክተር በመወከል፣ እነዚህ መሳሪያዎች የተተረጎመ ይዘትን የማወቅ ችሎታቸውን የበለጠ ለማጣራት የኮሳይን ተመሳሳይነት ነጥብ ማስላት ይችላሉ።

3. የቃላት አሰላለፍ ሞዴሎች

እነዚህ ሞዴሎች ቃላቶችን ወይም ሀረጎችን በሁለት ጽሁፎች መካከል ያስተካክላሉ። የተስተካከሉ ክፍሎችን በማነፃፀር, በተዛማጅ ቅደም ተከተሎች ተመሳሳይነት እና ልዩነት ላይ ተመስርተው መተርጎምን ማወቅ ይችላሉ.

4. የትርጉም ትንተና

ይህ አካሄድ በጽሁፎች ውስጥ የቃላቶችን እና ሀረጎችን ትርጉም እና አውድ መተንተንን ያካትታል። እንደ ድብቅ የትርጉም ትንተና (ኤልኤስኤ)፣ የቃላት መክተት (እንደ Word2Vec ወይም GloVe ያሉ) ወይም እንደ BERT ያሉ ጥልቅ የመማሪያ ሞዴሎች በቃላት መካከል ያሉ የትርጓሜ ግንኙነቶችን ሊይዙ እና የትርጓሜ ውክልናዎቻቸውን ተመሳሳይነት መሰረት በማድረግ ሀረጎችን መለየት ይችላሉ።

5. የማሽን መማሪያ

ቁጥጥር የሚደረግባቸው የማሽን መማሪያ ስልተ ቀመሮች በተሰየሙ የተተረጎሙ እና ያልተተረጎሙ ጥንድ ጽሑፎች ላይ ሊሰለጥኑ ይችላሉ። እነዚህ ሞዴሎች ትርጉሞችን የሚለዩ ዘይቤዎችን እና ባህሪያትን ሊማሩ ይችላሉ እና አዲስ የጽሁፍ አጋጣሚዎችን እንደ ገለጻ ወይም አይደለም ለመፈረጅ ሊያገለግሉ ይችላሉ።

6. የኤን-ግራም ትንተና

ኤን-ግራም እርስ በርስ የተያያዙ የቃላት ቡድኖች ናቸው. እነዚህ ቡድኖች በተለያዩ ጽሑፎች ውስጥ ምን ያህል ጊዜ እንደሚገኙ ስታረጋግጥ እና ሲያወዳድራቸው ተመሳሳይ ሐረጎችን ወይም ቅደም ተከተሎችን ማግኘት ትችላለህ። ብዙ ተመሳሳይ ዘይቤዎች ካሉ፣ ጽሑፉ በሐሳብ ተቀርጾ ሊሆን ይችላል ማለት ነው።

7. የተባዛ ማወቂያ አጠገብ

የውሸት አራሚዎች ገለፃን በትክክል የሚያውቁበት የመጨረሻው መንገድ።

የተባዙ ማወቂያ ስልተ ቀመሮች በከፍተኛ ደረጃ ተመሳሳይነት የሚያሳዩ ወይም ተመሳሳይነት ያላቸውን የጽሑፍ ክፍሎችን ለመጠቆም በትርጉም ማወቂያ ላይ በተደጋጋሚ ጥቅም ላይ ይውላሉ። እነዚህ ስልተ ቀመሮች በተለይ የተቀረጹት የተተረጎመ ይዘትን በዝርዝር ደረጃ ያለውን የጽሁፍ ተመሳሳይነት በማነፃፀር ነው።

ብዙውን ጊዜ የፕላጊያሪዝም መከላከያ ሶፍትዌር የትኛው ዘዴ ነው ጥቅም ላይ የሚውለው?

በፕሮፌሽናል ስርቆት መከላከል አገልግሎቶች ጥቅም ላይ የሚውሉ የቴክኖሎጂ መፍትሄዎች በተለምዶ በ n-ግራም ትንተና ላይ ይመረኮዛሉ። በ n-gram ላይ የተመሰረተ ቴክኖሎጂን በመጠቀም፣ እነዚህ አገልግሎቶች በሚያስደንቅ ሁኔታ ከፍተኛ ትክክለኛነትን ያገኛሉ። ይህ የማጭበርበሪያ ተቆጣጣሪዎች የቃላት አጠራርን የሚለዩበት፣ እንደገና የተፃፉ ትክክለኛ ቃላትን ለመለየት እና ለማድመቅ ከሚያስችላቸው ምርጥ መንገዶች አንዱ ነው።

የሌብነት አራሚዎች የቃላት አጠራርን እንዴት እንደሚያውቁ ሜካኒኮች

የሀሰት መከላከል አገልግሎቶች ሰነዶችን ለማነፃፀር የጣት አሻራ ዘዴን ይጠቀማሉ። ይህ ለማረጋገጥ አስፈላጊ የሆኑትን n-grams ከሰነዶቹ ማውጣት እና በመረጃ ቋታቸው ውስጥ ካሉት ሁሉም ሰነዶች n-grams ጋር ማወዳደርን ያካትታል።

ተማሪዎች-ያነበቡ-እንዴት-ፕላጊያሪዝም-ቼከሮች-አተረጓጎም-አወቁት።

ለምሳሌ

ዓረፍተ ነገር አለ እንበል፡- « Le mont Olympe est la plus haute montagne de Grèce። »

n-grams (ለምሳሌ 3-ግራም) የዚህ ዓረፍተ ነገር ይሆናል፡-

  • ለሞንት ኦሎምፒክ
  • ሞንት ኦሊምፔ est
  • ኦሊምፔ ኢስት ላ
  • የሚለው በጣም ነው
  • la plus haute
  • ከፍተኛው ተራራ
  • haute montagne ደ
  • ሞንቴኝ ደ ግሬስ

ጉዳይ 1. መተካት

ቃሉ በሌላ ቃል ከተተካ, አሁንም አንዳንዶቹ n-grams ግጥሚያ እና ተጨማሪ ትንተና በማድረግ ምትክ ቃል መለየት ይቻላል.

የተለወጠ ዓረፍተ ነገር፡-  "ይህ ተራራ Olympe est la plus haute montagne de ፔሎፖኔዝ. »

ኦሪጅናል 3-ግራም3-ግራም የተለወጠ ጽሑፍ
ለሞንት ኦሎምፒክ
ሞንት ኦሊምፔ est
ኦሊምፔ ኢስት ላ
የሚለው በጣም ነው
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ
Le ተራራ ኦሊምፐስ
ተራራ ኦሎምፔ ኢስት
ኦሊምፔ ኢስት ላ
የሚለው በጣም ነው
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንታኝ ደ ፔሎፖኔዝ

ጉዳይ 2. የቃላትን ቅደም ተከተል ለውጧል (ወይም ዓረፍተ ነገሮች፣ አንቀጾች)

የአረፍተ ነገሩ ቅደም ተከተል ሲቀየር አሁንም አንዳንድ 3-ግራሞች ይዛመዳሉ ስለዚህ ለውጡን ማወቅ ይቻላል.

የተለወጠ ዓረፍተ ነገር፡- « La plus haute montagne de Grèce est Le mont Olympe። »

ኦሪጅናል 3-ግራም3-ግራም የተለወጠ ጽሑፍ
ለሞንት ኦሎምፒክ
ሞንት ኦሊምፔ est
ኦሊምፔ ኢስት ላ
የሚለው በጣም ነው
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ
ላ ፕላስ haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ
ደ ግሬስ est
ግሬስ ኢስት ሌ
est Le Mont
ለሞንት ኦሎምፒክ

ጉዳይ 3. አዲስ ቃላት ታክለዋል

አዲሶቹ ቃላት ሲጨመሩ ለውጡን ማወቅ እንዲቻል አሁንም የሚዛመዱ አንዳንድ 3-ግራሞች አሉ።

የተለወጠ ዓረፍተ ነገር፡- « Le Mont Olympe est ከሩቅ la plus haute montagne ደ ግሬስ። »

ኦሪጅናል 3-ግራም3-ግራም የተለወጠ ጽሑፍ
ለሞንት ኦሎምፒክ
ሞንት ኦሊምፔ est
ኦሊምፔ ኢስት ላ
የሚለው በጣም ነው
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ
ለሞንት ኦሎምፒክ
ሞንት ኦሊምፔ est
ኦሎምፔ ኢስት ደ
est de loin
እሩቅ
loin la plus
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ

ጉዳይ 4. አንዳንድ ቃላትን ሰርዘዋል

ቃሉ ሲወገድ ለውጡን ማወቅ እንዲቻል አሁንም የሚዛመዱ አንዳንድ 3-ግራሞች አሉ።

የተለወጠ ዓረፍተ ነገር፡- « L'Olympe est la plus haute montagne de Grèce። »

ኦሪጅናል 3-ግራም3-ግራም የተለወጠ ጽሑፍ
ለሞንት ኦሎምፒክ
ሞንት ኦሊምፔ est
ኦሊምፔ ኢስት ላ
የሚለው በጣም ነው
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ
ኦሊምፔ እስላ
የሚለው በጣም ነው
la plus haute
ከፍተኛው ተራራ
haute montagne ደ
ሞንቴኝ ደ ግሬስ

የእውነተኛ ዓለም ምሳሌ

በተጨባጭ ሰነድ ውስጥ ማረጋገጫው ሲጠናቀቅ, የተተረጎሙ ክፍሎች ብዙውን ጊዜ በተቆራረጡ ምልክቶች ተለይተው ይታወቃሉ. እነዚህ መቋረጦች፣ የተለወጡ ቃላትን የሚያመለክቱ፣ ታይነትን እና ልዩነትን ለማጎልበት ተደምቀዋል።

ከዚህ በታች የእውነተኛ ሰነድ ምሳሌ ያገኛሉ።

  • የመጀመሪያው ቅንጭብጭብ ከተረጋገጠ ፋይል የመጣ ነው። ኦክስሲኮ የውሸት መከላከል አገልግሎት;
  • ሁለተኛው የተወሰደው ከዋናው ምንጭ ሰነድ ነው፡-
ማጭበርበር-ሪፖርት

ከጥልቅ ትንታኔ በኋላ የተመረጠው የሰነዱ ክፍል የሚከተሉትን ለውጦች በማድረግ ተተርጉሟል።

ዋና ጽሁፍየተተረጎመ ጽሑፍለውጦች
ፈጠራን ይደግፋል ፈጠራን ይደግፋል ከተገለጸው በተጨማሪተካ
ኢኮኖሚያዊ እና ማህበራዊ እውቀት, ቀልጣፋ ስርዓቶች ኢኮኖሚያዊ እና ማህበራዊ ግንዛቤ ፣ ቀልጣፋ ድርጅትተካ
ሀሳቦች (ሐሳቦች)ምክርመተካት, መሰረዝ
ዝንባሌዎችአቀማመጥተካ
ስኬትአሸናፊተካ
ሂደት (Perenc, Holub-Ivanየእውቀት (ኮግኒቲቭ) ሂደት (ፔሬንክ, ሆሉብ - ኢቫንበተጨማሪም
ፕሮ-የፈጠራተስማሚተካ
የአየር ንብረት መፍጠርሁኔታ መፍጠርተካ
ተስማሚየበለፀገተካ
እውቀትን ማዳበርየልማት ግንዛቤተካ

መደምደሚያ

ብዙ ጊዜ በትርጉም መግለጫዎች ላይ የማይታወቅ ፕላጊያሪዝም በአካዳሚው ውስጥ ትልቅ አሳሳቢ ጉዳይ ሆኖ ይቆያል። የቴክኖሎጂ እድገቶች የተተረጎሙ ይዘቶችን በብቃት የመለየት ችሎታ ያላቸው የውሸት ፈታኞችን አስታጥቀዋል። በተለይ፣ የይስሙላ አረጋጋጮች እንደ string ተዛማጅ፣ ኮሳይን ተመሳሳይነት እና የ n-ግራም ትንተና ባሉ ዘዴዎች መተርጎምን ያገኙታል። በተለይም የ n-ግራም ትንተና በከፍተኛ ትክክለኛነት ደረጃ ተለይቶ ይታወቃል። እነዚህ እድገቶች የምስጢር እና የተተረጎመ ነገር ሳይታወቅ የመሄድ እድልን በእጅጉ ይቀንሳሉ፣ በዚህም አካዳሚያዊ ታማኝነትን ያሳድጋል።

ይህ ልኡክ ጽሁፍ እንዴት ጠቃሚ ነበር?

ደረጃ ለመስጠት ኮከብ ላይ ጠቅ አድርግ!

አማካኝ ደረጃ / 5. የድምፅ ቆጠራ

እስካሁን ድረስ ድምጾች የሉም! ለዚህ ልጥፍ ደረጃ ለመስጠት የመጀመሪያ ይሁኑ።

ይህ ልጥፍ ለእርስዎ ጠቃሚ ስላልሆነ ይቅርታ እንጠይቃለን!

ይሄንን ልጥፍ እናሻሽለው!

እንዴት ይህን ልጥፍ ማሻሻል እንደምንችል ይንገሩን?