Ang plagiarism ay nagsasangkot ng pagkuha ng kredito para sa mga ideya, salita, o larawan ng ibang tao, isang kasanayang isinasaalang-alang unethical sa akademiko at propesyonal na kapaligiran. Maaari itong hindi mapansin ng mga mag-aaral na maaaring hindi sinasadyang mag-rephrase ng mga salita ng ibang tao nang walang wastong attribution. Dahil ang mga panipi ay hindi ginagamit kapag ang isang bagay ay na-paraphrase, madali itong makatakas sa hawak ng isang proofreader at magpapatuloy sa huling draft. Gayunpaman, hindi ito ganap na hindi makakamit, lalo na dahil mas mahusay na nakikita ng mga checker ng plagiarism ang paraphrasing sa kasalukuyan.
Ang pag-detect ng paraphrasing ay maaaring maging isang mahirap na gawain, dahil kabilang dito ang pagtukoy ng mga pagkakatulad at pagkakaiba sa pagitan ng mga teksto. Sa kasunod na mga seksyon, susuriin natin ang isang komprehensibong talakayan tungkol sa mga karaniwang pamamaraan at pamamaraan na ginagamit upang makilala ang mga pagkakataon ng paraphrasing.
Paano nakikita ng mga plagiarism checker ang paraphrasing: Na-explore ang mga angkop na pamamaraan
Sa pang-edukasyon na landscape ngayon, ang mga plagiarism checker ay naging mas advanced, na higit pa sa pag-flag ng kinopyang teksto hanggang sa pag-detect din ng na-paraphrase na nilalaman. Tinutuklas ng artikulong ito ang mga paraan na nagbibigay-daan sa mga tool na ito na epektibong matukoy ang paraphrasing.
1. Pagtutugma ng string
Ang pamamaraang ito ay nagsasangkot ng paghahambing ng mga teksto sa antas ng karakter o salita upang matukoy ang mga eksaktong tugma. Ang mataas na antas ng pagkakatulad sa mga pagkakasunud-sunod ng karakter o mga pagpipilian ng salita sa pagitan ng dalawang teksto ay maaaring magpahiwatig ng paraphrasing. Gumagamit ang mga tool na ito ng mga kumplikadong algorithm na maaari pang isaalang-alang ang kontekstwal na kahulugan ng mga salita, na nagpapahirap para sa plagiarized, paraphrased na materyal na hindi matukoy.
2. Cosine pagkakatulad
Ang pagkakatulad ng cosine ay isa sa mga paraan kung saan nakikita ng mga plagiarism checker ang paraphrasing. Sinusukat nito ang pagkakapareho sa pagitan ng dalawang teksto batay sa anggulo sa pagitan ng kanilang mga representasyon ng vector sa isang high-dimensional na espasyo. Sa pamamagitan ng pagre-represent sa mga text bilang mga vector ng mga frequency ng salita o pag-embed, maaaring kalkulahin ng mga tool na ito ang cosine similarity score upang higit pang pinuhin ang kanilang kakayahang makakita ng naka-paraphrase na nilalaman.
3. Mga modelo ng pagkakahanay ng salita
Inihanay ng mga modelong ito ang mga salita o parirala sa pagitan ng dalawang teksto upang matukoy ang kanilang mga sulat. Sa pamamagitan ng paghahambing ng mga nakahanay na segment, maaari mong makita ang paraphrasing batay sa pagkakatulad at pagkakaiba sa mga tugmang sequence.
4. Pagsusuri ng semantiko
Ang pamamaraang ito ay nagsasangkot ng pagsusuri sa kahulugan at konteksto ng mga salita at parirala sa mga teksto. Ang mga diskarte tulad ng latent semantic analysis (LSA), word embeddings (gaya ng Word2Vec o GloVe), o deep learning models tulad ng BERT ay maaaring makakuha ng mga semantic na ugnayan sa pagitan ng mga salita at matukoy ang paraphrasing batay sa pagkakapareho ng kanilang semantic na representasyon.
5. Pag-aaral ng machine
Maaaring sanayin ang mga sinusubaybayang machine learning algorithm sa mga naka-label na dataset ng mga naka-paraphrase at hindi naka-paraphrase na pares ng mga text. Ang mga modelong ito ay maaaring matuto ng mga pattern at feature na nagpapakilala sa mga paraphrase at maaaring magamit upang uriin ang mga bagong instance ng text bilang paraphrase o hindi.
6. Pagsusuri ng N-gram
Ang mga N-gram ay mga pangkat ng mga salita na magkatabi. Kapag tiningnan mo kung gaano kadalas lumilitaw ang mga pangkat na ito sa iba't ibang mga teksto at inihambing ang mga ito, makakahanap ka ng mga katulad na parirala o pagkakasunud-sunod. Kung mayroong maraming katulad na mga pattern, maaari itong mangahulugan na ang teksto ay maaaring na-paraphrase.
7. Malapit sa duplicate na pagtuklas
Ang huling paraan kung saan epektibong natutukoy ng mga plagiarism checker ang paraphrasing.
Ang mga algorithm ng malapit-duplicate na pagtuklas ay madalas na ginagamit sa paraphrasing detection upang matukoy ang mga segment ng text na nagpapakita ng mataas na antas ng pagkakapareho o halos magkapareho. Ang mga algorithm na ito ay partikular na ginawa upang makilala ang na-paraphrase na nilalaman sa pamamagitan ng paghahambing ng pagkakatulad ng teksto sa isang detalyadong antas.
Aling paraan ang kadalasang ginagamit ng plagiarism prevention software?
Ang mga teknolohikal na solusyon na ginagamit ng mga propesyonal na serbisyo sa pag-iwas sa plagiarism ay karaniwang umaasa sa pagsusuri ng n-gram. Sa pamamagitan ng paggamit ng teknolohiyang nakabatay sa n-gram, nakakamit ang mga serbisyong ito ng napakataas na rate ng katumpakan. Ito ay isa sa mga pinakamahusay na paraan upang matukoy ng mga plagiarism checker ang paraphrasing, na nagbibigay-daan sa pagtukoy at pag-highlight ng mga eksaktong salita na muling isinulat.
Mechanics kung paano nakikita ng mga plagiarism checker ang paraphrasing
Ang mga serbisyo sa pagpigil sa plagiarism ay karaniwang gumagamit ng pamamaraan ng fingerprinting upang ihambing ang mga dokumento. Kabilang dito ang pagkuha ng mga kinakailangang n-grams mula sa mga dokumentong ibe-verify at paghahambing ng mga ito sa n-grams ng lahat ng mga dokumento sa kanilang mga database.
halimbawa
Sabihin nating mayroong isang pangungusap: « Le mont Olympe est la plus haute montagne de Grèce. »
Ang n-gramo (halimbawa 3-gramo) ng pangungusap na ito ay:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- ay ang pinaka
- la plus haute
- plus haute montagne
- haute montagne de
- montagne de Grèce
Kaso 1. Kapalit
Kung ang salita ay papalitan ng ibang salita, ilan pa rin sa n-gramo tugma at posibleng matukoy ang pagpapalit ng salita sa pamamagitan ng karagdagang pagsusuri.
Binagong pangungusap: "Ang bundok Olympe est la plus haute montagne de Peloponnese. '
Orihinal na 3-gramo | 3-gramo ng binagong teksto |
Le mont Olympe mont Olympe est Olympe est la ay ang pinaka la plus haute plus haute montagne haute montagne de montagne de Grèce | Le bundok Olimpus bundok Olympe est Olympe est la ay ang pinaka la plus haute plus haute montagne haute montagne de Montagne de Peloponnese |
Case 2. Binago ang pagkakasunud-sunod ng mga salita (o mga pangungusap, mga talata)
Kapag binago ang pagkakasunud-sunod ng pangungusap, tumutugma pa rin ang ilang 3-gramo upang posibleng makita ang pagbabago.
Binagong pangungusap: « La plus haute montagne de Grèce est Le mont Olympe. »
Orihinal na 3-gramo | 3-gramo ng binagong teksto |
Le mont Olympe mont Olympe est Olympe est la ay ang pinaka la plus haute plus haute montagne haute montagne de montagne de Grèce | La plus haute plus haute montagne haute montagne de montagne de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Kaso 3. Nagdagdag ng mga bagong salita
Kapag idinagdag ang mga bagong salita, mayroon pa ring ilang 3-gramo na tumutugma kaya posibleng matukoy ang pagbabago.
Binagong pangungusap: «Le mont Olympe est mula sa malayo la plus haute montagne de Grèce. »
Orihinal na 3-gramo | 3-gramo ng binagong teksto |
Le mont Olympe mont Olympe est Olympe est la ay ang pinaka la plus haute plus haute montagne haute montagne de montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de kung gaano kalayo malayo loin la plus la plus haute plus haute montagne haute montagne de montagne de Grèce |
Case 4. Nagtanggal ng ilang salita
Kapag inalis ang salita, mayroon pa ring ilang 3-gramo na tumutugma kaya posibleng matukoy ang pagbabago.
Binagong pangungusap: « L'Olympe est la plus haute montagne de Grèce. »
Orihinal na 3-gramo | 3-gramo ng binagong teksto |
Le mont Olympe mont Olympe est Olympe est la ay ang pinaka la plus haute plus haute montagne haute montagne de montagne de Grèce | L'Olympe est la ay ang pinaka la plus haute plus haute montagne haute montagne de montagne de Grèce |
Halimbawa sa totoong mundo
Sa pagkumpleto ng pag-verify sa isang aktwal na dokumento, ang mga na-paraphrase na seksyon ay kadalasang nakikilala sa pamamagitan ng mga naantala na marka. Ang mga pagkaantala na ito, na nagsasaad ng mga binagong salita, ay naka-highlight upang mapahusay ang visibility at pagkakaiba.
Sa ibaba, makikita mo ang isang halimbawa ng isang aktwal na dokumento.
- Ang unang sipi ay nagmula sa isang file na na-verify gamit ang OXSICO serbisyo sa pag-iwas sa plagiarism:
- Ang pangalawang sipi ay mula sa orihinal na pinagmumulan ng dokumento:
Pagkatapos ng mas malalim na pagsusuri, maliwanag na ang napiling bahagi ng dokumento ay na-paraphrase sa pamamagitan ng paggawa ng mga sumusunod na pagbabago:
Orihinal na teksto | Na-paraphrase na teksto | Mga Pagbabago |
sumusuporta sa pagbabago ay nailalarawan din | back up innovation ay bukod sa tinukoy | Kapalit |
kaalaman sa ekonomiya at panlipunan, mahusay na mga sistema | kamalayan sa ekonomiya at lipunan, mahusay na organisasyon | Kapalit |
mga panukala (ideya) | rekomendasyon | Pagpapalit, pagtanggal |
saloobin | postures | Kapalit |
tagumpay | nagtagumpay | Kapalit |
proseso (Perenc, Holub-Ivan | proseso ng kognitibo (Perenc, Holub – Ivan | Dagdag |
makabagong-likha | sang-ayon | Kapalit |
paglikha ng klima | : paglikha ng isang kondisyon | Kapalit |
sang-ayon | masagana | Kapalit |
pagbuo ng kaalaman | kamalayan sa pag-unlad | Kapalit |
Konklusyon
Ang plagiarism, na madalas na hindi natukoy sa mga kaso ng paraphrasing, ay nananatiling isang makabuluhang alalahanin sa akademya. Nilagyan ng mga teknolohikal na pag-unlad ang mga plagiarism checker na may kakayahang mabisang tukuyin ang na-paraphrase na nilalaman. Sa partikular, nakita ng mga plagiarism checker ang paraphrasing sa pamamagitan ng iba't ibang pamamaraan tulad ng pagtutugma ng string, pagkakatulad ng cosine, at pagsusuri ng n-gram. Kapansin-pansin, ang pagsusuri ng n-gram ay namumukod-tangi para sa mataas na rate ng katumpakan nito. Ang mga pagsulong na ito ay lubos na binabawasan ang posibilidad ng plagiarized at paraphrase na materyal na hindi natukoy, at sa gayon ay nagpapahusay sa akademikong integridad. |