ການຫຼອກລວງກ່ຽວຂ້ອງກັບການເອົາສິນເຊື່ອສໍາລັບຄວາມຄິດ, ຄໍາເວົ້າ, ຫຼືຮູບພາບຂອງຄົນອື່ນ, ເປັນການປະຕິບັດທີ່ພິຈາລະນາ ຜິດຈັນຍາບັນ ໃນສະພາບແວດລ້ອມທາງວິຊາການ ແລະວິຊາຊີບ. ມັນສາມາດຖືກສັງເກດເຫັນໂດຍນັກຮຽນຜູ້ທີ່ອາດຈະແປຄືນຄໍາເວົ້າຂອງຄົນອື່ນໂດຍບັງເອີນໂດຍບໍ່ໄດ້ລະບຸເຫດຜົນທີ່ເຫມາະສົມ. ເນື່ອງຈາກເຄື່ອງຫມາຍວົງຢືມບໍ່ໄດ້ຖືກນໍາໃຊ້ໃນເວລາທີ່ບາງສິ່ງບາງຢ່າງຖືກ paraphrased, ມັນໄດ້ຢ່າງງ່າຍດາຍສາມາດຫລົບຫນີຄວາມເຂົ້າໃຈຂອງ proofreader ແລະເຂົ້າໄປໃນຮ່າງສຸດທ້າຍ. ຢ່າງໃດກໍ່ຕາມ, ມັນບໍ່ແມ່ນສິ່ງທີ່ບໍ່ສາມາດບັນລຸໄດ້ທັງຫມົດ, ໂດຍສະເພາະນັບຕັ້ງແຕ່ຜູ້ກວດສອບ plagiarism ກວດພົບ paraphrasing ມີປະສິດທິພາບຫຼາຍຂຶ້ນໃນປັດຈຸບັນ.
ການກວດສອບການຖອດຂໍ້ຄວາມສາມາດເປັນວຽກທີ່ທ້າທາຍ, ຍ້ອນວ່າມັນກ່ຽວຂ້ອງກັບການກໍານົດຄວາມຄ້າຍຄືກັນແລະຄວາມແຕກຕ່າງລະຫວ່າງບົດເລື່ອງຕ່າງໆ. ໃນພາກສ່ວນຕໍ່ໄປ, ພວກເຮົາຈະ delve ເຂົ້າໄປໃນການສົນທະນາທີ່ສົມບູນແບບກ່ຽວກັບວິທີການທົ່ວໄປແລະເຕັກນິກການນໍາໃຊ້ເພື່ອແນມເບິ່ງຕົວຢ່າງຂອງ paraphrasing.
ເຄື່ອງມືກວດຫາການລ່ວງລະເມີດ ກວດພົບການປຽບທຽບແນວໃດ: ວິທີການທີ່ເໝາະສົມໄດ້ຖືກສຳຫຼວດ
ໃນພູມສັນຖານດ້ານການສຶກສາຂອງທຸກມື້ນີ້, ເຄື່ອງມືກວດກາການລ່ວງລະເມີດໄດ້ກາຍເປັນຄວາມກ້າວຫນ້າທີ່ເພີ່ມຂຶ້ນ, ນອກເຫນືອຈາກພຽງແຕ່ການປັກທຸງຂໍ້ຄວາມທີ່ຄັດລອກໄປເພື່ອກວດພົບເນື້ອຫາທີ່ paraphrased. ບົດຄວາມນີ້ຄົ້ນຫາວິທີການອະນຸຍາດໃຫ້ເຄື່ອງມືເຫຼົ່ານີ້ເພື່ອກໍານົດການ paraphrasing ປະສິດທິຜົນ.
1. ການຈັບຄູ່ String
ວິທີການນີ້ກ່ຽວຂ້ອງກັບການປຽບທຽບບົດເລື່ອງໃນລະດັບຕົວອັກສອນຫຼືຄໍາສັບເພື່ອກໍານົດຄວາມກົງກັນທີ່ແນ່ນອນ. ລະດັບຄວາມຄ້າຍຄືກັນສູງໃນລໍາດັບຕົວອັກສອນຫຼືການເລືອກຄໍາສັບລະຫວ່າງສອງບົດເລື່ອງສາມາດສົ່ງສັນຍານການປຽບທຽບ. ເຄື່ອງມືເຫຼົ່ານີ້ໃຊ້ສູດການຄິດໄລ່ທີ່ຊັບຊ້ອນທີ່ຍັງສາມາດພິຈາລະນາຄວາມຫມາຍຂອງຄໍາສັບຕ່າງໆໄດ້, ເຮັດໃຫ້ມັນມີຄວາມຫຍຸ້ງຍາກຫຼາຍຂື້ນສໍາລັບອຸປະກອນການ plagiarized, paraphrased ກັບ undetected.
2. ຄວາມຄ້າຍຄືກັນຂອງ Cosine
ຄວາມຄ້າຍຄືກັນຂອງ Cosine ແມ່ນຫນຶ່ງໃນວິທີການທີ່ຕົວກວດສອບການລ່ວງລະເມີດສາມາດກວດພົບການປຽບທຽບ. ມັນວັດແທກຄວາມຄ້າຍຄືກັນລະຫວ່າງສອງບົດເລື່ອງໂດຍອີງໃສ່ມຸມລະຫວ່າງຕົວສະແດງ vector ຂອງພວກເຂົາໃນຊ່ອງທີ່ມີມິຕິລະດັບສູງ. ໂດຍການເປັນຕົວແທນຂອງບົດເລື່ອງຕ່າງໆເປັນ vectors ຂອງຄວາມຖີ່ຂອງຄໍາສັບຕ່າງໆຫຼືການຝັງ, ເຄື່ອງມືເຫຼົ່ານີ້ສາມາດຄິດໄລ່ຄະແນນຄວາມຄ້າຍຄືກັນຂອງ cosine ເພື່ອປັບປຸງຄວາມສາມາດຂອງເຂົາເຈົ້າໃນການກວດສອບເນື້ອໃນ paraphrased.
3. ຮູບແບບການຈັດຮຽງຄໍາ
ຮູບແບບເຫຼົ່ານີ້ຈັດລຽງຄໍາສັບຫຼືປະໂຫຍກລະຫວ່າງສອງບົດເລື່ອງເພື່ອກໍານົດການຕິດຕໍ່ຂອງພວກເຂົາ. ໂດຍການປຽບທຽບພາກສ່ວນທີ່ສອດຄ່ອງກັນ, ທ່ານສາມາດກວດພົບການຖອດຂໍ້ຄວາມໂດຍອີງໃສ່ຄວາມຄ້າຍຄືກັນແລະຄວາມແຕກຕ່າງໃນລໍາດັບທີ່ກົງກັນ.
4. ການວິເຄາະ semantic
ວິທີການນີ້ກ່ຽວຂ້ອງກັບການວິເຄາະຄວາມຫມາຍແລະສະພາບການຂອງຄໍາສັບຕ່າງໆແລະປະໂຫຍກໃນບົດເລື່ອງຕ່າງໆ. ເຕັກນິກຕ່າງໆເຊັ່ນ: ການວິເຄາະທາງຄວາມຫມາຍ latent (LSA), ການຝັງຄໍາສັບ (ເຊັ່ນ: Word2Vec ຫຼື GloVe), ຫຼືແບບຈໍາລອງການຮຽນຮູ້ເລິກເຊັ່ນ BERT ສາມາດເກັບກໍາຄວາມສໍາພັນທາງຄວາມຫມາຍລະຫວ່າງຄໍາສັບຕ່າງໆແລະກໍານົດ paraphrasing ໂດຍອີງໃສ່ຄວາມຄ້າຍຄືກັນຂອງການເປັນຕົວແທນ semantic ຂອງເຂົາເຈົ້າ.
5. ການຮຽນຮູ້ເຄື່ອງຈັກ
ສູດການຄິດໄລ່ການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ມີການຄວບຄຸມເບິ່ງແຍງສາມາດໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນທີ່ມີປ້າຍຊື່ຂອງບົດເລື່ອງຄູ່ທີ່ຖອດຖອນໄດ້ ແລະບໍ່ມີການຖອດຂໍ້ຄວາມ. ແບບຈໍາລອງເຫຼົ່ານີ້ສາມາດຮຽນຮູ້ຮູບແບບ ແລະລັກສະນະຕ່າງໆທີ່ຈໍາແນກການຫຍໍ້ມາຈາກຂໍ້ຄວາມ ແລະສາມາດຖືກນໍາໃຊ້ເພື່ອຈໍາແນກຕົວຢ່າງໃຫມ່ຂອງຂໍ້ຄວາມເປັນ paraphrased ຫຼືບໍ່.
6. ການວິເຄາະ N-gram
N-grams ແມ່ນກຸ່ມຂອງຄໍາສັບຕ່າງໆທີ່ຢູ່ຂ້າງກັນ. ເມື່ອທ່ານກວດເບິ່ງວ່າກຸ່ມເຫຼົ່ານີ້ປາກົດຢູ່ໃນບົດເລື່ອງຕ່າງໆເລື້ອຍໆເທົ່າໃດແລະປຽບທຽບພວກມັນ, ທ່ານສາມາດຊອກຫາປະໂຫຍກທີ່ຄ້າຍຄືກັນຫຼືລໍາດັບ. ຖ້າມີຮູບແບບທີ່ຄ້າຍຄືກັນຫຼາຍ, ມັນອາດຈະຫມາຍຄວາມວ່າຂໍ້ຄວາມອາດຈະຖືກ paraphrased.
7. ໃກ້ການຊອກຄົ້ນຫາຊໍ້າກັນ
ວິທີສຸດທ້າຍທີ່ຜູ້ກວດສອບການລັກລອບກວດຫາການປຽບທຽບຢ່າງມີປະສິດທິພາບ.
ຂັ້ນຕອນການຊອກຄົ້ນຫາທີ່ໃກ້ຄຽງຊໍ້າກັນແມ່ນໃຊ້ເລື້ອຍໆໃນການກວດຫາການຖອດຂໍ້ຄວາມເພື່ອລະບຸພາກສ່ວນຂໍ້ຄວາມທີ່ສະແດງລະດັບຄວາມຄ້າຍຄືກັນສູງ ຫຼືເກືອບຄືກັນ. ສູດການຄິດໄລ່ເຫຼົ່ານີ້ແມ່ນຖືກສ້າງຂື້ນໂດຍສະເພາະເພື່ອຮັບຮູ້ເນື້ອໃນ paraphrased ໂດຍຜ່ານການປຽບທຽບຄວາມຄ້າຍຄືກັນຂອງຂໍ້ຄວາມໃນລະດັບລາຍລະອຽດ.
ວິທີການໃດທີ່ປົກກະຕິແລ້ວຖືກນໍາໃຊ້ໂດຍຊອບແວປ້ອງກັນ plagiarism?
ວິທີແກ້ໄຂທາງດ້ານເຕັກໂນໂລຢີທີ່ໃຊ້ໂດຍການບໍລິການປ້ອງກັນການລ່ວງລະເມີດແບບມືອາຊີບໂດຍປົກກະຕິແມ່ນອີງໃສ່ການວິເຄາະ n-gram. ໂດຍການໃຊ້ເຕັກໂນໂລຢີທີ່ໃຊ້ n-gram, ການບໍລິການເຫຼົ່ານີ້ບັນລຸອັດຕາຄວາມແມ່ນຍໍາສູງທີ່ໂດດເດັ່ນ. ນີ້ແມ່ນ ໜຶ່ງ ໃນວິທີທີ່ດີທີ່ສຸດທີ່ຜູ້ກວດກາການຫຼອກລວງກວດພົບການປຽບທຽບ, ເຮັດໃຫ້ການກໍານົດແລະການເນັ້ນໃສ່ຄໍາທີ່ແນ່ນອນທີ່ຖືກຂຽນຄືນໃຫມ່.
ກົນໄກຂອງວິທີການກວດສອບການລ່ວງລະເມີດສາມາດກວດພົບການປຽບທຽບ
ການບໍລິການປ້ອງກັນການລ່ວງລະເມີດໂດຍທົ່ວໄປແລ້ວໃຊ້ເຕັກນິກການພິມນີ້ວມືເພື່ອປຽບທຽບເອກະສານ. ນີ້ກ່ຽວຂ້ອງກັບການສະກັດເອົາ n-grams ທີ່ຈໍາເປັນຈາກເອກະສານທີ່ຈະກວດສອບແລະປຽບທຽບກັບ n-grams ຂອງເອກະສານທັງຫມົດໃນຖານຂໍ້ມູນຂອງພວກເຂົາ.
ຍົກຕົວຢ່າງ
ຂໍໃຫ້ເວົ້າວ່າມີປະໂຫຍກຫນຶ່ງ: « Le mont Olympe est la plus haute montagne de Grèce. »
ໄດ້ n-ກຼາມ (ຕົວຢ່າງ: 3 ກຣາມ) ຂອງປະໂຫຍກນີ້ຈະເປັນ:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- ແມ່ນຫຼາຍທີ່ສຸດ
- la plus haute
- ບວກກັບ haute montagne
- haute montagne de
- Montagne de Grèce
ກໍລະນີ 1. ການທົດແທນ
ຖ້າຄໍາຖືກແທນທີ່ດ້ວຍຄໍາອື່ນ, ຍັງມີບາງຄໍາ n-ກຼາມ ກົງກັນແລະມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການທົດແທນຄໍາໂດຍການວິເຄາະຕື່ມອີກ.
ການປ່ຽນແປງປະໂຫຍກ: "ໄດ້ ພູ Olympe est la plus haute montagne de Péloponnèse. »
ຕົ້ນສະບັບ 3 ກຣາມ | 3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ |
Le mont Olympe mont Olympe est Olympe est la ແມ່ນຫຼາຍທີ່ສຸດ la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce | Le ພູ Olympus ພູ Olympe est Olympe est la ແມ່ນຫຼາຍທີ່ສຸດ la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Péloponnèse |
ກໍລະນີ 2. ປ່ຽນແປງການຈັດລໍາດັບຂອງຄໍາສັບຕ່າງໆ (ຫຼືປະໂຫຍກ, ວັກ)
ໃນເວລາທີ່ຄໍາສັ່ງຂອງປະໂຫຍກໄດ້ຖືກປ່ຽນແປງ, ຍັງບາງ 3-grams ກົງກັນດັ່ງນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການປ່ຽນແປງ.
ການປ່ຽນແປງປະໂຫຍກ: « La plus haute montagne de Grèce est Le mont Olympe. »
ຕົ້ນສະບັບ 3 ກຣາມ | 3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ |
Le mont Olympe mont Olympe est Olympe est la ແມ່ນຫຼາຍທີ່ສຸດ la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce | La plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce de Grece est Grece est Le est Le mont Le mont Olympe |
ກໍລະນີ 3. ເພີ່ມຄໍາສັບໃຫມ່
ໃນເວລາທີ່ຄໍາສັບໃຫມ່ໄດ້ຖືກເພີ່ມ, ຍັງມີບາງ 3-grams ທີ່ກົງກັນດັ່ງນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການປ່ຽນແປງ.
ການປ່ຽນແປງປະໂຫຍກ: « Le mont Olympe est ຈາກໄກ la plus haute montagne de Grèce. »
ຕົ້ນສະບັບ 3 ກຣາມ | 3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ |
Le mont Olympe mont Olympe est Olympe est la ແມ່ນຫຼາຍທີ່ສຸດ la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de est de loin ໄກ loin la plus la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce |
ກໍລະນີ 4. ລົບບາງຄໍາ
ໃນເວລາທີ່ຄໍາສັບຖືກໂຍກຍ້າຍ, ຍັງມີບາງ 3-grams ທີ່ກົງກັນດັ່ງນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການປ່ຽນແປງ.
ການປ່ຽນແປງປະໂຫຍກ: « L'Olympe est la plus haute montagne de Grèce. »
ຕົ້ນສະບັບ 3 ກຣາມ | 3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ |
Le mont Olympe mont Olympe est Olympe est la ແມ່ນຫຼາຍທີ່ສຸດ la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce | L'Olympe est la ແມ່ນຫຼາຍທີ່ສຸດ la plus haute ບວກກັບ haute montagne haute montagne de Montagne de Grèce |
ຕົວຢ່າງທີ່ແທ້ຈິງໃນໂລກ
ເມື່ອສໍາເລັດການຢັ້ງຢືນໃນເອກະສານຕົວຈິງ, ພາກສ່ວນ paraphrased ມັກຈະຖືກກໍານົດໂດຍຜ່ານເຄື່ອງຫມາຍຂັດຂວາງ. ການຂັດຂວາງເຫຼົ່ານີ້, ຫມາຍເຖິງຄໍາສັບທີ່ມີການປ່ຽນແປງ, ແມ່ນເນັ້ນໃສ່ເພື່ອເພີ່ມການເບິ່ງເຫັນແລະຄວາມແຕກຕ່າງ.
ຂ້າງລຸ່ມນີ້, ທ່ານຈະພົບເຫັນຕົວຢ່າງຂອງເອກະສານຕົວຈິງ.
- excerpt ທໍາອິດແມ່ນມາຈາກໄຟລ໌ທີ່ໄດ້ຮັບການຢັ້ງຢືນໂດຍໃຊ້ OXSICO ການບໍລິການປ້ອງກັນ plagiarism:
- ບົດຄັດຫຍໍ້ທີສອງແມ່ນມາຈາກເອກະສານຕົ້ນສະບັບ:
ຫຼັງຈາກການວິເຄາະທີ່ເລິກເຊິ່ງ, ມັນເຫັນໄດ້ຊັດເຈນວ່າພາກສ່ວນທີ່ເລືອກຂອງເອກະສານໄດ້ຖືກ paraphrased ໂດຍການປ່ຽນແປງດັ່ງຕໍ່ໄປນີ້:
ຂໍ້ຄວາມຕົ້ນສະບັບ | ຂໍ້ຄວາມທີ່ຖອດຖອນໄດ້ | ການປ່ຽນແປງ |
ສະຫນັບສະຫນູນນະວັດກໍາແມ່ນມີລັກສະນະ | backs up ປະດິດສ້າງແມ່ນນອກຈາກນັ້ນກໍານົດ | ການທົດແທນ |
ຄວາມຮູ້ທາງດ້ານເສດຖະກິດ ແລະ ສັງຄົມ, ລະບົບປະສິດທິພາບ | ຄວາມຮັບຮູ້ດ້ານເສດຖະກິດແລະສັງຄົມ, ອົງການຈັດຕັ້ງປະສິດທິພາບ | ການທົດແທນ |
ຂໍ້ສະເຫນີ (ຄວາມຄິດ) | ຄໍາແນະນໍາ | ການທົດແທນ, ການລົບ |
ທັດສະນະຄະຕິ | postures | ການທົດແທນ |
ຄວາມສໍາເລັດ | ຜູ້ | ການທົດແທນ |
ຂະບວນການ (Perenc, Holub-Ivan | ຂະບວນການທາງດ້ານສະຕິປັນຍາ (Perenc, Holub – Ivan | ນອກຈາກນັ້ນ |
ສົ່ງເສີມນະວັດຕະກໍາ | ທີ່ເອື້ອອໍານວຍ | ການທົດແທນ |
ການສ້າງສະພາບອາກາດ | : ສ້າງເງື່ອນໄຂ | ການທົດແທນ |
ທີ່ເອື້ອອໍານວຍ | ຈະເລີນຮຸ່ງເຮືອງ | ການທົດແທນ |
ການພັດທະນາຄວາມຮູ້ | ຄວາມຮັບຮູ້ການພັດທະນາ | ການທົດແທນ |
ສະຫຼຸບ
ການຫຼອກລວງ, ທີ່ບໍ່ໄດ້ຮັບການກວດພົບເລື້ອຍໆໃນກໍລະນີຂອງການປຽບທຽບ, ຍັງຄົງເປັນຄວາມກັງວົນທີ່ສໍາຄັນໃນນັກວິຊາການ. ຄວາມກ້າວຫນ້າທາງດ້ານເທກໂນໂລຍີໄດ້ຕິດຕັ້ງເຄື່ອງກວດກາການລ່ວງລະເມີດທີ່ມີຄວາມສາມາດໃນການກໍານົດເນື້ອຫາທີ່ paraphrased ໄດ້ຢ່າງມີປະສິດທິພາບ. ໂດຍສະເພາະ, ຜູ້ກວດສອບການລ່ວງລະເມີດໄດ້ກວດພົບການປຽບທຽບຜ່ານວິທີການຕ່າງໆເຊັ່ນ: ການຈັບຄູ່ສະຕຣິງ, ຄວາມຄ້າຍຄືກັນຂອງ cosine, ແລະການວິເຄາະ n-gram. ໂດຍສະເພາະ, ການວິເຄາະ n-gram ໂດດເດັ່ນສໍາລັບອັດຕາຄວາມແມ່ນຍໍາສູງ. ຄວາມກ້າວຫນ້າເຫຼົ່ານີ້ຫຼຸດລົງຢ່າງຫຼວງຫຼາຍຄວາມເປັນໄປໄດ້ຂອງອຸປະກອນການ plagiarized ແລະ paraphrased ຈະບໍ່ຖືກກວດພົບ, ດັ່ງນັ້ນການເພີ່ມຄວາມຊື່ສັດທາງວິຊາການ. |