ເຄື່ອງມືກວດຫາການລ່ວງລະເມີດ ກວດພົບການຖອດຂໍ້ຄວາມແນວໃດ?

how-do-plagiarism-checkers-detect-paraphrasing
()

ການຫຼອກລວງກ່ຽວຂ້ອງກັບການເອົາສິນເຊື່ອສໍາລັບຄວາມຄິດ, ຄໍາເວົ້າ, ຫຼືຮູບພາບຂອງຄົນອື່ນ, ເປັນການປະຕິບັດທີ່ພິຈາລະນາ ຜິດຈັນຍາບັນ ໃນສະພາບແວດລ້ອມທາງວິຊາການ ແລະວິຊາຊີບ. ມັນສາມາດຖືກສັງເກດເຫັນໂດຍນັກຮຽນຜູ້ທີ່ອາດຈະແປຄືນຄໍາເວົ້າຂອງຄົນອື່ນໂດຍບັງເອີນໂດຍບໍ່ໄດ້ລະບຸເຫດຜົນທີ່ເຫມາະສົມ. ເນື່ອງຈາກເຄື່ອງຫມາຍວົງຢືມບໍ່ໄດ້ຖືກນໍາໃຊ້ໃນເວລາທີ່ບາງສິ່ງບາງຢ່າງຖືກ paraphrased, ມັນໄດ້ຢ່າງງ່າຍດາຍສາມາດຫລົບຫນີຄວາມເຂົ້າໃຈຂອງ proofreader ແລະເຂົ້າໄປໃນຮ່າງສຸດທ້າຍ. ຢ່າງໃດກໍ່ຕາມ, ມັນບໍ່ແມ່ນສິ່ງທີ່ບໍ່ສາມາດບັນລຸໄດ້ທັງຫມົດ, ໂດຍສະເພາະນັບຕັ້ງແຕ່ຜູ້ກວດສອບ plagiarism ກວດພົບ paraphrasing ມີປະສິດທິພາບຫຼາຍຂຶ້ນໃນປັດຈຸບັນ.

ການກວດສອບການຖອດຂໍ້ຄວາມສາມາດເປັນວຽກທີ່ທ້າທາຍ, ຍ້ອນວ່າມັນກ່ຽວຂ້ອງກັບການກໍານົດຄວາມຄ້າຍຄືກັນແລະຄວາມແຕກຕ່າງລະຫວ່າງບົດເລື່ອງຕ່າງໆ. ໃນ​ພາກ​ສ່ວນ​ຕໍ່​ໄປ​, ພວກ​ເຮົາ​ຈະ delve ເຂົ້າ​ໄປ​ໃນ​ການ​ສົນ​ທະ​ນາ​ທີ່​ສົມ​ບູນ​ແບບ​ກ່ຽວ​ກັບ​ວິ​ທີ​ການ​ທົ່ວ​ໄປ​ແລະ​ເຕັກ​ນິກ​ການ​ນໍາ​ໃຊ້​ເພື່ອ​ແນມ​ເບິ່ງ​ຕົວ​ຢ່າງ​ຂອງ paraphrasing​.

ເຄື່ອງມືກວດຫາການລ່ວງລະເມີດ ກວດພົບການປຽບທຽບແນວໃດ: ວິທີການທີ່ເໝາະສົມໄດ້ຖືກສຳຫຼວດ

ໃນພູມສັນຖານດ້ານການສຶກສາຂອງທຸກມື້ນີ້, ເຄື່ອງມືກວດກາການລ່ວງລະເມີດໄດ້ກາຍເປັນຄວາມກ້າວຫນ້າທີ່ເພີ່ມຂຶ້ນ, ນອກເຫນືອຈາກພຽງແຕ່ການປັກທຸງຂໍ້ຄວາມທີ່ຄັດລອກໄປເພື່ອກວດພົບເນື້ອຫາທີ່ paraphrased. ບົດ​ຄວາມ​ນີ້​ຄົ້ນ​ຫາ​ວິ​ທີ​ການ​ອະ​ນຸ​ຍາດ​ໃຫ້​ເຄື່ອງ​ມື​ເຫຼົ່າ​ນີ້​ເພື່ອ​ກໍາ​ນົດ​ການ paraphrasing ປະ​ສິດ​ທິ​ຜົນ.

plagiarism-checkers-detect-paraphrasing

1. ການຈັບຄູ່ String

ວິທີການນີ້ກ່ຽວຂ້ອງກັບການປຽບທຽບບົດເລື່ອງໃນລະດັບຕົວອັກສອນຫຼືຄໍາສັບເພື່ອກໍານົດຄວາມກົງກັນທີ່ແນ່ນອນ. ລະດັບຄວາມຄ້າຍຄືກັນສູງໃນລໍາດັບຕົວອັກສອນຫຼືການເລືອກຄໍາສັບລະຫວ່າງສອງບົດເລື່ອງສາມາດສົ່ງສັນຍານການປຽບທຽບ. ເຄື່ອງມືເຫຼົ່ານີ້ໃຊ້ສູດການຄິດໄລ່ທີ່ຊັບຊ້ອນທີ່ຍັງສາມາດພິຈາລະນາຄວາມຫມາຍຂອງຄໍາສັບຕ່າງໆໄດ້, ເຮັດໃຫ້ມັນມີຄວາມຫຍຸ້ງຍາກຫຼາຍຂື້ນສໍາລັບອຸປະກອນການ plagiarized, paraphrased ກັບ undetected.

2. ຄວາມຄ້າຍຄືກັນຂອງ Cosine

ຄວາມຄ້າຍຄືກັນຂອງ Cosine ແມ່ນຫນຶ່ງໃນວິທີການທີ່ຕົວກວດສອບການລ່ວງລະເມີດສາມາດກວດພົບການປຽບທຽບ. ມັນວັດແທກຄວາມຄ້າຍຄືກັນລະຫວ່າງສອງບົດເລື່ອງໂດຍອີງໃສ່ມຸມລະຫວ່າງຕົວສະແດງ vector ຂອງພວກເຂົາໃນຊ່ອງທີ່ມີມິຕິລະດັບສູງ. ໂດຍການເປັນຕົວແທນຂອງບົດເລື່ອງຕ່າງໆເປັນ vectors ຂອງຄວາມຖີ່ຂອງຄໍາສັບຕ່າງໆຫຼືການຝັງ, ເຄື່ອງມືເຫຼົ່ານີ້ສາມາດຄິດໄລ່ຄະແນນຄວາມຄ້າຍຄືກັນຂອງ cosine ເພື່ອປັບປຸງຄວາມສາມາດຂອງເຂົາເຈົ້າໃນການກວດສອບເນື້ອໃນ paraphrased.

3. ຮູບແບບການຈັດຮຽງຄໍາ

ຮູບແບບເຫຼົ່ານີ້ຈັດລຽງຄໍາສັບຫຼືປະໂຫຍກລະຫວ່າງສອງບົດເລື່ອງເພື່ອກໍານົດການຕິດຕໍ່ຂອງພວກເຂົາ. ໂດຍການປຽບທຽບພາກສ່ວນທີ່ສອດຄ່ອງກັນ, ທ່ານສາມາດກວດພົບການຖອດຂໍ້ຄວາມໂດຍອີງໃສ່ຄວາມຄ້າຍຄືກັນແລະຄວາມແຕກຕ່າງໃນລໍາດັບທີ່ກົງກັນ.

4. ການວິເຄາະ semantic

ວິທີການນີ້ກ່ຽວຂ້ອງກັບການວິເຄາະຄວາມຫມາຍແລະສະພາບການຂອງຄໍາສັບຕ່າງໆແລະປະໂຫຍກໃນບົດເລື່ອງຕ່າງໆ. ເຕັກນິກຕ່າງໆເຊັ່ນ: ການວິເຄາະທາງຄວາມຫມາຍ latent (LSA), ການຝັງຄໍາສັບ (ເຊັ່ນ: Word2Vec ຫຼື GloVe), ຫຼືແບບຈໍາລອງການຮຽນຮູ້ເລິກເຊັ່ນ BERT ສາມາດເກັບກໍາຄວາມສໍາພັນທາງຄວາມຫມາຍລະຫວ່າງຄໍາສັບຕ່າງໆແລະກໍານົດ paraphrasing ໂດຍອີງໃສ່ຄວາມຄ້າຍຄືກັນຂອງການເປັນຕົວແທນ semantic ຂອງເຂົາເຈົ້າ.

5. ການຮຽນຮູ້ເຄື່ອງຈັກ

ສູດການຄິດໄລ່ການຮຽນຮູ້ຂອງເຄື່ອງຈັກທີ່ມີການຄວບຄຸມເບິ່ງແຍງສາມາດໄດ້ຮັບການຝຶກອົບຮົມກ່ຽວກັບຊຸດຂໍ້ມູນທີ່ມີປ້າຍຊື່ຂອງບົດເລື່ອງຄູ່ທີ່ຖອດຖອນໄດ້ ແລະບໍ່ມີການຖອດຂໍ້ຄວາມ. ແບບຈໍາລອງເຫຼົ່ານີ້ສາມາດຮຽນຮູ້ຮູບແບບ ແລະລັກສະນະຕ່າງໆທີ່ຈໍາແນກການຫຍໍ້ມາຈາກຂໍ້ຄວາມ ແລະສາມາດຖືກນໍາໃຊ້ເພື່ອຈໍາແນກຕົວຢ່າງໃຫມ່ຂອງຂໍ້ຄວາມເປັນ paraphrased ຫຼືບໍ່.

6. ການວິເຄາະ N-gram

N-grams ແມ່ນກຸ່ມຂອງຄໍາສັບຕ່າງໆທີ່ຢູ່ຂ້າງກັນ. ເມື່ອທ່ານກວດເບິ່ງວ່າກຸ່ມເຫຼົ່ານີ້ປາກົດຢູ່ໃນບົດເລື່ອງຕ່າງໆເລື້ອຍໆເທົ່າໃດແລະປຽບທຽບພວກມັນ, ທ່ານສາມາດຊອກຫາປະໂຫຍກທີ່ຄ້າຍຄືກັນຫຼືລໍາດັບ. ຖ້າມີຮູບແບບທີ່ຄ້າຍຄືກັນຫຼາຍ, ມັນອາດຈະຫມາຍຄວາມວ່າຂໍ້ຄວາມອາດຈະຖືກ paraphrased.

7. ໃກ້ການຊອກຄົ້ນຫາຊໍ້າກັນ

ວິທີສຸດທ້າຍທີ່ຜູ້ກວດສອບການລັກລອບກວດຫາການປຽບທຽບຢ່າງມີປະສິດທິພາບ.

ຂັ້ນຕອນການຊອກຄົ້ນຫາທີ່ໃກ້ຄຽງຊໍ້າກັນແມ່ນໃຊ້ເລື້ອຍໆໃນການກວດຫາການຖອດຂໍ້ຄວາມເພື່ອລະບຸພາກສ່ວນຂໍ້ຄວາມທີ່ສະແດງລະດັບຄວາມຄ້າຍຄືກັນສູງ ຫຼືເກືອບຄືກັນ. ສູດການຄິດໄລ່ເຫຼົ່ານີ້ແມ່ນຖືກສ້າງຂື້ນໂດຍສະເພາະເພື່ອຮັບຮູ້ເນື້ອໃນ paraphrased ໂດຍຜ່ານການປຽບທຽບຄວາມຄ້າຍຄືກັນຂອງຂໍ້ຄວາມໃນລະດັບລາຍລະອຽດ.

ວິທີການໃດທີ່ປົກກະຕິແລ້ວຖືກນໍາໃຊ້ໂດຍຊອບແວປ້ອງກັນ plagiarism?

ວິທີແກ້ໄຂທາງດ້ານເຕັກໂນໂລຢີທີ່ໃຊ້ໂດຍການບໍລິການປ້ອງກັນການລ່ວງລະເມີດແບບມືອາຊີບໂດຍປົກກະຕິແມ່ນອີງໃສ່ການວິເຄາະ n-gram. ໂດຍການໃຊ້ເຕັກໂນໂລຢີທີ່ໃຊ້ n-gram, ການບໍລິການເຫຼົ່ານີ້ບັນລຸອັດຕາຄວາມແມ່ນຍໍາສູງທີ່ໂດດເດັ່ນ. ນີ້ແມ່ນ ໜຶ່ງ ໃນວິທີທີ່ດີທີ່ສຸດທີ່ຜູ້ກວດກາການຫຼອກລວງກວດພົບການປຽບທຽບ, ເຮັດໃຫ້ການກໍານົດແລະການເນັ້ນໃສ່ຄໍາທີ່ແນ່ນອນທີ່ຖືກຂຽນຄືນໃຫມ່.

ກົນໄກຂອງວິທີການກວດສອບການລ່ວງລະເມີດສາມາດກວດພົບການປຽບທຽບ

ການບໍລິການປ້ອງກັນການລ່ວງລະເມີດໂດຍທົ່ວໄປແລ້ວໃຊ້ເຕັກນິກການພິມນີ້ວມືເພື່ອປຽບທຽບເອກະສານ. ນີ້ກ່ຽວຂ້ອງກັບການສະກັດເອົາ n-grams ທີ່ຈໍາເປັນຈາກເອກະສານທີ່ຈະກວດສອບແລະປຽບທຽບກັບ n-grams ຂອງເອກະສານທັງຫມົດໃນຖານຂໍ້ມູນຂອງພວກເຂົາ.

students-reading-how-do-plagiarism-checkers-detect-paraphrasing

ຍົກຕົວຢ່າງ

ຂໍໃຫ້ເວົ້າວ່າມີປະໂຫຍກຫນຶ່ງ: « Le mont Olympe est la plus haute montagne de Grèce. »

ໄດ້ n-ກຼາມ (ຕົວຢ່າງ: 3 ກຣາມ) ຂອງ​ປະ​ໂຫຍກ​ນີ້​ຈະ​ເປັນ​:

  • Le mont Olympe
  • mont Olympe est
  • Olympe est la
  • ແມ່ນຫຼາຍທີ່ສຸດ
  • la plus haute
  • ບວກກັບ haute montagne
  • haute montagne de
  • Montagne de Grèce

ກໍລະນີ 1. ການທົດແທນ

ຖ້າຄໍາຖືກແທນທີ່ດ້ວຍຄໍາອື່ນ, ຍັງມີບາງຄໍາ n-ກຼາມ ກົງກັນແລະມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການທົດແທນຄໍາໂດຍການວິເຄາະຕື່ມອີກ.

ການປ່ຽນແປງປະໂຫຍກ:  "ໄດ້ ພູ Olympe est la plus haute montagne de Péloponnèse. »

ຕົ້ນສະບັບ 3 ກຣາມ3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ
Le mont Olympe
mont Olympe est
Olympe est la
ແມ່ນຫຼາຍທີ່ສຸດ
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce
Le ພູ Olympus
ພູ Olympe est
Olympe est la
ແມ່ນຫຼາຍທີ່ສຸດ
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Péloponnèse

ກໍ​ລະ​ນີ 2. ປ່ຽນ​ແປງ​ການ​ຈັດ​ລໍາ​ດັບ​ຂອງ​ຄໍາ​ສັບ​ຕ່າງໆ (ຫຼື​ປະ​ໂຫຍກ​, ວັກ​)

ໃນເວລາທີ່ຄໍາສັ່ງຂອງປະໂຫຍກໄດ້ຖືກປ່ຽນແປງ, ຍັງບາງ 3-grams ກົງກັນດັ່ງນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການປ່ຽນແປງ.

ການປ່ຽນແປງປະໂຫຍກ: « La plus haute montagne de Grèce est Le mont Olympe. »

ຕົ້ນສະບັບ 3 ກຣາມ3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ
Le mont Olympe
mont Olympe est
Olympe est la
ແມ່ນຫຼາຍທີ່ສຸດ
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce
La plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce
de Grece est
Grece est Le
est Le mont
Le mont Olympe

ກໍລະນີ 3. ເພີ່ມຄໍາສັບໃຫມ່

ໃນເວລາທີ່ຄໍາສັບໃຫມ່ໄດ້ຖືກເພີ່ມ, ຍັງມີບາງ 3-grams ທີ່ກົງກັນດັ່ງນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການປ່ຽນແປງ.

ການປ່ຽນແປງປະໂຫຍກ: « Le mont Olympe est ຈາກ​ໄກ la plus haute montagne de Grèce. »

ຕົ້ນສະບັບ 3 ກຣາມ3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ
Le mont Olympe
mont Olympe est
Olympe est la
ແມ່ນຫຼາຍທີ່ສຸດ
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce
Le mont Olympe
mont Olympe est
Olympe est de
est de loin
ໄກ
loin la plus
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce

ກໍລະນີ 4. ລົບບາງຄໍາ

ໃນເວລາທີ່ຄໍາສັບຖືກໂຍກຍ້າຍ, ຍັງມີບາງ 3-grams ທີ່ກົງກັນດັ່ງນັ້ນມັນເປັນໄປໄດ້ທີ່ຈະກວດພົບການປ່ຽນແປງ.

ການປ່ຽນແປງປະໂຫຍກ: « L'Olympe est la plus haute montagne de Grèce. »

ຕົ້ນສະບັບ 3 ກຣາມ3 ກຣາມຂອງຂໍ້ຄວາມທີ່ມີການປ່ຽນແປງ
Le mont Olympe
mont Olympe est
Olympe est la
ແມ່ນຫຼາຍທີ່ສຸດ
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce
L'Olympe est la
ແມ່ນຫຼາຍທີ່ສຸດ
la plus haute
ບວກກັບ haute montagne
haute montagne de
Montagne de Grèce

ຕົວຢ່າງທີ່ແທ້ຈິງໃນໂລກ

ເມື່ອສໍາເລັດການຢັ້ງຢືນໃນເອກະສານຕົວຈິງ, ພາກສ່ວນ paraphrased ມັກຈະຖືກກໍານົດໂດຍຜ່ານເຄື່ອງຫມາຍຂັດຂວາງ. ການຂັດຂວາງເຫຼົ່ານີ້, ຫມາຍເຖິງຄໍາສັບທີ່ມີການປ່ຽນແປງ, ແມ່ນເນັ້ນໃສ່ເພື່ອເພີ່ມການເບິ່ງເຫັນແລະຄວາມແຕກຕ່າງ.

ຂ້າງລຸ່ມນີ້, ທ່ານຈະພົບເຫັນຕົວຢ່າງຂອງເອກະສານຕົວຈິງ.

  • excerpt ທໍາອິດແມ່ນມາຈາກໄຟລ໌ທີ່ໄດ້ຮັບການຢັ້ງຢືນໂດຍໃຊ້ OXSICO ການ​ບໍ​ລິ​ການ​ປ້ອງ​ກັນ plagiarism​:
  • ບົດຄັດຫຍໍ້ທີສອງແມ່ນມາຈາກເອກະສານຕົ້ນສະບັບ:
plagiarism - ບົດລາຍງານ

ຫຼັງຈາກການວິເຄາະທີ່ເລິກເຊິ່ງ, ມັນເຫັນໄດ້ຊັດເຈນວ່າພາກສ່ວນທີ່ເລືອກຂອງເອກະສານໄດ້ຖືກ paraphrased ໂດຍການປ່ຽນແປງດັ່ງຕໍ່ໄປນີ້:

ຂໍ້ຄວາມຕົ້ນສະບັບຂໍ້ຄວາມທີ່ຖອດຖອນໄດ້ການປ່ຽນແປງ
ສະຫນັບສະຫນູນນະວັດກໍາແມ່ນມີລັກສະນະ backs up ປະດິດສ້າງແມ່ນນອກຈາກນັ້ນກໍານົດການທົດແທນ
ຄວາມຮູ້ທາງດ້ານເສດຖະກິດ ແລະ ສັງຄົມ, ລະບົບປະສິດທິພາບ ຄວາມ​ຮັບ​ຮູ້​ດ້ານ​ເສດ​ຖະ​ກິດ​ແລະ​ສັງ​ຄົມ, ອົງ​ການ​ຈັດ​ຕັ້ງ​ປະ​ສິດ​ທິ​ພາບການທົດແທນ
ຂໍ້​ສະ​ເຫນີ (ຄວາມ​ຄິດ​)ຄໍາແນະນໍາການ​ທົດ​ແທນ​, ການ​ລົບ​
ທັດສະນະຄະຕິposturesການທົດແທນ
ຄວາມສໍາເລັດຜູ້ການທົດແທນ
ຂະບວນການ (Perenc, Holub-Ivanຂະບວນການທາງດ້ານສະຕິປັນຍາ (Perenc, Holub – Ivanນອກຈາກນັ້ນ
ສົ່ງເສີມນະວັດຕະກໍາທີ່ເອື້ອອໍານວຍການທົດແທນ
ການ​ສ້າງ​ສະ​ພາບ​ອາ​ກາດ​: ສ້າງເງື່ອນໄຂການທົດແທນ
ທີ່ເອື້ອອໍານວຍຈະເລີນຮຸ່ງເຮືອງການທົດແທນ
ການ​ພັດ​ທະ​ນາ​ຄວາມ​ຮູ້​ຄວາມ​ຮັບ​ຮູ້​ການ​ພັດ​ທະ​ນາ​ການທົດແທນ

ສະຫຼຸບ

ການຫຼອກລວງ, ທີ່ບໍ່ໄດ້ຮັບການກວດພົບເລື້ອຍໆໃນກໍລະນີຂອງການປຽບທຽບ, ຍັງຄົງເປັນຄວາມກັງວົນທີ່ສໍາຄັນໃນນັກວິຊາການ. ຄວາມກ້າວຫນ້າທາງດ້ານເທກໂນໂລຍີໄດ້ຕິດຕັ້ງເຄື່ອງກວດກາການລ່ວງລະເມີດທີ່ມີຄວາມສາມາດໃນການກໍານົດເນື້ອຫາທີ່ paraphrased ໄດ້ຢ່າງມີປະສິດທິພາບ. ໂດຍສະເພາະ, ຜູ້ກວດສອບການລ່ວງລະເມີດໄດ້ກວດພົບການປຽບທຽບຜ່ານວິທີການຕ່າງໆເຊັ່ນ: ການຈັບຄູ່ສະຕຣິງ, ຄວາມຄ້າຍຄືກັນຂອງ cosine, ແລະການວິເຄາະ n-gram. ໂດຍສະເພາະ, ການວິເຄາະ n-gram ໂດດເດັ່ນສໍາລັບອັດຕາຄວາມແມ່ນຍໍາສູງ. ຄວາມກ້າວຫນ້າເຫຼົ່ານີ້ຫຼຸດລົງຢ່າງຫຼວງຫຼາຍຄວາມເປັນໄປໄດ້ຂອງອຸປະກອນການ plagiarized ແລະ paraphrased ຈະບໍ່ຖືກກວດພົບ, ດັ່ງນັ້ນການເພີ່ມຄວາມຊື່ສັດທາງວິຊາການ.

ນີ້ມີປະໂຫຍດແນວໃດ?

ຄິກທີ່ດາວເພື່ອໃຫ້ຜະລິດແນນ!

ຜະລິດແນນເສລີ່ຍ / 5 Vote count:

ບໍ່ມີຄະແນນສຽງມາຮອດປະຈຸບັນ! ເປັນຜູ້ ທຳ ອິດທີ່ໃຫ້ຄະແນນຕໍ່ໄປນີ້.

ພວກເຮົາຂໍອະໄພທີ່ປ້າຍນີ້ບໍ່ມີປະໂຫຍດສໍາລັບທ່ານ!

ຂໍໃຫ້ເຮົາປັບປຸງບົດນີ້!

ບອກພວກເຮົາວ່າພວກເຮົາສາມາດປັບປຸງບົດຂຽນນີ້ໄດ້ແນວໃດ?