Plagiarisme melibatkan pengambilan penghargaan atas ide, kata-kata, atau gambar orang lain, sebuah praktik yang dipertimbangkan tidak etis dalam lingkungan akademis dan profesional. Hal ini dapat luput dari perhatian siswa yang mungkin secara tidak sengaja mengulangi kata-kata orang lain tanpa atribusi yang tepat. Karena tanda kutip tidak digunakan ketika sesuatu diparafrasekan, maka tanda kutip dapat dengan mudah lepas dari genggaman korektor dan berlanjut ke draf akhir. Namun, hal ini tidak sepenuhnya mustahil, terutama karena pemeriksa plagiarisme saat ini mendeteksi parafrase dengan lebih efisien.
Mendeteksi parafrase bisa menjadi tugas yang menantang, karena melibatkan identifikasi kesamaan dan perbedaan antara teks. Pada bagian selanjutnya, kita akan mempelajari diskusi komprehensif tentang metode dan teknik umum yang digunakan untuk membedakan contoh parafrase.
Bagaimana pemeriksa plagiarisme mendeteksi parafrase: Metode yang cocok dieksplorasi
Dalam lanskap pendidikan saat ini, pemeriksa plagiarisme menjadi semakin maju, melampaui hanya menandai teks yang disalin untuk juga mendeteksi konten yang diparafrasekan. Artikel ini mengeksplorasi metode yang memungkinkan alat ini mengidentifikasi parafrase secara efektif.
1. Pencocokan senar
Metode ini melibatkan perbandingan teks pada tingkat karakter atau kata untuk menentukan kecocokan yang tepat. Tingkat kemiripan yang tinggi dalam rangkaian karakter atau pilihan kata di antara dua teks dapat menandakan adanya parafrase. Alat-alat ini menggunakan algoritme kompleks yang bahkan dapat mempertimbangkan makna kontekstual dari kata-kata, sehingga semakin sulit bagi materi yang dijiplak dan diparafrasekan untuk tidak terdeteksi.
2. Kesamaan kosinus
Kesamaan kosinus adalah salah satu metode yang digunakan pemeriksa plagiarisme untuk mendeteksi parafrase. Ini mengukur kemiripan antara dua teks berdasarkan sudut antara representasi vektornya dalam ruang berdimensi tinggi. Dengan merepresentasikan teks sebagai vektor frekuensi kata atau penyematan, alat ini dapat menghitung skor kesamaan kosinus untuk lebih menyempurnakan kemampuannya dalam mendeteksi konten yang diparafrasekan.
3. Model penyelarasan kata
Model ini menyelaraskan kata atau frasa antara dua teks untuk mengidentifikasi korespondensinya. Dengan membandingkan segmen yang disejajarkan, Anda dapat mendeteksi parafrase berdasarkan persamaan dan perbedaan dalam urutan yang cocok.
4. Analisis semantik
Pendekatan ini melibatkan analisis makna dan konteks kata dan frasa dalam teks. Teknik seperti analisis semantik laten (LSA), penyematan kata (seperti Word2Vec atau GloVe), atau model pembelajaran mendalam seperti BERT dapat menangkap hubungan semantik antara kata dan mengidentifikasi parafrase berdasarkan kesamaan representasi semantiknya.
5. Pembelajaran mesin
Algoritme pembelajaran mesin yang diawasi dapat dilatih pada kumpulan data berlabel dari pasangan teks yang diparafrasekan dan tidak diparafrasekan. Model ini dapat mempelajari pola dan fitur yang membedakan parafrase dan dapat digunakan untuk mengklasifikasikan contoh teks baru sebagai diparafrasekan atau tidak.
6. Analisis N-gram
N-gram adalah kelompok kata yang letaknya bersebelahan. Saat Anda memeriksa seberapa sering kelompok ini muncul dalam teks yang berbeda dan membandingkannya, Anda dapat menemukan frasa atau urutan yang serupa. Jika terdapat banyak pola serupa, bisa jadi teks tersebut mungkin telah diparafrasekan.
7. Dekat deteksi duplikat
Cara terakhir pemeriksa plagiarisme mendeteksi parafrase secara efektif.
Algoritme deteksi hampir duplikat sering kali digunakan dalam deteksi parafrase untuk menunjukkan dengan tepat segmen teks yang menampilkan tingkat kemiripan yang tinggi atau hampir identik. Algoritme ini dibuat khusus untuk mengenali konten yang diparafrasekan melalui perbandingan kemiripan teks pada tingkat yang mendetail.
Metode apa yang biasanya digunakan oleh software pencegah plagiarisme?
Solusi teknologi yang digunakan oleh layanan pencegahan plagiarisme profesional biasanya mengandalkan analisis n-gram. Dengan memanfaatkan teknologi berbasis n-gram, layanan ini mencapai tingkat presisi yang sangat tinggi. Ini adalah salah satu cara terbaik bagi pemeriksa plagiarisme untuk mendeteksi parafrase, memungkinkan identifikasi dan penyorotan kata-kata persis yang telah ditulis ulang.
Mekanisme bagaimana pemeriksa plagiarisme mendeteksi parafrase
Layanan pencegahan plagiarisme umumnya menggunakan teknik sidik jari untuk membandingkan dokumen. Ini melibatkan penggalian n-gram yang diperlukan dari dokumen yang akan diverifikasi dan membandingkannya dengan n-gram semua dokumen di database mereka.
Example
Katakanlah ada kalimat: « Le mont Olympe est la plus haute montagne de Grèce. »
n-gram (misalnya 3 gram) dari kalimat ini menjadi:
- Le Mont Olympe
- mont Olympe est
- Olympe est la
- adalah yang paling
- la plus haute
- ditambah haute montagne
- haute montagne de
- montagne de Grece
Kasus 1. Penggantian
Jika kata itu diganti dengan kata lain, tetap sebagian n-gram cocok dan dimungkinkan untuk mendeteksi penggantian kata dengan analisis lebih lanjut.
Kalimat yang diubah: "The pegunungan Olympe est la plus haute montagne de Peloponnesos. »
Asli 3 gram | 3 gram teks yang diubah |
Le Mont Olympe mont Olympe est Olympe est la adalah yang paling la plus haute ditambah haute montagne haute montagne de montagne de Grece | Le pegunungan Olympus pegunungan Olimpiade est Olympe est la adalah yang paling la plus haute ditambah haute montagne haute montagne de Montagne de Peloponnesos |
Kasus 2. Mengubah urutan kata (atau kalimat, paragraf)
Ketika urutan kalimat diubah, masih ada 3 gram yang cocok sehingga memungkinkan untuk mendeteksi perubahan tersebut.
Kalimat yang diubah: « La plus haute montagne de Grèce adalah Le mont Olympe. »
Asli 3 gram | 3 gram teks yang diubah |
Le Mont Olympe mont Olympe est Olympe est la adalah yang paling la plus haute ditambah haute montagne haute montagne de montagne de Grece | La plus haute ditambah haute montagne haute montagne de montagne de Grece de Grece est Grece est Le itu Le mont Le Mont Olympe |
Kasus 3. Menambahkan kata-kata baru
Ketika kata-kata baru ditambahkan, masih ada beberapa 3 gram yang cocok sehingga memungkinkan untuk mendeteksi perubahannya.
Kalimat yang diubah: « Le Mont Olympe est dari jauh la plus haute montagne de Grèce. »
Asli 3 gram | 3 gram teks yang diubah |
Le Mont Olympe mont Olympe est Olympe est la adalah yang paling la plus haute ditambah haute montagne haute montagne de montagne de Grece | Le Mont Olympe mont Olympe est Olympia adalah de sejauh ini menjauh pinggang la plus la plus haute ditambah haute montagne haute montagne de montagne de Grece |
Kasus 4. Menghapus beberapa kata
Ketika kata tersebut dihilangkan, masih ada 3 gram yang cocok sehingga memungkinkan untuk mendeteksi perubahannya.
Kalimat yang diubah: « L'Olympe est la plus haute montagne de Grèce. »
Asli 3 gram | 3 gram teks yang diubah |
Le Mont Olympe mont Olympe est Olympe est la adalah yang paling la plus haute ditambah haute montagne haute montagne de montagne de Grece | L'Olympe est la adalah yang paling la plus haute ditambah haute montagne haute montagne de montagne de Grece |
Contoh dunia nyata
Setelah menyelesaikan verifikasi dalam dokumen yang sebenarnya, bagian yang diparafrasakan sering diidentifikasi melalui penandaan terputus. Interupsi ini, yang menunjukkan kata-kata yang diubah, disorot untuk meningkatkan visibilitas dan perbedaan.
Di bawah ini, Anda akan menemukan contoh dokumen sebenarnya.
- Kutipan pertama berasal dari file yang telah diverifikasi menggunakan OKSIKO layanan pencegahan plagiarisme:
- Kutipan kedua berasal dari dokumen sumber asli:
Setelah analisis yang lebih dalam, ternyata bagian yang dipilih dari dokumen itu diparafrasekan dengan melakukan perubahan berikut:
Babon | Teks parafrase | Perubahan |
mendukung inovasi juga ditandai | mendukung inovasi selain didefinisikan | Penggantian |
pengetahuan ekonomi dan sosial, sistem yang efisien | ekonomi dan kesadaran sosial, organisasi yang efisien | Penggantian |
proposal (ide) | rekomendasi | Penggantian, penghapusan |
sikap | postur tubuh | Penggantian |
sukses | pemenang | Penggantian |
proses (Perenc, Holub-Ivan | proses kognitif (Perenc, Holub – Ivan | Tambahan |
pro-inovasi | baik | Penggantian |
menciptakan iklim | : membuat kondisi | Penggantian |
baik | makmur | Penggantian |
mengembangkan pengetahuan | kesadaran pembangunan | Penggantian |
Kesimpulan
Plagiarisme, yang seringkali tidak terdeteksi dalam kasus parafrase, masih menjadi perhatian besar di dunia akademis. Kemajuan teknologi telah melengkapi pemeriksa plagiarisme dengan kemampuan untuk mengidentifikasi konten yang diparafrasekan secara efektif. Secara khusus, pemeriksa plagiarisme mendeteksi parafrase melalui berbagai metode seperti pencocokan string, kesamaan kosinus, dan analisis n-gram. Khususnya, analisis n-gram menonjol karena tingkat presisinya yang tinggi. Kemajuan ini secara signifikan mengurangi kemungkinan materi yang dijiplak dan diparafrasekan tidak terdeteksi, sehingga meningkatkan integritas akademik. |