İntihal, başka birinin fikirlerinden, sözlerinden veya görsellerinden pay almayı içerir; bu, dikkate alınan bir uygulamadır. etik olmayan akademik ve profesyonel ortamlarda. Başka birinin sözlerini uygun bir şekilde atıfta bulunmadan kazara yeniden ifade eden öğrenciler tarafından fark edilmeyebilir. Bir şey başka sözcüklerle ifade edilirken tırnak işaretleri kullanılmadığından, düzeltmenlerin elinden kolayca kaçabilir ve son taslağa geçebilir. Bununla birlikte, özellikle intihal denetleyicilerinin günümüzde başka sözcüklerle ifade etmeyi daha verimli bir şekilde tespit etmesi nedeniyle, bu tamamen başarılamaz değildir.
Metinler arasındaki benzerlikleri ve farklılıkları tanımlamayı gerektirdiğinden, başka sözcüklerle ifade etmeyi tespit etmek zorlu bir görev olabilir. Sonraki bölümlerde, başka sözcüklerle ifade etme örneklerini ayırt etmek için kullanılan yaygın yöntem ve teknikler hakkında kapsamlı bir tartışmaya gireceğiz.
İntihal denetleyicileri başka kelimelerle ifade etmeyi nasıl tespit eder: Uygun yöntemler araştırıldı
Günümüzün eğitim ortamında, intihal denetleyicileri giderek daha da gelişmiş hale geldi; yalnızca kopyalanan metni işaretlemenin ötesine geçerek başka sözcüklerle yazılmış içeriği de tespit etmeye başladı. Bu makale, bu araçların başka sözcüklerle ifade etmeyi etkili bir şekilde tanımlamasına olanak tanıyan yöntemleri araştırıyor.
1. Dize eşleştirme
Bu yöntem, tam eşleşmeleri belirlemek için metinleri karakter veya kelime düzeyinde karşılaştırmayı içerir. İki metin arasındaki karakter dizileri veya kelime seçimlerindeki yüksek derecede benzerlik, başka sözcüklerle ifade etme sinyali verebilir. Bu araçlar, kelimelerin bağlamsal anlamlarını bile dikkate alabilen karmaşık algoritmalar kullanır; bu da intihal edilmiş, başka kelimelerle ifade edilmiş materyallerin tespit edilmemesini giderek zorlaştırır.
2. Kosinüs benzerliği
Kosinüs benzerliği, intihal denetleyicilerinin başka kelimelerle ifade etmeyi tespit etme yöntemlerinden biridir. İki metin arasındaki benzerliği, yüksek boyutlu uzaydaki vektör temsilleri arasındaki açıya göre ölçer. Bu araçlar, metinleri kelime frekansları veya yerleştirme vektörleri olarak temsil ederek, başka kelimelerle ifade edilen içeriği algılama yeteneklerini daha da geliştirmek için kosinüs benzerlik puanını hesaplayabilir.
3. Kelime hizalama modelleri
Bu modeller, karşılıklarını belirlemek için iki metin arasındaki kelimeleri veya cümleleri hizalar. Hizalanmış bölümleri karşılaştırarak, eşleşen dizilerdeki benzerliklere ve farklılıklara dayalı olarak başka sözcüklerle ifade etmeyi tespit edebilirsiniz.
4. Anlamsal analiz
Bu yaklaşım, metinlerdeki kelimelerin ve kelime öbeklerinin anlamını ve bağlamını analiz etmeyi içerir. Gizli semantik analiz (LSA), kelime yerleştirme (Word2Vec veya GloVe gibi) veya BERT gibi derin öğrenme modelleri gibi teknikler, kelimeler arasındaki anlamsal ilişkileri yakalayabilir ve anlamsal temsillerinin benzerliğine dayalı olarak yeniden ifade etmeyi belirleyebilir.
5. Makine öğrenme
Denetimli makine öğrenimi algoritmaları, başka sözcüklerle ifade edilmiş ve başka sözcüklerle ifade edilmemiş metin çiftlerinin etiketli veri kümeleri üzerinde eğitilebilir. Bu modeller, açıklamaları ayırt eden kalıpları ve özellikleri öğrenebilir ve yeni metin örneklerini başka sözcüklerle ifade edilmiş veya edilmemiş olarak sınıflandırmak için kullanılabilir.
6. N-gram analizi
N-gramlar yan yana olan kelime gruplarıdır. Bu grupların farklı metinlerde ne sıklıkta yer aldığını kontrol edip karşılaştırdığınızda benzer kelime öbekleri veya dizileri bulabilirsiniz. Çok sayıda benzer kalıp varsa bu, metnin başka kelimelerle ifade edilmiş olabileceği anlamına gelebilir.
7. Neredeyse kopya tespiti
İntihal denetleyicilerinin başka kelimelerle ifade etmeyi etkili bir şekilde tespit etmesinin son yolu.
Neredeyse kopya tespit algoritmaları, yüksek derecede benzerlik gösteren veya hemen hemen aynı olan metin bölümlerini belirlemek için başka sözcüklerle ifade tespitinde sıklıkla kullanılır. Bu algoritmalar, metin benzerliğini ayrıntılı bir düzeyde karşılaştırarak başka sözcüklerle ifade edilen içeriği tanımak için özel olarak tasarlanmıştır.
İntihal önleme yazılımları tarafından genellikle hangi yöntem kullanılır?
Profesyonel intihal önleme hizmetleri tarafından kullanılan teknolojik çözümler genellikle n-gram analizine dayanır. Bu hizmetler, n-gram tabanlı teknolojiden yararlanarak oldukça yüksek bir doğruluk oranına ulaşır. Bu, intihal denetleyicilerinin başka kelimelerle ifade etmeyi tespit etmesinin en iyi yollarından biridir ve yeniden yazılan kelimelerin tam olarak tanımlanmasına ve vurgulanmasına olanak tanır.
İntihal denetleyicilerinin başka kelimelerle ifade etmeyi nasıl tespit ettiğinin mekaniği
İntihal önleme hizmetleri, belgeleri karşılaştırmak için genellikle parmak izi alma tekniğini kullanır. Bu, doğrulanacak belgelerden gerekli n-gramların çıkarılmasını ve bunların veritabanlarındaki tüm belgelerin n-gramlarıyla karşılaştırılmasını içerir.
Örnek E-posta
Diyelim ki bir cümle var: « Le mont Olympe, Yunanistan'ın en yüksek dağlarından biridir. »
The n-gram (örneğin 3 gram) bu cümle şöyle olacak:
- Le mont Olympe
- dağ Olympe est
- Olimpiyat est la
- en çok
- la artı haute
- en yüksek dağ
- yüksek dağ manzarası
- montagne de grèce
Durum 1. Değiştirme
Sözcük diğer sözcükle değiştirilirse, yine de bazı n-gram eşleşir ve kelime değiştirmeyi daha fazla analizle tespit etmek mümkündür.
Değiştirilen cümle: " dağlar Olympe est la plus yüksek dağ Peloponez. "
Orijinal 3 gram | 3 gram değiştirilmiş metin |
Le mont Olympe dağ Olympe est Olimpiyat est la en çok la artı haute en yüksek dağ yüksek dağ manzarası montagne de grèce | Le dağlar Olimpos dağlar Olimpiyat est Olimpiyat est la en çok la artı haute en yüksek dağ yüksek dağ manzarası Montagne de Peloponez |
Durum 2. Kelimelerin (veya cümlelerin, paragrafların) sıralaması değiştirildi
Cümlenin sırası değiştirildiğinde hala 3 gramlık bir miktar eşleşiyor, dolayısıyla değişikliği tespit etmek mümkün oluyor.
Değiştirilen cümle: « La plus haute montagne de Grèce est Le mont Olympe. »
Orijinal 3 gram | 3 gram değiştirilmiş metin |
Le mont Olympe dağ Olympe est Olimpiyat est la en çok la artı haute en yüksek dağ yüksek dağ manzarası montagne de grèce | La artı yüksek en yüksek dağ yüksek dağ manzarası montagne de grèce Yunanistan est Grece est Le est Le mont Le mont Olympe |
Durum 3. Yeni kelimeler eklendi
Yeni kelimeler eklendiğinde, hala eşleşen 3-gram vardır, bu nedenle değişikliği tespit etmek mümkündür.
Değiştirilen cümle: « Le mont Olympe est uzaktan la plus haute montagne de Grèce. »
Orijinal 3 gram | 3 gram değiştirilmiş metin |
Le mont Olympe dağ Olympe est Olimpiyat est la en çok la artı haute en yüksek dağ yüksek dağ manzarası montagne de grèce | Le mont Olympe dağ Olympe est Olympe bu de belde uzak bel artı la artı haute en yüksek dağ yüksek dağ manzarası montagne de grèce |
Durum 4. Bazı kelimeler silindi
Sözcük çıkarıldığında, hâlâ eşleşen 3-gram vardır, bu nedenle değişikliği saptamak mümkündür.
Değiştirilen cümle: « L'Olympe, Yunanistan'ın en yüksek dağlarından biridir. »
Orijinal 3 gram | 3 gram değiştirilmiş metin |
Le mont Olympe dağ Olympe est Olimpiyat est la en çok la artı haute en yüksek dağ yüksek dağ manzarası montagne de grèce | L'Olympe est la en çok la artı haute en yüksek dağ yüksek dağ manzarası montagne de grèce |
Gerçek dünya örneği
Gerçek bir belgede doğrulama tamamlandıktan sonra, başka sözcüklerle ifade edilen bölümler genellikle kesintili işaretlemelerle tanımlanır. Değiştirilen sözcükleri ifade eden bu kesintiler, görünürlüğü ve ayrımı artırmak için vurgulanmıştır.
Aşağıda gerçek bir belgenin bir örneğini bulacaksınız.
- İlk alıntı, kullanılarak doğrulanan bir dosyadan gelir. OXSICO İntihal önleme hizmeti:
- İkinci alıntı orijinal kaynak belgedendir:
Daha derin bir analizden sonra, belgenin seçilen bölümünün aşağıdaki değişiklikler yapılarak yeniden ifade edildiği açıktır:
Orijinal metin | başka kelimelerle yazılmış metin | değişiklikler |
inovasyonu destekler ayrıca karakterize edilir | yedekler yenilik ayrıca tanımlanmıştır | Değiştirme |
ekonomik ve sosyal bilgi, verimli sistemler | ekonomik ve toplumsal bilinç, verimli organizasyon | Değiştirme |
teklifler (fikirler) | tavsiye | Değiştirme, silme |
tutumlar | duruşlar | Değiştirme |
başarı | kazanan | Değiştirme |
süreci (Perenc, Holub-Ivan | bilişsel süreç (Perenc, Holub – Ivan | Ek |
yenilik yanlısı | olumlu | Değiştirme |
bir iklim yaratmak | : bir koşul oluşturmak | Değiştirme |
olumlu | refah | Değiştirme |
bilgi geliştirme | geliştirme bilinci | Değiştirme |
Sonuç
Başka kelimelerle ifade etme durumlarında sıklıkla fark edilmeyen intihal, akademik dünyada önemli bir endişe kaynağı olmaya devam etmektedir. Teknolojik ilerlemeler, intihal denetleyicilerini başka kelimelerle ifade edilen içeriği etkili bir şekilde tanımlama becerisiyle donattı. Özellikle intihal denetleyicileri, dize eşleştirme, kosinüs benzerliği ve n-gram analizi gibi çeşitli yöntemlerle başka kelimelerle ifade etmeyi tespit eder. Özellikle n-gram analizi yüksek hassasiyet oranıyla dikkat çekiyor. Bu gelişmeler, çalıntı ve başka kelimelerle yazılmış materyallerin fark edilmeden kalma olasılığını önemli ölçüde azaltır ve böylece akademik bütünlüğü artırır. |