פלגיאט כרוך בלקיחת קרדיט על רעיונות, מילים או תמונות של מישהו אחר, תרגול נחשב לא מוסרי בסביבות אקדמיות ומקצועיות. זה יכול להיעלם מתלמידים שעלולים לנסח מחדש בטעות מילים של מישהו אחר ללא ייחוס מתאים. מכיוון שלא משתמשים במרכאות כאשר משהו מנוסח בפרפרזה, הוא יכול בקלות לחמוק מאחיזתו של מגיה ולהמשיך לטיוטה הסופית. עם זאת, זה לא לגמרי בלתי ניתן להשגה, במיוחד מכיוון שבודקי גניבת עין מזהים פרפרזה בצורה יעילה יותר בימינו.
זיהוי פרפרזה יכול להיות משימה מאתגרת, מכיוון שהיא כרוכה בזיהוי קווי דמיון והבדלים בין טקסטים. בסעיפים הבאים, נעמיק בדיון מקיף על שיטות וטכניקות נפוצות המשמשות כדי להבחין במקרים של פרפרזה.
כיצד בודקי גניבת עין מזהים פרפרזה: שיטות מתאימות נחקרו
בנוף החינוכי של ימינו, בודקי גניבת עין הפכו מתקדמים יותר ויותר, מעבר לסימון טקסט מועתק בלבד ועד לזיהוי תוכן בעל פרפרזה. מאמר זה בוחן את השיטות המאפשרות לכלים אלו לזהות ביעילות פרפרזה.
1. התאמת מיתר
שיטה זו כוללת השוואת טקסטים ברמת התו או המילה כדי לאתר התאמות מדויקות. רמה גבוהה של דמיון ברצפי תווים או בבחירת מילים בין שני טקסטים יכולה לאותת על פרפרזה. כלים אלה משתמשים באלגוריתמים מורכבים שיכולים אפילו לשקול את המשמעות ההקשרית של מילים, מה שמקשה יותר ויותר על חומר גניבה ופרפראזה שלא יזוהה.
2. דמיון קוסינוס
דמיון קוסינוס הוא אחת השיטות שבהן בודקי גניבת עין מזהים פרפרזה. הוא מודד את הדמיון בין שני טקסטים בהתבסס על הזווית בין הייצוגים הווקטוריים שלהם במרחב בעל ממדים גבוהים. על ידי ייצוג טקסטים בתור וקטורים של תדרי מילים או הטמעות, כלים אלה יכולים לחשב את ציון הדמיון הקוסינוס כדי לחדד עוד יותר את יכולתם לזהות תוכן בפרפרזה.
3. מודלים של יישור מילים
מודלים אלה מיישרים מילים או ביטויים בין שני טקסטים כדי לזהות את התאמתם. על ידי השוואת המקטעים המיושרים, אתה יכול לזהות פרפרזה על סמך קווי דמיון והבדלים ברצפים התואמים.
4. ניתוח סמנטי
גישה זו כוללת ניתוח המשמעות וההקשר של מילים וביטויים בטקסטים. טכניקות כמו ניתוח סמנטי סמוי (LSA), הטבעת מילים (כגון Word2Vec או GloVe), או מודלים של למידה עמוקה כמו BERT יכולות ללכוד קשרים סמנטיים בין מילים ולזהות פרפרזה על סמך הדמיון של הייצוגים הסמנטיים שלהן.
5. למידה ממוחשבת
ניתן לאמן אלגוריתמים של למידת מכונה מפוקחת על מערכי נתונים מתויגים של צמדי טקסטים עם פרפרזה ולא פרפרזה. מודלים אלה יכולים ללמוד דפוסים ותכונות המבדילות בין פרפראזות וניתן להשתמש בהם כדי לסווג מופעים חדשים של טקסט כפרופרזה או לא.
6. ניתוח N-גרם
N-גרם הן קבוצות של מילים שנמצאות ממש אחת ליד השנייה. כאשר אתה בודק באיזו תדירות קבוצות אלו מופיעות בטקסטים שונים ומשווים ביניהן, תוכל למצוא ביטויים או רצפים דומים. אם יש הרבה דפוסים דומים, זה יכול להיות שאולי הטקסט עבר פרפרזה.
7. זיהוי כמעט כפילויות
הדרך האחרונה שבה בודקי גניבת עין מזהים פרפראזה ביעילות.
אלגוריתמי זיהוי כמעט כפולים משמשים לעתים קרובות בפרפרזה של זיהוי כדי לאתר קטעי טקסט המציגים רמה גבוהה של דמיון או שהם כמעט זהים. אלגוריתמים אלה נוצרו במיוחד כדי לזהות תוכן בפרפרזה באמצעות השוואה של דמיון טקסט ברמה מפורטת.
באיזו שיטה משתמשים בדרך כלל תוכנות למניעת פלגיאט?
פתרונות טכנולוגיים המשמשים את שירותי מניעת פלגיאט מקצועיים מסתמכים בדרך כלל על ניתוח n-gram. על ידי מינוף טכנולוגיה מבוססת n-gram, שירותים אלה משיגים קצב דיוק גבוה להפליא. זוהי אחת הדרכים הטובות ביותר שבהן בודק גניבת עין מזהה פרפראזה, המאפשרת זיהוי והדגשה של מילים מדויקות שנכתבו מחדש.
מכניקה של האופן שבו בודקי גניבת עין מזהים פרפרזה
שירותי מניעת פלגיאט משתמשים בדרך כלל בטכניקת טביעת אצבע כדי להשוות מסמכים. הדבר כרוך בחילוץ ה-n-גרם הדרושים מהמסמכים לאימות והשוואתם ל-n-גרם של כל המסמכים במאגרי המידע שלהם.
דוגמה
נניח שיש משפט: « Le mont Olympe est la plus haute montagne de Grèce. »
השמיים n- גרם (למשל 3 גרם) של המשפט הזה יהיה:
- לה מונט אולימפה
- mont Olympe est
- אולימפה אסט לה
- זה הכי
- la plus haute
- בתוספת מונטניה עילית
- haute montagne de
- montagne de Grèce
מקרה 1. החלפה
אם המילה מוחלפת במילה השנייה, עדיין חלק מהמילה n- גרם התאמה ואפשר לזהות את החלפת המילה על ידי ניתוח נוסף.
משפט שונה: "את הרים Olympe est la plus haute montagne de פלופונסוס. »
3 גרם מקורי | 3 גרם של טקסט שונה |
לה מונט אולימפה mont Olympe est אולימפה אסט לה זה הכי la plus haute בתוספת מונטניה עילית haute montagne de montagne de Grèce | Le הרים אולימפוס הרים Olympe est אולימפה אסט לה זה הכי la plus haute בתוספת מונטניה עילית haute montagne de מונטאן דה פלופונסוס |
מקרה 2. שינה את סדר המילים (או משפטים, פסקאות)
כאשר סדר המשפט משתנה, עדיין כמה 3 גרם תואמים כך שניתן לזהות את השינוי.
משפט שונה: « La plus haute montagne de Grèce est Le mont Olympe. »
3 גרם מקורי | 3 גרם של טקסט שונה |
לה מונט אולימפה mont Olympe est אולימפה אסט לה זה הכי la plus haute בתוספת מונטניה עילית haute montagne de montagne de Grèce | לה פלוס הוט בתוספת מונטניה עילית haute montagne de montagne de Grèce de Grèce est Grece est Le est Le mont לה מונט אולימפה |
מקרה 3. נוספו מילים חדשות
כאשר המילים החדשות מתווספות, עדיין יש כמה 3 גרם שתואמות כך שניתן לזהות את השינוי.
משפט שונה: « Le mont Olympe est מרחוק la plus haute montagne de grèce. »
3 גרם מקורי | 3 גרם של טקסט שונה |
לה מונט אולימפה mont Olympe est אולימפה אסט לה זה הכי la plus haute בתוספת מונטניה עילית haute montagne de montagne de Grèce | לה מונט אולימפה mont Olympe est Olympe est de בהרבה הרחק loin la plus la plus haute בתוספת מונטניה עילית haute montagne de montagne de Grèce |
מקרה 4. נמחק כמה מילים
כאשר המילה מוסרת, עדיין יש כמה 3 גרם שתואמים כך שניתן לזהות את השינוי.
משפט שונה: « L'Olympe est la plus haute montagne de Grèce. »
3 גרם מקורי | 3 גרם של טקסט שונה |
לה מונט אולימפה mont Olympe est אולימפה אסט לה זה הכי la plus haute בתוספת מונטניה עילית haute montagne de montagne de Grèce | ל'אולימפה אסט לה זה הכי la plus haute בתוספת מונטניה עילית haute montagne de montagne de Grèce |
דוגמא של העולם האמיתי
עם השלמת האימות במסמך בפועל, חלקים מפורשים מזוהים לעתים קרובות באמצעות סימונים קטועים. הפרעות אלו, המציינות מילים שהשתנו, מודגשות כדי לשפר את הנראות וההבחנה.
להלן תמצא דוגמה למסמך ממשי.
- הקטע הראשון מגיע מקובץ שאומת באמצעות ה- OXSICO שירות למניעת פלגיאט:
- הקטע השני הוא ממסמך המקור המקורי:
לאחר ניתוח מעמיק יותר ניכר כי החלק הנבחר במסמך עבר פרפרזה על ידי ביצוע השינויים הבאים:
טקסט מקורי | טקסט מנוסח | שינויים |
תומך בחדשנות מאופיינת גם | מגבה חדשנות הוא חוץ מזה מוגדר | תחליף |
ידע כלכלי וחברתי, מערכות יעילות | מודעות כלכלית וחברתית, ארגון יעיל | תחליף |
הצעות (רעיונות) | המלצה | החלפה, מחיקה |
עמדות | תנוחות | תחליף |
הצלחה | זוכה | תחליף |
תהליך (Perenc, Holub-Ivan | תהליך קוגניטיבי (Perenc, Holub – Ivan | תוספת |
פרו חדשנות | חִיוּבִי | תחליף |
יצירת אקלים | : יצירת תנאי | תחליף |
חִיוּבִי | משגשגת | תחליף |
פיתוח ידע | מודעות לפיתוח | תחליף |
סיכום
גניבת דעת, שלעתים קרובות לא מזוהה במקרים של פרפרזה, נותרה חשש משמעותי באקדמיה. ההתקדמות הטכנולוגית ציידה את בודקי הפלגיאט ביכולת לזהות ביעילות תוכן מפורפר. באופן ספציפי, בודקי גניבת עין מזהים פרפראזה באמצעות שיטות שונות כמו התאמת מחרוזות, דמיון קוסינוס וניתוח n-גרם. יש לציין כי ניתוח n-gram בולט בשיעור הדיוק הגבוה שלו. התקדמויות אלו מפחיתות באופן משמעותי את הסבירות שחומר גניבה ופרפרזה לא יזוהה, ובכך משפרים את היושרה האקדמית. |