כיצד בודקי גניבת עין מזהים פרפראזה?

איך-עושים גניבת דעת-בודקים-מזהים-פרפראזה
()

פלגיאט כרוך בלקיחת קרדיט על רעיונות, מילים או תמונות של מישהו אחר, תרגול נחשב לא מוסרי בסביבות אקדמיות ומקצועיות. זה יכול להיעלם מתלמידים שעלולים לנסח מחדש בטעות מילים של מישהו אחר ללא ייחוס מתאים. מכיוון שלא משתמשים במרכאות כאשר משהו מנוסח בפרפרזה, הוא יכול בקלות לחמוק מאחיזתו של מגיה ולהמשיך לטיוטה הסופית. עם זאת, זה לא לגמרי בלתי ניתן להשגה, במיוחד מכיוון שבודקי גניבת עין מזהים פרפרזה בצורה יעילה יותר בימינו.

זיהוי פרפרזה יכול להיות משימה מאתגרת, מכיוון שהיא כרוכה בזיהוי קווי דמיון והבדלים בין טקסטים. בסעיפים הבאים, נעמיק בדיון מקיף על שיטות וטכניקות נפוצות המשמשות כדי להבחין במקרים של פרפרזה.

כיצד בודקי גניבת עין מזהים פרפרזה: שיטות מתאימות נחקרו

בנוף החינוכי של ימינו, בודקי גניבת עין הפכו מתקדמים יותר ויותר, מעבר לסימון טקסט מועתק בלבד ועד לזיהוי תוכן בעל פרפרזה. מאמר זה בוחן את השיטות המאפשרות לכלים אלו לזהות ביעילות פרפרזה.

פלגיאט-בודקים-זהה-פרפרזה

1. התאמת מיתר

שיטה זו כוללת השוואת טקסטים ברמת התו או המילה כדי לאתר התאמות מדויקות. רמה גבוהה של דמיון ברצפי תווים או בבחירת מילים בין שני טקסטים יכולה לאותת על פרפרזה. כלים אלה משתמשים באלגוריתמים מורכבים שיכולים אפילו לשקול את המשמעות ההקשרית של מילים, מה שמקשה יותר ויותר על חומר גניבה ופרפראזה שלא יזוהה.

2. דמיון קוסינוס

דמיון קוסינוס הוא אחת השיטות שבהן בודקי גניבת עין מזהים פרפרזה. הוא מודד את הדמיון בין שני טקסטים בהתבסס על הזווית בין הייצוגים הווקטוריים שלהם במרחב בעל ממדים גבוהים. על ידי ייצוג טקסטים בתור וקטורים של תדרי מילים או הטמעות, כלים אלה יכולים לחשב את ציון הדמיון הקוסינוס כדי לחדד עוד יותר את יכולתם לזהות תוכן בפרפרזה.

3. מודלים של יישור מילים

מודלים אלה מיישרים מילים או ביטויים בין שני טקסטים כדי לזהות את התאמתם. על ידי השוואת המקטעים המיושרים, אתה יכול לזהות פרפרזה על סמך קווי דמיון והבדלים ברצפים התואמים.

4. ניתוח סמנטי

גישה זו כוללת ניתוח המשמעות וההקשר של מילים וביטויים בטקסטים. טכניקות כמו ניתוח סמנטי סמוי (LSA), הטבעת מילים (כגון Word2Vec או GloVe), או מודלים של למידה עמוקה כמו BERT יכולות ללכוד קשרים סמנטיים בין מילים ולזהות פרפרזה על סמך הדמיון של הייצוגים הסמנטיים שלהן.

5. למידה ממוחשבת

ניתן לאמן אלגוריתמים של למידת מכונה מפוקחת על מערכי נתונים מתויגים של צמדי טקסטים עם פרפרזה ולא פרפרזה. מודלים אלה יכולים ללמוד דפוסים ותכונות המבדילות בין פרפראזות וניתן להשתמש בהם כדי לסווג מופעים חדשים של טקסט כפרופרזה או לא.

6. ניתוח N-גרם

N-גרם הן קבוצות של מילים שנמצאות ממש אחת ליד השנייה. כאשר אתה בודק באיזו תדירות קבוצות אלו מופיעות בטקסטים שונים ומשווים ביניהן, תוכל למצוא ביטויים או רצפים דומים. אם יש הרבה דפוסים דומים, זה יכול להיות שאולי הטקסט עבר פרפרזה.

7. זיהוי כמעט כפילויות

הדרך האחרונה שבה בודקי גניבת עין מזהים פרפראזה ביעילות.

אלגוריתמי זיהוי כמעט כפולים משמשים לעתים קרובות בפרפרזה של זיהוי כדי לאתר קטעי טקסט המציגים רמה גבוהה של דמיון או שהם כמעט זהים. אלגוריתמים אלה נוצרו במיוחד כדי לזהות תוכן בפרפרזה באמצעות השוואה של דמיון טקסט ברמה מפורטת.

באיזו שיטה משתמשים בדרך כלל תוכנות למניעת פלגיאט?

פתרונות טכנולוגיים המשמשים את שירותי מניעת פלגיאט מקצועיים מסתמכים בדרך כלל על ניתוח n-gram. על ידי מינוף טכנולוגיה מבוססת n-gram, שירותים אלה משיגים קצב דיוק גבוה להפליא. זוהי אחת הדרכים הטובות ביותר שבהן בודק גניבת עין מזהה פרפראזה, המאפשרת זיהוי והדגשה של מילים מדויקות שנכתבו מחדש.

מכניקה של האופן שבו בודקי גניבת עין מזהים פרפרזה

שירותי מניעת פלגיאט משתמשים בדרך כלל בטכניקת טביעת אצבע כדי להשוות מסמכים. הדבר כרוך בחילוץ ה-n-גרם הדרושים מהמסמכים לאימות והשוואתם ל-n-גרם של כל המסמכים במאגרי המידע שלהם.

תלמידים-קוראים-איך-עושים פלגיאט-בודקים-מזהים-פרפראזה

דוגמה

נניח שיש משפט: « Le mont Olympe est la plus haute montagne de Grèce. »

השמיים n- גרם (למשל 3 גרם) של המשפט הזה יהיה:

  • לה מונט אולימפה
  • mont Olympe est
  • אולימפה אסט לה
  • זה הכי
  • la plus haute
  • בתוספת מונטניה עילית
  • haute montagne de
  • montagne de Grèce

מקרה 1. החלפה

אם המילה מוחלפת במילה השנייה, עדיין חלק מהמילה n- גרם התאמה ואפשר לזהות את החלפת המילה על ידי ניתוח נוסף.

משפט שונה:  "את הרים Olympe est la plus haute montagne de פלופונסוס. »

3 גרם מקורי3 גרם של טקסט שונה
לה מונט אולימפה
mont Olympe est
אולימפה אסט לה
זה הכי
la plus haute
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce
Le הרים אולימפוס
הרים Olympe est
אולימפה אסט לה
זה הכי
la plus haute
בתוספת מונטניה עילית
haute montagne de
מונטאן דה פלופונסוס

מקרה 2. שינה את סדר המילים (או משפטים, פסקאות)

כאשר סדר המשפט משתנה, עדיין כמה 3 גרם תואמים כך שניתן לזהות את השינוי.

משפט שונה: « La plus haute montagne de Grèce est Le mont Olympe. »

3 גרם מקורי3 גרם של טקסט שונה
לה מונט אולימפה
mont Olympe est
אולימפה אסט לה
זה הכי
la plus haute
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce
לה פלוס הוט
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce
de Grèce est
Grece est Le
est Le mont
לה מונט אולימפה

מקרה 3. נוספו מילים חדשות

כאשר המילים החדשות מתווספות, עדיין יש כמה 3 גרם שתואמות כך שניתן לזהות את השינוי.

משפט שונה: « Le mont Olympe est מרחוק la plus haute montagne de grèce. »

3 גרם מקורי3 גרם של טקסט שונה
לה מונט אולימפה
mont Olympe est
אולימפה אסט לה
זה הכי
la plus haute
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce
לה מונט אולימפה
mont Olympe est
Olympe est de
בהרבה
הרחק
loin la plus
la plus haute
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce

מקרה 4. נמחק כמה מילים

כאשר המילה מוסרת, עדיין יש כמה 3 גרם שתואמים כך שניתן לזהות את השינוי.

משפט שונה: « L'Olympe est la plus haute montagne de Grèce. »

3 גרם מקורי3 גרם של טקסט שונה
לה מונט אולימפה
mont Olympe est
אולימפה אסט לה
זה הכי
la plus haute
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce
ל'אולימפה אסט לה
זה הכי
la plus haute
בתוספת מונטניה עילית
haute montagne de
montagne de Grèce

דוגמא של העולם האמיתי

עם השלמת האימות במסמך בפועל, חלקים מפורשים מזוהים לעתים קרובות באמצעות סימונים קטועים. הפרעות אלו, המציינות מילים שהשתנו, מודגשות כדי לשפר את הנראות וההבחנה.

להלן תמצא דוגמה למסמך ממשי.

  • הקטע הראשון מגיע מקובץ שאומת באמצעות ה- OXSICO שירות למניעת פלגיאט:
  • הקטע השני הוא ממסמך המקור המקורי:
דיווח על פלגיאט

לאחר ניתוח מעמיק יותר ניכר כי החלק הנבחר במסמך עבר פרפרזה על ידי ביצוע השינויים הבאים:

טקסט מקוריטקסט מנוסחשינויים
תומך בחדשנות מאופיינת גם מגבה חדשנות הוא חוץ מזה מוגדרתחליף
ידע כלכלי וחברתי, מערכות יעילות מודעות כלכלית וחברתית, ארגון יעילתחליף
הצעות (רעיונות)המלצההחלפה, מחיקה
עמדותתנוחותתחליף
הצלחהזוכהתחליף
תהליך (Perenc, Holub-Ivanתהליך קוגניטיבי (Perenc, Holub – Ivanתוספת
פרו חדשנותחִיוּבִיתחליף
יצירת אקלים: יצירת תנאיתחליף
חִיוּבִימשגשגתתחליף
פיתוח ידעמודעות לפיתוחתחליף

סיכום

גניבת דעת, שלעתים קרובות לא מזוהה במקרים של פרפרזה, נותרה חשש משמעותי באקדמיה. ההתקדמות הטכנולוגית ציידה את בודקי הפלגיאט ביכולת לזהות ביעילות תוכן מפורפר. באופן ספציפי, בודקי גניבת עין מזהים פרפראזה באמצעות שיטות שונות כמו התאמת מחרוזות, דמיון קוסינוס וניתוח n-גרם. יש לציין כי ניתוח n-gram בולט בשיעור הדיוק הגבוה שלו. התקדמויות אלו מפחיתות באופן משמעותי את הסבירות שחומר גניבה ופרפרזה לא יזוהה, ובכך משפרים את היושרה האקדמית.

כמה שימושי היה זה פוסט?

לחץ על כוכב כדי לדרג אותו!

דירוג ממוצע / 5. ספירת קולות:

אין קולות עד כה! היה הראשון לדרג את הפוסט הזה.

אנו מצטערים שהפוסט הזה לא היה שימושי עבורך!

תנו לנו לשפר את הפוסט הזה!

ספר לנו כיצד נוכל לשפר את הפוסט הזה?