Plagiat innebär att ta åt sig äran för någon annans idéer, ord eller bilder, en praxis som övervägs oetisk i akademiska och professionella miljöer. Det kan gå obemärkt förbi för elever som av misstag kan formulera om någon annans ord utan korrekt tillskrivning. Eftersom citattecken inte används när något parafraseras, kan det lätt undkomma en korrekturläsares grepp och gå vidare till det slutliga utkastet. Det är dock inte helt ouppnåeligt, särskilt eftersom plagiatgranskare upptäcker parafrasering mer effektivt nuförtiden.
Att upptäcka parafrasering kan vara en utmanande uppgift, eftersom det handlar om att identifiera likheter och skillnader mellan texter. I de efterföljande avsnitten kommer vi att fördjupa oss i en omfattande diskussion om vanliga metoder och tekniker som används för att urskilja fall av parafrasering.
Hur upptäcker plagiatkontroller parafrasering: Lämpliga metoder utforskade
I dagens utbildningslandskap har plagiatkontroller blivit allt mer avancerade, och går längre än att bara flagga kopierad text till att även upptäcka omskrivet innehåll. Den här artikeln utforskar metoderna som gör det möjligt för dessa verktyg att effektivt identifiera parafrasering.
1. Strängmatchning
Denna metod innebär att jämföra texter på tecken- eller ordnivå för att hitta exakta matchningar. En hög grad av likhet i teckensekvenser eller ordval mellan två texter skulle kunna signalera parafrasering. Dessa verktyg använder komplexa algoritmer som till och med kan ta hänsyn till den kontextuella betydelsen av ord, vilket gör det allt svårare för plagierat, omskrivet material att förbli oupptäckt.
2. Cosinuslikhet
Cosinuslikhet är en av metoderna som plagiatkontrollanter upptäcker omskrivning. Den mäter likheten mellan två texter baserat på vinkeln mellan deras vektorrepresentationer i ett högdimensionellt utrymme. Genom att representera texter som vektorer av ordfrekvenser eller inbäddningar kan dessa verktyg beräkna cosinuslikhetspoängen för att ytterligare förfina deras förmåga att upptäcka omskrivet innehåll.
3. Ordjusteringsmodeller
Dessa modeller anpassar ord eller fraser mellan två texter för att identifiera deras överensstämmelse. Genom att jämföra de justerade segmenten kan du upptäcka parafrasering baserat på likheter och skillnader i de matchade sekvenserna.
4. Semantisk analys
Detta tillvägagångssätt innebär att man analyserar innebörden och sammanhanget för ord och fraser i texter. Tekniker som latent semantisk analys (LSA), ordinbäddningar (som Word2Vec eller GloVe) eller djupinlärningsmodeller som BERT kan fånga semantiska relationer mellan ord och identifiera omskrivningar baserat på likheten mellan deras semantiska representationer.
5. Maskininlärning
Övervakade maskininlärningsalgoritmer kan tränas på märkta datamängder av parafraserade och icke-parafraserade textpar. Dessa modeller kan lära sig mönster och funktioner som särskiljer parafraser och kan användas för att klassificera nya instanser av text som parafraserade eller inte.
6. N-gram analys
N-gram är grupper av ord som ligger precis bredvid varandra. När du kontrollerar hur ofta dessa grupper förekommer i olika texter och jämför dem, kan du hitta liknande fraser eller sekvenser. Om det finns många liknande mönster kan det betyda att texten kan ha parafraserats.
7. Nära dubblettdetektering
Det sista sättet som plagiatkontrollanter upptäcker parafrasering effektivt.
Algoritmer för detektering av nästan dubbletter används ofta för att parafrasera detektering för att lokalisera textsegment som uppvisar en hög grad av likhet eller är nästan identiska. Dessa algoritmer är speciellt framtagna för att känna igen parafraserat innehåll genom jämförelse av textlikhet på en detaljerad nivå.
Vilken metod används vanligtvis av programvara för förebyggande av plagiat?
Teknologiska lösningar som används av professionella tjänster för förebyggande av plagiat förlitar sig vanligtvis på n-gram-analys. Genom att utnyttja n-gram-baserad teknologi uppnår dessa tjänster en anmärkningsvärt hög precision. Detta är ett av de bästa sätten som plagiatkontrollanter upptäcker parafrasering, vilket möjliggör identifiering och framhävning av exakta ord som har skrivits om.
Mekanik för hur plagiatgranskare upptäcker parafrasering
Plagiatförebyggande tjänster använder vanligtvis fingeravtryckstekniken för att jämföra dokument. Det handlar om att extrahera nödvändiga n-gram från dokumenten som ska verifieras och jämföra dem med n-gram för alla dokument i deras databaser.
Exempelvis
Låt oss säga att det finns en mening: « Le mont Olympe est la plus haute montagne de Grèce. »
Smakämnen n-gram (till exempel 3 gram) av denna mening kommer att vara:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- är den mest
- la plus haute
- högsta berget
- haute montagne de
- Montagne de Grèce
Fall 1. Byte
Om ordet ersätts med det andra ordet, fortfarande några av n-gram matcha och det är möjligt att upptäcka ordersättningen genom ytterligare analys.
Ändrad mening: "The berg Olympe est la plus haute montagne de Peloponnesos. "
Original 3-gram | 3 gram ändrad text |
Le mont Olympe mont Olympe est Olympe est la är den mest la plus haute högsta berget haute montagne de Montagne de Grèce | Le berg Olympus berg Olympe est Olympe est la är den mest la plus haute högsta berget haute montagne de Montagne de Peloponnesos |
Fall 2. Ändrade ordningen på ord (eller meningar, stycken)
När meningen på meningen ändras, matchar fortfarande några 3-grams så att det är möjligt att upptäcka förändringen.
Ändrad mening: « La plus haute montagne de Grèce est Le mont Olympe. »
Original 3-gram | 3 gram ändrad text |
Le mont Olympe mont Olympe est Olympe est la är den mest la plus haute högsta berget haute montagne de Montagne de Grèce | La plus haute högsta berget haute montagne de Montagne de Grèce de Grèce est Grekland är Le est Le mont Le mont Olympe |
Fall 3. Lade till nya ord
När de nya orden läggs till finns det fortfarande några 3-gram som matchar så det går att upptäcka förändringen.
Ändrad mening: « Le mont Olympe est från avstånd la plus haute montagne de Grèce. »
Original 3-gram | 3 gram ändrad text |
Le mont Olympe mont Olympe est Olympe est la är den mest la plus haute högsta berget haute montagne de Montagne de Grèce | Le mont Olympe mont Olympe est Olympe est de är överlägset långt borta loin la plus la plus haute högsta berget haute montagne de Montagne de Grèce |
Fall 4. Raderade några ord
När ordet tas bort finns det fortfarande några 3-gram som matchar så det går att upptäcka förändringen.
Ändrad mening: « L'Olympe est la plus haute montagne de Grèce. »
Original 3-gram | 3 gram ändrad text |
Le mont Olympe mont Olympe est Olympe est la är den mest la plus haute högsta berget haute montagne de Montagne de Grèce | L'Olympe est la är den mest la plus haute högsta berget haute montagne de Montagne de Grèce |
Exempel i verkligheten
Efter avslutad verifiering i ett verkligt dokument identifieras ofta parafraserade avsnitt genom avbrutna markeringar. Dessa avbrott, som betecknar ändrade ord, är markerade för att öka synlighet och distinktion.
Nedan hittar du ett exempel på ett faktiskt dokument.
- Det första utdraget kommer från en fil som har verifierats med hjälp av OXSICO plagiatförebyggande tjänst:
- Det andra utdraget är från det ursprungliga källdokumentet:
Efter en djupare analys är det uppenbart att den valda delen av dokumentet parafraserades genom att göra följande ändringar:
Originaltext | Omskriven text | Förändringar |
stödjer innovation kännetecknas också | backar upp innovation är dessutom definierad | Byte |
ekonomisk och social kunskap, effektiva system | ekonomisk och samhällelig medvetenhet, effektiv organisation | Byte |
förslag (idéer) | rekommendation | Ersättning, radering |
inställning | ställningar | Byte |
framgång | vinnare | Byte |
process (Perenc, Holub-Ivan | kognitiv process (Perenc, Holub – Ivan | Dessutom |
pro-innovation | gynnsam | Byte |
skapa ett klimat | : skapa ett villkor | Byte |
gynnsam | välmående | Byte |
utveckla kunskap | utvecklingsmedvetenhet | Byte |
Slutsats
Plagiat, ofta oupptäckt i fall av parafrasering, är fortfarande ett stort problem inom den akademiska världen. Teknologiska framsteg har utrustat plagiatkontroller med förmågan att effektivt identifiera parafraserat innehåll. Specifikt upptäcker plagiatkontroller parafrasering genom olika metoder som strängmatchning, cosinuslikhet och n-gram-analys. Noterbart är att n-gram-analys utmärker sig för sin höga precisionshastighet. Dessa framsteg minskar avsevärt sannolikheten för att plagierat och parafraserat material förblir oupptäckt, vilket förbättrar den akademiska integriteten. |