El plagi implica prendre el mèrit de les idees, paraules o imatges d'una altra persona, una pràctica considerada poc ètic en entorns acadèmics i professionals. Pot passar desapercebut pels estudiants que poden reformular accidentalment les paraules d'una altra persona sense una atribució adequada. Atès que les cometes no s'utilitzen quan es parafraseja alguna cosa, es pot escapar fàcilment de la comprensió d'un corrector i passar a l'esborrany final. Tanmateix, no és del tot inassolible, sobretot perquè els verificadors de plagi detecten la parafrasejada de manera més eficient avui dia.
Detectar parafrasejar pot ser una tasca difícil, ja que implica identificar semblances i diferències entre textos. En les seccions següents, aprofundirem en una discussió exhaustiva sobre mètodes i tècniques habituals emprats per discernir casos de parafraseig.
Com detecten els verificadors de plagi el parafraseig: s'han explorat mètodes adequats
En el panorama educatiu actual, els verificadors de plagi s'han avançat cada cop més i van més enllà de només marcar el text copiat per detectar també contingut parafrasejat. Aquest article explora els mètodes que permeten a aquestes eines identificar eficaçment el parafraseig.
1. Coincidència de cordes
Aquest mètode consisteix a comparar textos a nivell de caràcter o paraula per identificar coincidències exactes. Un alt grau de similitud en les seqüències de caràcters o les eleccions de paraules entre dos textos podria indicar una parafraseig. Aquestes eines utilitzen algorismes complexos que fins i tot poden considerar el significat contextual de les paraules, fent que cada cop sigui més difícil que el material plagiat i parafrasejat no es detecti.
2. Semblança del cosinus
La similitud de coseus és un dels mètodes pels quals els verificadors de plagi detecten parafrasejar. Mesura la similitud entre dos textos a partir de l'angle entre les seves representacions vectorials en un espai d'alta dimensió. En representar textos com a vectors de freqüències de paraules o incrustacions, aquestes eines poden calcular la puntuació de semblança del cosinus per refinar encara més la seva capacitat per detectar contingut parafrasejat.
3. Models d'alineació de paraules
Aquests models alineen paraules o frases entre dos textos per identificar-ne les correspondències. En comparar els segments alineats, podeu detectar el parafraseig basat en semblances i diferències en les seqüències coincidents.
4. Anàlisi semàntica
Aquest enfocament consisteix a analitzar el significat i el context de les paraules i frases dels textos. Tècniques com l'anàlisi semàntica latent (LSA), les incrustacions de paraules (com Word2Vec o GloVe) o els models d'aprenentatge profund com BERT poden capturar relacions semàntiques entre paraules i identificar parafrasejar basant-se en la semblança de les seves representacions semàntiques.
5. Aprenentatge automàtic
Els algorismes d'aprenentatge automàtic supervisat es poden entrenar en conjunts de dades etiquetats de parells de textos parafrasejats i no parafraseats. Aquests models poden aprendre patrons i característiques que distingeixen les paràfrasis i es poden utilitzar per classificar noves instàncies de text com a parafrasejats o no.
6. Anàlisi de N-grams
Els N-grams són grups de paraules que es troben una al costat de l'altra. Quan comproveu amb quina freqüència apareixen aquests grups en diferents textos i els compareu, podeu trobar frases o seqüències semblants. Si hi ha molts patrons semblants, podria significar que el text podria haver estat parafrasejat.
7. Detecció gairebé duplicada
L'última manera que els verificadors de plagi detecten el parafraseig de manera eficaç.
Els algorismes de detecció gairebé duplicats s'utilitzen amb freqüència en la detecció de parafraseig per identificar segments de text que mostren un alt grau de similitud o són gairebé idèntics. Aquests algorismes estan dissenyats específicament per reconèixer el contingut parafrasejat mitjançant la comparació de la semblança del text a un nivell detallat.
Quin mètode s'utilitza habitualment pel programari de prevenció del plagi?
Les solucions tecnològiques utilitzades pels serveis professionals de prevenció del plagi normalment es basen en l'anàlisi n-gram. Mitjançant l'aprofitament de la tecnologia basada en n-grams, aquests serveis aconsegueixen una taxa de precisió notablement alta. Aquesta és una de les millors maneres en què els verificadors de plagi detecten la parafrasejada, permetent la identificació i el ressaltat de les paraules exactes que s'han reescrit.
Mecànica de com els verificadors de plagi detecten parafrasejar
Els serveis de prevenció del plagi utilitzen habitualment la tècnica d'empremtes dactilars per comparar documents. Això implica extreure els n-grams necessaris dels documents a verificar i comparar-los amb els n-grams de tots els documents de les seves bases de dades.
exemple
Diguem que hi ha una frase: « Le mont Olympe est la plus haute montagne de Grèce. »
La n-grams (per exemple, 3 grams) d'aquesta frase serà:
- Le mont Olympe
- mont Olympe est
- Olympe est la
- és el més
- la plus haute
- muntanya més alta
- alta muntanya de
- muntanya de Grèce
Cas 1. Substitució
Si la paraula es substitueix per l'altra paraula, encara n'hi ha una part n-grams coincideixen i és possible detectar la substitució de paraules mitjançant una anàlisi posterior.
Frase canviada: "El muntanyes Olympe est la plus haute montagne de Peloponès. "
Original de 3 grams | 3 grams de text canviat |
Le mont Olympe mont Olympe est Olympe est la és el més la plus haute muntanya més alta alta muntanya de muntanya de Grèce | Le muntanyes Olimp muntanyes Olympe est Olympe est la és el més la plus haute muntanya més alta alta muntanya de Montagne de Peloponès |
Cas 2. S'ha canviat l'ordre de les paraules (o frases, paràgrafs)
Quan es canvia l'ordre de la frase, encara coincideixen alguns 3 grams, de manera que és possible detectar el canvi.
Frase canviada: « La plus haute montagne de Grèce est Le mont Olympe. »
Original de 3 grams | 3 grams de text canviat |
Le mont Olympe mont Olympe est Olympe est la és el més la plus haute muntanya més alta alta muntanya de muntanya de Grèce | La plus haute muntanya més alta alta muntanya de muntanya de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
Cas 3. S'han afegit paraules noves
Quan s'afegeixen les paraules noves, encara hi ha alguns 3 grams que coincideixen, de manera que és possible detectar el canvi.
Frase canviada: «Le mont Olympe est de lluny la plus haute montagne de Grèce. »
Original de 3 grams | 3 grams de text canviat |
Le mont Olympe mont Olympe est Olympe est la és el més la plus haute muntanya més alta alta muntanya de muntanya de Grèce | Le mont Olympe mont Olympe est Olympe est de est de llom lluny llom la plus la plus haute muntanya més alta alta muntanya de muntanya de Grèce |
Cas 4. S'han eliminat algunes paraules
Quan s'elimina la paraula, encara hi ha alguns 3 grams que coincideixen, de manera que és possible detectar el canvi.
Frase canviada: « L'Olympe est la plus haute montagne de Grèce. »
Original de 3 grams | 3 grams de text canviat |
Le mont Olympe mont Olympe est Olympe est la és el més la plus haute muntanya més alta alta muntanya de muntanya de Grèce | L'Olympe est la és el més la plus haute muntanya més alta alta muntanya de muntanya de Grèce |
Exemple del món real
Un cop finalitzada la verificació en un document real, les seccions parafrasejades sovint s'identifiquen mitjançant marques interrompudes. Aquestes interrupcions, que denoten paraules canviades, es destaquen per millorar la visibilitat i la distinció.
A continuació, trobareu un exemple d'un document real.
- El primer fragment prové d'un fitxer que s'ha verificat amb el fitxer OXSICO Servei de prevenció del plagi:
- El segon fragment és del document original original:
Després d'una anàlisi més profunda, és evident que la part seleccionada del document es va parafrasejar fent els canvis següents:
Text original | Text parafrasejat | Canvis |
també es caracteritza per donar suport a la innovació | recolza la innovació està a més definida | Reemplaçament |
coneixement econòmic i social, sistemes eficients | consciència econòmica i social, organització eficient | Reemplaçament |
propostes (idees) | recomanació | Substitució, supressió |
actituds | postures | Reemplaçament |
èxit | guanyador | Reemplaçament |
procés (Perenc, Holub-Ivan | procés cognitiu (Perenc, Holub – Ivan | Addició |
pro-innovació | favorable | Reemplaçament |
creant un clima | : creant una condició | Reemplaçament |
favorable | pròsper | Reemplaçament |
desenvolupament del coneixement | consciència del desenvolupament | Reemplaçament |
Conclusió
El plagi, que sovint no es detecta en casos de parafraseig, continua sent una preocupació important a l'àmbit acadèmic. Els avenços tecnològics han dotat als verificadors de plagi amb la capacitat d'identificar eficaçment el contingut parafrasejat. Concretament, els verificadors de plagi detecten el parafraseig mitjançant diversos mètodes com la concordança de cadenes, la similitud del cosinus i l'anàlisi de n-grams. En particular, l'anàlisi n-gram destaca per la seva alta precisió. Aquests avenços redueixen substancialment la probabilitat que el material plagiat i parafrasejat no es detecti, millorant així la integritat acadèmica. |