Plagioak beste norbaiten ideiak, hitzak edo irudiak aintzat hartzea dakar, praktika hau kontuan hartuta unethical ingurune akademiko eta profesionaletan. Oharkabean pasa dezakete ustekabean beste norbaiten hitzak behar bezala egotzi gabe birformula ditzaketen ikasleek. Zerbait parafraseatzen denean komatxoak erabiltzen ez direnez, zuzentzaile baten eskuetatik erraz ihes egin daiteke eta azken zirriborrora joan daiteke. Hala ere, ez da guztiz lortzezina, batez ere plagioaren egiaztatzaileek parafrasea eraginkorrago detektatzen dutelako gaur egun.
Parafrasea detektatzea erronka zaila izan daiteke, testuen arteko antzekotasunak eta desberdintasunak identifikatzea baitakar. Hurrengo ataletan, parafraseiaren kasuak hautemateko ohiko metodo eta teknikei buruzko eztabaida zabal batean sakonduko dugu.
Nola detektatzen dute plagio-zuzentzaileek parafrasea: metodo egokiak aztertu dira
Gaur egungo hezkuntza panoraman, plagioaren egiaztatzaileak gero eta aurreratuagoak izan dira, kopiatutako testuak markatzeaz haratago, parafraseatutako edukia ere detektatzeko. Artikulu honek tresna hauek parafrasea modu eraginkorrean identifikatzea ahalbidetzen duten metodoak aztertzen ditu.
1. Kateen parekatzea
Metodo honek testuak karaktere edo hitz mailan konparatzen ditu, bat-etortze zehatzak zehazteko. Bi testuen arteko karaktere-sekuentzietan edo hitz-aukeretan antzekotasun-maila handia izateak parafrasea adieraz dezake. Tresna hauek hitzen testuinguruaren esanahia ere kontuan har dezaketen algoritmo konplexuak erabiltzen dituzte, eta gero eta zailagoa da parafraseatutako material plagiatua detektatu gabe ez egotea.
2. Kosinuaren antzekotasuna
Kosinuaren antzekotasuna plagioaren egiaztaileek parafrasea detektatzeko metodoetako bat da. Bi testuen arteko antzekotasuna neurtzen du dimentsio handiko espazio batean beren irudikapen bektorialen arteko angeluaren arabera. Testuak hitzen maiztasunen edo txertaketen bektore gisa irudikatuz, tresna hauek kosinuaren antzekotasun puntuazioa kalkulatu dezakete parafraseatutako edukia detektatzeko gaitasuna gehiago fintzeko.
3. Hitzak lerrokatzeko ereduak
Eredu hauek bi testuen arteko hitzak edo esaldiak lerrokatzen dituzte haien korrespondentzia identifikatzeko. Lerrokaturiko segmentuak alderatuz, bat datozen sekuentzien antzekotasun eta desberdintasunetan oinarritutako parafrasea detekta dezakezu.
4. Analisi semantikoa
Ikuspegi honek testuetako hitzen eta esaldien esanahia eta testuingurua aztertzea dakar. Ezkutuko analisi semantikoa (LSA), hitzen barneratzeak (esaterako, Word2Vec edo GloVe) edo BERT bezalako ikaskuntza sakoneko ereduek hitzen arteko erlazio semantikoak atzeman ditzakete eta parafraseiak identifikatu ditzakete haien irudikapen semantikoen antzekotasunean oinarrituta.
5. Ikaskuntza automatikoa
Gainbegiraturiko ikaskuntza automatikoko algoritmoak parafraseatutako eta parafraseatu gabeko testu-pareen datu-multzo etiketatuetan entrena daitezke. Eredu hauek parafrasiak bereizten dituzten ereduak eta ezaugarriak ikas ditzakete eta testu-instantzia berriak parafraseatu edo ez sailkatzeko erabil daitezke.
6. N-gramen azterketa
N-gramak elkarren ondoan dauden hitz multzoak dira. Talde hauek testu ezberdinetan zenbat maiz agertzen diren egiaztatzen eta konparatzen dituzunean, antzeko esaldiak edo sekuentziak aurki ditzakezu. Antzeko eredu asko egonez gero, testua parafraseatu izana esan lezake.
7. Ia bikoiztuen detekzioa
Plagio-zuzentzaileek parafrasea modu eraginkorrean detektatzen duten azken modua.
Ia bikoiztuak detektatzeko algoritmoak erabiltzen dira maiz parafraseatzeko detekzioan antzekotasun maila handia erakusten duten edo ia berdinak diren testu-segmentuak zehazteko. Algoritmo hauek parafraseatutako edukia antzemateko bereziki landu dira, testuaren antzekotasunaren maila zehatzean konparatuz.
Zein metodo erabiltzen da normalean plagioa prebenitzeko softwareak?
Plagioaren prebentzio zerbitzu profesionalek erabiltzen dituzten soluzio teknologikoak normalean n-gramen analisian oinarritzen dira. N-grametan oinarritutako teknologia aprobetxatuz, zerbitzu hauek zehaztasun-tasa izugarri altua lortzen dute. Hau da plagio-egiaztapenek parafrasea detektatzeko modu onenetako bat, berridatzi diren hitz zehatzak identifikatu eta nabarmentzeko aukera ematen baitu.
Plagio-zuzentzaileek parafrasea detektatzeko moduaren mekanika
Plagioa prebenitzeko zerbitzuek hatz-markak ateratzeko teknika erabiltzen dute normalean dokumentuak alderatzeko. Honek egiaztatu beharreko dokumentuetatik beharrezko n-gramak atera eta haien datu-baseetako dokumentu guztien n-gramekin alderatzea dakar.
Adibidea
Demagun esaldi bat dagoela: «Le mont Olympe est la plus haute montagne de Grèce. »
The n-gramo (adibidez, 3 gramo) esaldi honen hau izango da:
- Le mont Olympe
- mont Olympe est
- Olympe da
- gehien da
- la plus haute
- mendirik altuena
- haute montagne de
- mendia de Grèce
1. kasua. Ordezkoa
Hitza beste hitzarekin ordezkatzen bada, oraindik batzuk n-gramo bat datoz eta posible da hitzaren ordezkapena detektatzeko azterketa gehiago eginez.
Esaldia aldatua: The mendiak Olympe est la plus haute montagne de Peloponesoa. "
Jatorrizko 3 gramo | 3 gramo aldatutako testua |
Le mont Olympe mont Olympe est Olympe da gehien da la plus haute mendirik altuena haute montagne de mendia de Grèce | Le mendiak Olympus mendiak Olympe est Olympe da gehien da la plus haute mendirik altuena haute montagne de Montagne de Peloponesoa |
2. kasua. Hitzen (edo esaldien, paragrafoen) ordena aldatu da
Esaldiaren ordena aldatzen denean, oraindik 3 gramo batzuk bat datoz, aldaketa detektatu ahal izateko.
Esaldia aldatua: «La plus haute montagne de Grèce est Le mont Olympe. »
Jatorrizko 3 gramo | 3 gramo aldatutako testua |
Le mont Olympe mont Olympe est Olympe da gehien da la plus haute mendirik altuena haute montagne de mendia de Grèce | La plus haute mendirik altuena haute montagne de mendia de Grèce de Grèce est Grèce est Le est Le mont Le mont Olympe |
3. kasua. Hitz berriak gehitu dira
Hitz berriak gehitzen direnean, oraindik 3 gramo batzuk bat datoz, aldaketa detektatu ahal izateko.
Esaldia aldatua: «Le mont Olympe est urrutitik la plus haute montagne de Grèce. »
Jatorrizko 3 gramo | 3 gramo aldatutako testua |
Le mont Olympe mont Olympe est Olympe da gehien da la plus haute mendirik altuena haute montagne de mendia de Grèce | Le mont Olympe mont Olympe est Olympe da est de loin urrun loin la plus la plus haute mendirik altuena haute montagne de mendia de Grèce |
4. kasua. Hitz batzuk ezabatu
Hitza kentzen denean, oraindik 3 gramo batzuk datoz bat, aldaketa detektatu ahal izateko.
Esaldia aldatua: «L'Olympe est la plus haute montagne de Grèce. »
Jatorrizko 3 gramo | 3 gramo aldatutako testua |
Le mont Olympe mont Olympe est Olympe da gehien da la plus haute mendirik altuena haute montagne de mendia de Grèce | L'Olympe da gehien da la plus haute mendirik altuena haute montagne de mendia de Grèce |
Benetako adibidea
Benetako dokumentu batean egiaztatzea amaitzean, parafraseatutako atalak etenetako marken bidez identifikatzen dira maiz. Eten hauek, hitz aldatuak adierazten dituztenak, nabarmentzen dira ikusgarritasuna eta bereizketa hobetzeko.
Jarraian, benetako dokumentu baten adibide bat aurkituko duzu.
- Lehenengo zatia erabiliz egiaztatu den fitxategi batetik dator OXSICO Plagioaren prebentzio zerbitzua:
- Bigarren zatia jatorrizko iturburu dokumentukoa da:
Azterketa sakonago baten ondoren, agerikoa da hautatutako dokumentuaren zatia aldaketa hauek eginez parafraseatu zela:
Jatorrizko testua | Testu parafraseatua | Aldaketak |
berrikuntzaren laguntza ere ezaugarritzen da | berrikuntza babesten du, gainera | Ordezko |
ezagutza ekonomiko eta sozialak, sistema eraginkorrak | kontzientzia ekonomikoa eta soziala, antolaketa eraginkorra | Ordezko |
proposamenak (ideiak) | gomendio | Ordezkatzea, ezabatzea |
jarrerak | postura | Ordezko |
arrakasta | irabazlea | Ordezko |
prozesua (Perenc, Holub-Ivan | prozesu kognitiboa (Perenc, Holub – Ivan | Gehiketa |
berrikuntzaren aldekoa | favorable | Ordezko |
klima bat sortzea | : baldintza bat sortzea | Ordezko |
favorable | oparoa | Ordezko |
ezagutza garatzea | garapenaren kontzientzia | Ordezko |
Ondorioa
Plagioak, parafrasei kasuetan sarritan detektatu gabe, kezka nabarmena izaten jarraitzen du akademian. Aurrerapen teknologikoek plagioaren egiaztaileek parafraseatutako edukia eraginkortasunez identifikatzeko gaitasunaz hornitu dute. Zehazki, plagio-egiaztapenek parafrasea detektatzen dute hainbat metodoren bidez, hala nola kateen parekatzea, kosinuaren antzekotasuna eta n-gramen analisia. Nabarmentzekoa, n-gramen analisia zehaztasun-tasa handiagatik nabarmentzen da. Aurrerapen horiek nabarmen murrizten dute plagiatutako eta parafraseatutako materiala detektatzeko probabilitatea, eta horrela osotasun akademikoa hobetzen dute. |