Les détecteurs d'IA, parfois appelés détecteurs d'écriture d'IA ou de contenu d'IA, servent à identifier si un texte a été partiellement ou entièrement composé par des outils d'intelligence artificielle tels que ChatGPT.
Ces détecteurs sont utiles pour identifier les cas où une pièce écrite est probablement créée par l'IA. L'application est bénéfique des manières suivantes :
- Authentifier le travail des étudiants. Les enseignants peuvent l'utiliser pour valider l'authenticité des devoirs et des projets d'écriture originaux des étudiants.
- Contrer les faux avis sur les produits. Les modérateurs peuvent l'utiliser pour identifier et traiter les avis sur des produits contrefaits qui visent à manipuler la perception des consommateurs.
- Lutter contre le contenu spam. Il aide à détecter et à supprimer diverses formes de contenu spam qui pourraient fausser la qualité et la crédibilité des plateformes en ligne.
Ces outils sont encore nouveaux et en cours de test, nous ne sommes donc pas tout à fait sûrs de leur fiabilité pour le moment. Dans les sections suivantes, nous nous penchons sur leur fonctionnement, vérifions dans quelle mesure on peut leur faire confiance et explorons une gamme d'applications pratiques qu'ils offrent.
Les établissements d'enseignement, y compris les universités, sont en train de formuler leurs positions concernant l'utilisation appropriée de ChatGPT et d'outils similaires. Il est essentiel de donner la priorité aux directives de votre établissement par rapport aux conseils que vous rencontrez en ligne. |
Comment fonctionnent les détecteurs IA ?
Les détecteurs d'IA utilisent généralement des modèles de langage qui ressemblent à ceux des outils d'écriture d'IA qu'ils essaient de trouver. Fondamentalement, le modèle de langage examine l'entrée et demande : "Est-ce que cela ressemble à quelque chose que j'aurais pu faire ?" S'il dit oui, le modèle suppose que le texte est probablement créé par l'IA.
En particulier, ces modèles recherchent deux caractéristiques dans un texte : « perplexité » et « rafale ». Lorsque ces deux aspects sont inférieurs, il y a une plus grande probabilité que le texte ait été généré par l'IA.
Cependant, que signifient exactement ces termes peu communs ?
Perplexité
La perplexité est une mesure importante utilisée pour évaluer la compétence des modèles linguistiques. Il fait référence à la capacité du modèle à prédire le mot suivant dans une séquence de mots.
Les modèles de langage d'IA visent à créer des textes avec une faible perplexité, ce qui se traduit par une cohérence, une fluidité et une prévisibilité accrues. En revanche, l'écriture humaine présente souvent une plus grande perplexité en raison de son utilisation d'options linguistiques plus imaginatives, bien qu'accompagnée d'une plus grande fréquence d'erreurs typographiques.
Les modèles de langage fonctionnent en prédisant quel mot viendrait naturellement ensuite dans une phrase et en l'insérant. Vous pouvez voir un exemple ci-dessous.
Exemple de suite | Perplexité |
Je n'ai pas pu finir le projet en dernier nuit. | Faible: Probablement la suite la plus probable |
Je n'ai pas pu finir le projet en dernier le temps que je ne bois pas de café le soir. | Faible à moyen : Moins probable, mais cela a un sens grammatical et logique |
Je n'ai pas pu terminer le projet le semestre dernier plusieurs fois à cause de mon manque de motivation à ce moment-là. | Moyen: La phrase est cohérente mais assez inhabituellement structurée et longue |
Je n'ai pas pu finir le projet en dernier heureux de vous rencontrer. | Haut: Grammaticalement incorrect et illogique |
Une faible perplexité est considérée comme la preuve qu'un texte est généré par l'IA.
Éclat
La « rafale » est une façon de voir comment les phrases sont différentes dans la façon dont elles sont assemblées et combien de temps elles durent. C'est un peu comme la perplexité mais pour des phrases entières au lieu de juste des mots.
Lorsqu'un texte contient principalement des phrases similaires dans la façon dont elles sont faites et dans leur longueur, il a une faible rafale. Cela signifie qu'il se lit plus facilement. Mais si un texte contient des phrases très différentes les unes des autres dans la façon dont elles sont construites et dans leur longueur, il a une forte rafale. Cela rend le texte moins stable et plus varié.
Le texte généré par l'IA a tendance à être moins variable dans ses modèles de phrases par rapport au texte écrit par l'homme. Au fur et à mesure que les modèles de langage devinent le mot qui est probablement le suivant, ils font généralement des phrases d'environ 10 à 20 mots et suivent des modèles réguliers. C'est pourquoi l'écriture de l'IA peut parfois sembler monotone.
Faible rafale indique qu'un texte est susceptible d'être généré par l'IA.
Une autre option à considérer : les filigranes
OpenAI, le créateur de ChatGPT, développerait une méthode appelée "watermarking". Ce système consiste à ajouter une marque invisible au texte produit par l'outil, qui peut ensuite être identifiée par un autre système pour confirmer l'origine IA du texte.
Cependant, ce système est toujours en cours de développement et les détails exacts de son fonctionnement ne sont pas encore révélés. De plus, il n'est pas clair si les filigranes suggérés resteront intacts lorsque des modifications seront apportées au texte généré.
Bien que l'idée d'utiliser ce concept pour détecter l'IA à l'avenir semble prometteuse, il est important de noter que les détails définitifs et les confirmations de sa mise en pratique sont toujours en attente. |
Quelle est la fiabilité des détecteurs IA ?
- Les détecteurs d'IA fonctionnent généralement efficacement, en particulier avec des textes plus longs, mais ils peuvent avoir des problèmes si le texte créé par l'IA est délibérément rendu moins attendu ou est modifié après sa création.
- Les détecteurs d'IA pourraient penser à tort que le texte écrit par des humains a en fait été créé par l'IA, surtout s'il remplit les conditions d'avoir une faible perplexité et une faible rafale.
- Les recherches sur les détecteurs d'IA indiquent qu'aucun outil ne peut fournir une précision complète ; la précision la plus élevée était de 84 % dans un outil premium ou de 68 % dans le meilleur outil gratuit.
- Ces outils offrent des informations précieuses sur la probabilité qu'un texte soit généré par l'IA, mais nous vous recommandons de ne pas vous fier uniquement à eux comme preuve. Avec les progrès continus des modèles de langage, les outils qui les détectent devront travailler plus dur pour suivre le rythme.
- Les fournisseurs les plus confiants admettent généralement que leurs outils ne peuvent pas servir de preuve concluante de texte généré par l'IA.
- Les universités, pour l'instant, n'ont pas une grande confiance dans ces outils.
Essayer de masquer l'écriture générée par l'IA peut en fait rendre le texte très étrange ou ne pas correspondre à l'usage auquel il est destiné. Par exemple, introduire intentionnellement des fautes d'orthographe ou utiliser des choix de mots illogiques dans le texte peut réduire les chances qu'il soit identifié par un détecteur d'IA. Cependant, un texte rempli de ces erreurs et de ces choix étranges ne sera probablement pas considéré comme une bonne écriture académique. |
Dans quel but les détecteurs d'IA sont-ils utilisés ?
Les détecteurs d'IA sont destinés aux personnes qui souhaitent vérifier si un texte a pu être créé par l'intelligence artificielle. Les personnes susceptibles de l'utiliser sont :
- Éducateurs et enseignants. Garantir l’authenticité des travaux des étudiants et prévenir le plagiat.
- Les étudiants vérifient leurs devoirs. Vérifier que leur contenu est unique et ne ressemble pas involontairement à du texte généré par l'IA.
- Éditeurs et rédacteurs examinant les soumissions. Vous voulez vous assurer qu’ils publient uniquement du contenu écrit par des humains.
- Des chercheurs. souhaitez détecter tout document ou article de recherche potentiellement généré par l'IA.
- Blogueurs et écrivains : Vous souhaitez publier du contenu généré par l'IA, mais craignez qu'il ne soit moins bien classé dans les moteurs de recherche s'il est reconnu comme écrit par l'IA.
- Professionnels de la modération de contenu. Identifier le spam généré par l'IA, les faux avis ou le contenu inapproprié.
- Entreprises garantissant un contenu marketing original. Vérifier que le matériel promotionnel n'est pas confondu avec du texte généré par l'IA, en maintenant la crédibilité de la marque.
En raison de soucis quant à leur fiabilité, de nombreux utilisateurs hésitent à dépendre complètement des détecteurs d'IA pour le moment. Cependant, ces détecteurs deviennent déjà plus populaires en tant que signe qu'un texte pourrait être généré par l'IA, en particulier lorsque l'utilisateur avait déjà des doutes. |
Détection manuelle du texte généré par l'IA
En plus d'utiliser des détecteurs d'IA, vous pouvez également apprendre à identifier vous-même les caractéristiques uniques de l'écriture d'IA. Ce n'est pas toujours facile de le faire de manière fiable - l'écriture humaine peut parfois sembler robotique, et l'écriture de l'IA devient de plus en plus humaine - mais avec de la pratique, vous pouvez développer un bon sens pour cela.
Les règles spécifiques que les détecteurs d'IA suivent, comme la faible perplexité et la rafale, peuvent sembler compliquées. Cependant, vous pouvez essayer de trouver ces traits vous-même en regardant le texte pour certains signes :
- Qui se lit de manière monotone, avec peu de variation dans la structure ou la longueur des phrases
- Utiliser des mots attendus et peu uniques, et avoir très peu d'éléments inattendus
Vous pouvez également utiliser des méthodes que les détecteurs d'IA n'utilisent pas, en faisant attention :
Méthodologie | Explication |
Excessive politesse | Les chatbots tels que ChatGPT sont conçus pour être des assistants utiles, ils utilisent donc souvent un langage poli et formel qui peut ne pas sembler très décontracté. |
Incohérence dans la voix | Si vous connaissez la façon dont quelqu'un écrit généralement (comme un étudiant), vous pouvez généralement remarquer quand quelque chose qu'il a écrit est assez différent de son style habituel. |
Langage de couverture | Faites attention s'il n'y a pas beaucoup d'idées fortes et fraîches, et notez également s'il y a une habitude d'utiliser des phrases qui montrent trop d'incertitude : « Il est important de noter que… » « X est largement considéré comme… » « X est considéré… » « Certaines personnes pourraient dire que… ». |
Revendications sans source ou mal citées | Lorsqu'il s'agit de rédaction académique, il est crucial de mentionner d'où vous avez obtenu vos informations. Cependant, les outils d'écriture d'IA ne suivent souvent pas cette règle ou font des erreurs (comme citer des sources qui n'existent pas ou qui ne sont pas pertinentes). |
Erreurs logiques | Même si l’écriture IA semble de mieux en mieux naturelle, parfois les idées qu’elle contient ne s’accordent pas bien. Faites attention aux endroits où le texte dit des choses qui ne correspondent pas, semblent improbables ou présentent des idées qui ne s'articulent pas facilement. |
Dans l'ensemble, expérimenter divers outils d'écriture d'IA, observer les types de textes qu'ils peuvent produire et se familiariser avec leur façon d'écrire peut vous aider à mieux repérer les textes qui pourraient avoir été créés par l'IA. |
Détecteurs d'images et de vidéos AI
Les générateurs d’images et de vidéos IA, particulièrement populaires comme DALL-E et Synthesia, peuvent créer des visuels réalistes et modifiés. Il est donc crucial d’identifier les « deepfakes » ou les images et vidéos créées par l’IA pour empêcher la propagation de fausses informations.
Actuellement, de nombreux signes peuvent révéler des images et des vidéos générées par l’IA, tels que :
- Des mains avec trop de doigts
- Des mouvements étranges
- Texte absurde dans l'image
- Des traits du visage irréalistes
Pourtant, il pourrait devenir plus difficile de repérer ces signes à mesure que l’IA s’améliore.
Il existe des outils conçus pour détecter ces visuels générés par l’IA, notamment :
- Logiciel profond
- FakeCatcher d'Intel
- illumination
On ne sait toujours pas exactement dans quelle mesure ces outils sont efficaces et fiables, des tests supplémentaires sont donc nécessaires.
L'évolution constante de la génération et de la détection d'images et de vidéos d'IA crée un besoin continu de développer des méthodes de détection plus solides et plus précises pour faire face aux risques potentiels associés aux deepfakes et aux visuels générés par l'IA.
Pour aller plus loin
Les détecteurs d'IA aident à identifier les textes générés par des outils comme ChatGPT. Ils recherchent principalement la « perplexité » et la « rafale » pour repérer le contenu créé par l’IA. Leur précision reste un sujet de préoccupation, même les meilleurs présentant des erreurs. À mesure que la technologie de l’IA progresse, il devient plus difficile de différencier les humains du contenu produit par l’IA, y compris les images et les vidéos, ce qui souligne la nécessité de rester prudent en ligne. |
Questions fréquemment posées
1. Quelle est la différence entre Détecteurs IA et Vérificateurs de plagiat? A: Les détecteurs d'IA et les vérificateurs de plagiat sont tous deux utilisés dans les universités pour dissuader la malhonnêteté académique, mais ils varient dans leurs méthodes et leurs objectifs : • Les détecteurs d'IA visent à identifier le texte ressemblant à la sortie d'outils d'écriture d'IA. Cela implique d'analyser des traits de texte comme la perplexité et la rafale, plutôt que de les comparer à une base de données. • Les vérificateurs de plagiat visent à détecter le texte copié à partir d'autres sources. Ils y parviennent en comparant le texte avec une vaste base de données de contenus et de thèses d'étudiants publiés précédemment, en identifiant les similitudes, sans s'appuyer sur l'analyse de traits de texte spécifiques. 2. Comment puis-je utiliser ChatGPT ? A: Pour utiliser ChatGPT, créez simplement un compte gratuit : • Suivre ce lien sur le site ChatGPT. • Sélectionnez « S'inscrire » et fournissez les informations requises (ou utilisez votre compte Google). L'inscription et l'utilisation de l'outil sont gratuites. • Tapez une invite dans la boîte de discussion pour commencer ! Une version iOS de l'application ChatGPT est actuellement accessible et une application Android est en préparation. L'application fonctionne de la même manière que le site Web et vous pouvez utiliser le même compte pour vous connecter sur les deux plates-formes. 3. Jusqu'à quand ChatGPT restera-t-il gratuit ? A: La disponibilité future de ChatGPT gratuitement reste incertaine, sans calendrier précis annoncé. L'outil a été initialement introduit en novembre 2022 en tant qu'« aperçu de recherche » à tester gratuitement par une large base d'utilisateurs. Le terme "aperçu" suggère des frais futurs potentiels, mais aucune confirmation officielle de la fin de l'accès gratuit n'existe. Une option améliorée, ChatGPT Plus, coûte 20 $/mois et comprend des fonctionnalités avancées comme GPT-4. Il n'est pas clair si cette version premium remplacera la version gratuite ou si cette dernière continuera. Des facteurs tels que les dépenses de serveur pourraient influencer cette décision. L'avenir reste incertain. 4. Puis-je inclure ChatGPT dans mes citations ? A: Dans certains contextes, il est approprié de faire référence à ChatGPT dans votre travail, en particulier lorsqu'il sert de source importante pour l'étude des modèles de langage d'IA. Certaines universités peuvent exiger une citation ou une reconnaissance si ChatGPT a aidé votre processus de recherche ou d'écriture, par exemple dans l'élaboration de questions de recherche ; il est conseillé de consulter les directives de votre établissement. Cependant, en raison de la fiabilité variable de ChatGPT et de son manque de crédibilité en tant que source, il est préférable de ne pas le citer pour des informations factuelles. Dans le style APA, vous pouvez traiter une réponse ChatGPT comme une communication personnelle puisque ses réponses ne sont pas accessibles aux autres. Dans le texte, citez-le comme suit : (ChatGPT, communication personnelle, 11 février 2023). |