mercredi 6 janvier 2010

* "LE RETOUR AU RÉEL" : CACHE-CACHE PLAGIAT

NOUVELLE VERSION DU BLOG : http://archeologie-copier-coller.com/

(version définitive : 1er février 2010)

Cette étude présente et évalue les moyens mis en œuvre pour rechercher les plagiats dans un résumé de thèse, un texte de moins de trois pages. Les difficultés rencontrées pour repérer les différentes formes de plagiat dans ce texte court, illustrent ici une partie des problèmes liés au plagiat dans les travaux universitaires et l'efficacité réelle, bien que très limitée, des logiciels anti-plagiat. Nous souhaitons aussi montrer que dans les cas de recherche de plagiats, il est important de dépasser la simple conviction, voire l'intime conviction, pour aller vers des preuves irréfutables.

Dans le cas d’un texte issu de plagiats, la recherche de ces plagiats est en quelque sorte un retour à la réalité du texte, d'où l'intitulé : Retour au réel. "Le retour au réel" était aussi l'intitulé du mémoire de DEA qui a permis à cet étudiant de s'inscrire en thèse.

Le texte soumis au logiciel Compilatio.net est le résumé d'une thèse: Genèse et actualisation hypermédiatique de schémas d'architecture à partir d'un hypercube, soutenue par un doctorant coréen à l’Université Paris 8, en juillet 2006 (mention "très bien").

Rédigé par le doctorant, le résumé de thèse doit selon le Guide de présentation d’une thèse à l’usage du candidat au doctorat, diffusé par la Direction de l'enseignement supérieur «être précis, significatif. Il doit permettre à celui qui le lit de voir comment la thèse est construite, comment le sujet est abordé. Dans les domaines Lettres, Sciences humaines et sociales et Sciences (…) Il doit permettre de repérer la thèse à partir du vocabulaire de l'auteur, en complément des mots-clefs. ».

Dans son mémoire de DEA, ce doctorant affichait déjà un goût immodéré pour le plagiat. Il est donc plausible que le résumé de sa thèse ne reflète pas son propre vocabulaire.

On trouvera le texte intégral de ce résumé de thèse à la fin de cet article.

LE SORT DES HURONS

Le logiciel anti-plagiat Compilatio.net auquel ce texte a été soumis a fait apparaître une série de séquences identiques.

Le premier signalement de Compilatio.net n'est pas vraiment pertinent : le logiciel dresse en effet la liste de 17 adresses web qui donnent accès à des documents contenant l'expression "Resume de la these de M." (une expression qui appartient d'ailleurs ici non pas au doctorant mais au service des thèses de l'Université). L'adresse n°1 renvoie à un procès en appel devant la Cour suprême du Canada sur le sort des Hurons. L'adresse n°2, au résumé de la thèse de M. Julien Donnot sur "la latéralisation hémisphérique des émotions dans la latéralisation des attitudes posturales des adultes avec les jeunes enfants". Le reste est à l'avenant...

L'anomalie de ce signalement vient aussi de ce qu'il est basé sur une séquence de 6 mots — nombre de mots inférieur à celui de la séquence type sur laquelle semble travailler le logiciel Compilatio.net.

UN PLAGIAT DE PLAGIAT

D'autres signalements sont plus intéressants. Nous donnons ci-dessous les deux seuls paragraphes (qui se suivent aussi dans le résumé de thèse étudié) dans lesquels Compilatio.net a inscrit en rouge les séquences repérées comme étant identiques à des séquences trouvées sur Internet :

Aujourd'hui, notre environnement est construit selon des réseaux de perceptions qui sont dans une relation d'interdépendance avec les TIC. Celles-ci ne sont plus considérées comme un objet étranger à nous même, mais comme une extension de notre appareil sensoriel, déterminant non seulement la manière de véhiculer l'information, mais également la manière de percevoir et de comprendre notre environnement.

En ce qui concerne la vision, la perspective se situe au niveau de la science, de la culture humaniste et de la pratique artistique, échappant ainsi à un traitement conceptuel univoque. Dans son acceptation technique, le terme moderne de perspective désigne un système particulier de projection, sur un plan bidimensionnel, des objets à trois dimensions et de leurs divers rapports spatiaux, de telle sorte que la vision de l'image représentée corresponde à la vision des objets dans l'espace ce qui en privilégie l'aspect géométrique et mathématique.

Le logiciel nous renvoie pour le bloc de texte en gras rouge à l'adresse web de, selon Compilatio.net, la "Top des sources probables - Parmi 38 sources probables" ou encore la "Source principale". Il s'agit d'un site qui abrite les travaux d'élèves de l'école Saint-Michel de Bruxelles réalisés entre janvier et mars 2001. Cette page, titrée "Dimensions et perspectives", plagie la partie en ligne et en libre accès de l'article "Perspective" de l'Encyclopédie Universalis. La source de l'emprunt est cependant explicitement signalée dans une bibliographie sommaire située en dernière page du site de l'école Saint-Michel (cette seule mention n'absout pas les adolescents d'un emprunt qui reste un plagiat).

À la suite de la mention de cette source belge, "Top des sources probables", Compilatio.net cite de nombreuses autres "sources probables". L'essentiel de ces adresses web sont des variantes qui convergent vers l'article "Perspective", déjà évoqué, de l'Encyclopédie Universalis. L'encyclopédie cite l'auteur : Marisa Dalai-Emiliani.

Il paraîtrait logique de penser que le plagiat commis par le doctorant l'a été depuis la version originale du texte (Universalis) plutôt que de la version "Saint-Michel", celle des adolescents bruxellois. Comparons donc les 3 versions, la version originale de l'encyclopédie et les 2 autres, en tout état de cause 2 plagiats.

Pour faciliter la lecture des résultats de cette comparaison, nous avons inscrit en rouge, les textes identiques repérés par Compilatio.net; en violet, d'autres séquences identiques qui n'ont pas été repérées par le logiciel et enfin en orange les formes paraphrasiques que Compilatio.net ne pouvait, par nature, repérer, mais qui font pourtant aussi partie du plagiat.

Résumé de thèse du doctorant :

En ce qui concerne la vision, la perspective se situe au niveau de la science, de la culture humaniste et de la pratique artistique, échappant ainsi à un traitement conceptuel univoque. Dans son acceptation technique, le terme moderne de perspective désigne un système particulier de projection, sur un plan bidimensionnel, des objets à trois dimensions et de leurs divers rapports spatiaux, de telle sorte que la vision de l'image représentée corresponde à la vision des objets dans l'espace, ce qui en privilégie l'aspect géométrique et mathématique.

Version "Saint-Michel" ("Top des sources probables") :

La perspective se situe au carrefour de la science, de la culture humaniste et de la pratique artistique, échappant ainsi à un traitement conceptuel univoque. Dans son acceptation technique, le terme moderne de perspective désigne un système particulier de projection, sur un plan bidimensionnel, des objets à trois dimensions et de leurs divers rapports spatiaux, de telle sorte que la vision de l'image représentée corresponde à la vision des objets dans l'espace, ceci privilégie l'aspect géométrique et mathématique de la perspective.

Version originale (article de l'Encyclopédie Universalis) :

Par sa situation au carrefour de la science, de la culture humaniste , et de la pratique artistique, la perspective , comme tout autre thème interdisciplinaire, échappe à un traitement conceptuel univoque. Dans son acceptation technique, le terme moderne de perspective désigne un système particulier de projection, sur un plan bidimensionnel, des objets à trois dimensions et de leurs divers rapports spatiaux, de telle sorte que la vision de l'image représentée corresponde à la vision des objets dans l'espace. Mais une telle définition privilégie l'aspect géométrique et mathématique de la géométrie.

En réalité, l'analyse du détail des résultats affichés par Compilatio.net (rubrique Passages des résultats du logiciel), révèle que le bloc de texte pour lequel ce logiciel renvoie à la version "Saint-Michel" est formé de 4 séquences consécutives du résumé de thèse.

a : "de la pratique artistique, échappant ainsi à un traitement conceptuel" (60 signes hors espaces, 59 signes sans compter la ponctuation, 10 mots)

b : "Dans son acceptation technique, le terme moderne de perspective désigne" (62/61/10)

c : "un système particulier de projection, sur un plan bidimensionnel, des" (68/66/10)

d : "objets à trois dimensions et de leurs divers rapports spatiaux," (62/61/10)

Ces séquences (leur point commun est de contenir 10 mots) sont analysées dans un premier temps indépendamment l'une de l'autre par Compilatio.net. Pour chaque séquence, Compilatio.net donne la liste des adresses des sites sur lesquels on les retrouve à l'identique. Dans un second temps, dans le cas d'une série de séquences consécutives repérées sur Internet, Compilatio cite, pour le texte formé de ces séquences l'adresse URL ou les adresses communes à l'ensemble des séquences. C'est l'URL de la "Top des sources probables" ou "source principale".

Comme l'affichent les résultats de Compilatio.net, on retrouve à l'identique les séquences "b", "c" et "d" aussi bien dans la version Saint-Michel que dans la version originale Universalis. Par contre, on peut effectivement vérifier en accord avec les résultats de Compilatio.net que la séquence "a" reprend une séquence identique de la version Saint-Michel, alors que cette séquence n'existe pas, en l'état, dans la version originale de l'article "Perspective" de l'Universalis. Ceci est bien, comme l'avance le logiciel, sinon une preuve absolue, du moins un indice très sérieux que le plagiat du doctorant s'est fait à partir de la version, elle-même plagiée sur l'Encyclopédie Universalis, de l'école Saint-Michel.

SUR LA PISTE DES PARAPHRASES

Dans le premier des 2 paragraphes où Compilatio.net avait repéré des séquences identiques, seule la séquence suivante, apparaissait : la manière de percevoir et de comprendre notre environnement. Dans ses résultats, Compilatio.net associait 7 URL qui convergeaient vers deux occurences de cette séquence.

Comparons à présent les 3 paragraphes associés aux 3 occurences de cette séquence, celle du résumé de thèse et les deux autres occurences des textes auxquels Compilatio nous a conduit :

Résumé de la thèse :

Aujourd'hui, notre environnement est construit selon des réseaux de perceptions qui sont dans une relation d'interdépendance avec les TIC. Celles-ci ne sont plus considérées comme un objet étranger à nous même, mais comme une extension de notre appareil sensoriel, déterminant non seulement la manière de véhiculer l'information, mais également la manière de percevoir et de comprendre notre environnement.

L'occurence associée à l'URL www.electronicshadow.com/biographies/liquid/hprtxtu.htm renvoie à ce texte où nous avons inscrit la séquence repérée identique en rouge.

"The medium is the message" [Marshall McLuhan 1969]

Mc Luhan, à travers ses écrits, propose une approche fondée sur les innovations technologiques comme base du processus de civilisation. La technologie n’est pas considérée comme un objet étranger à nous même, mais comme une extension faisant intégralement partie de notre appareil sensitif et déterminant non seulement les modes de communication mais aussi la manière de percevoir et de comprendre notre environnement.

L'URL http://tim.irisa.fr/veille/creatic/doc/ActesVersioFinale.pdf renvoie à une communication lors d'un séminaire, en octobre 2004, de Mr Ka (res publica) et Mr Leclercq (École du Louvre), intitulée Le théâtre et le numérique. Vers une nouvelle collaboration théâtrale :

MacLuhan, à travers ses écrits, propose une approche fondée sur les innovations technologiques comme base du processus de civilisation. Les différentes technologies de la communication ne sont pas considérées comme des objets qui nous sont étrangers, mais comme des extensions qui font intégralement partie de notre appareil sensitif et déterminent non seulement les modes de communication, mais aussi la manière de percevoir et de comprendre notre environnement.

À première vue, la comparaison de ces trois textes conduit à conclure que le doctorant a plagié à partir du texte d'electronicshadow.com ("comme un objet étranger à nous même", plutôt que "comme des objets qui nous sont étrangers"). N'ayant pas cité, au contraire des auteurs des 2 textes en ligne, le nom de Mac Luhan, véritable auteur du point de vue exposé, le doctorant ne peut échapper à l'accusation patente de plagiat. Cependant, l'étude de ces 3 textes laissent entre-ouvertes des variantes à cette thèse principale. On peut imaginer qu'un des auteurs dont le texte était en ligne a plagié sur l'autre, ou encore que les deux n'ont fait que résumer, ou paraphraser, ou même plagier, un texte en amont du leur, que ce soit un texte de Mac Luhan lui-même ou un texte sur Mac Luhan. Quant à nous, quelque soit la validité de ces différentes hypothèses, le doctorant reste un plagiaire.

Soulignons en guise de conclusion que nous sommes dans un cas de figure où le logiciel Compilatio.net en repérant une phrase identique, qui paraissait pourtant bien anodine, a facilité la découverte d'un plagiat plus ample et qui tient autant de la paraphrase que du copier-coller.


IN PARTICULAR

La découverte des plagiats qui suivent, plus importants que ceux facilités par Compilatio.net, ne doit rien à ce logiciel.
Isolons ce texte et la note [1] qui lui est associée :
Dans la vie actuelle, nous savons que nous habitons à la fois le monde actuel et le monde virtuel. Comme le dit Toyo Ito, « Nous, les hommes contemporains sommes dotés de deux types de corps, le corps réel, relié au monde réel au moyen de fluides circulant en son sein, et le corps virtuel, relié au monde par le biais d’un flux d’électrons. »[1] En réalité, ces deux corps ne sont pas séparés. Ils sont plutôt à la base de ce qui constitue aujourd’hui le type de présence propre à l’être humain.
[1]
. T. Ito, “Tarzans in the Media Forest,” 2G 2 (1997): 121-144, 132 in particular.


Une citation mise entre guillemets et précédée du nom de l'auteur, un renvoi de note pour référencer la citation, cela ressemble-t-il à un plagiat ? Et pourtant...

C'est la mention "
in particular" dans cette note de référencement du texte de T. Ito, cité par le doctorant, qui fait soupçonné le plagiat-traduction. La note entière, placée entre guillemets et lancée sur Google, renvoie effectivement à une occurrence unique, celle d'un texte de l'architecte Antoine Picon "Architecture and the virtual towards a new materrialty
" (
courses.arch.ntua.gr/fsr/130224/SEM1_PICON_PRAXIS.pdf). Dans ce document, nous avons isolé l'extrait suivant :

We are all about to inhabit both the ordinary and the virtual worlds – hence Toyo Ito’s famous statement that architects should indeed design for subjects imparted with two bodies, a real and a virtual one. “We of the modern age are provided with two types of bodies,” writes Ito.“ The real body which is linked with the real world by means of fluids running inside, and the virtual body linked with the world by the flow of electrons.” Actually, these two bodies are not separated, but rather they are part of what constitutes today’s physical presence.

20. T. Ito, “Tarzans in the Media Forest,” 2G 2 (1997): 121-144, 132 in particular.

Comparons le texte français du doctorant et celui, anglais, d'Antoine Picon. On se rend compte que non seulement des éléments du texte cité, celui de T. Ito, sont équivalents, mais que le texte de T. Ito cité par le doctorant est encadré de traduction-plagiats des commentaires d'Antoine Picon liés à la citation que ce dernier a faite, dans le strict respect des normes de citation, de cet auteur.

C'est donc tout le bloc de texte d'Antoine Picon, citation de T. Ito comprise (2), qui doit être considéré comme plagiat. Le copier-coller par le doctorant de la note de référencement rédigée par A. Picon, sans même la traduire, ne fait que pointer vers un indice et confirmer le plagiat.

Soulignons aussi que le texte de la note, qui avait échappé à Compilatio.net, n'a pas échappé à Google.

PLAGIER ET ÉCHAPPER AUX LOGICIELS ANTI-PLAGIAT

Ni signalement par Compilatio.net, ni indice "in particular", si ce n'est quelques ruptures de niveau de langue, ne m'ont aidé à résoudre les flagrants exemples de plagiat qui suivent. Google, seul, a été mis à contribution. Ces deux plagiats ont été empruntés par le doctorant au texte Le virtuel, vertus et vertiges de Philippe Quéau, publié en 1989 aux éditions Champ-Vallon / INA, et mis en ligne sur son blog par ce spécialiste de l'Internet.

Nous avons fait figurer en rouge les séquences identiques entre les plagiats et les deux extraits plagiés du texte de P. Quéau. Dans le texte de ce dernier des barres obliques noires signalent des ruptures imposées par le texte plagiat.

Texte du résumé de thèse :

On touche là au paradoxe des mondes virtuels, à leur caractère essentiellement hybride : ils sont, à la fois, concrètement fondés sur le modèle des espaces réels, mais également structurés selon la nature abstraite des contenus informatiques : ce qui explique la parution de conflits de plus en plus difficiles à réduire entre divers niveaux de réalité et de virtualité superposées. Les réalités artificielles ne sont cependant pas condamnées à demeurer des illusions, des fantasmes inopérants, car elles peuvent, tout au contraire, nous préparer à mieux saisir le réel. Et cette réalité potentielle du virtuel peut aussi, en retour, nous amener à réfléchir sur l’essence de la réalité tangible..

Extraits des textes en ligne de Philippe Quéau :

On touche là le paradoxe des mondes virtuels, leur caractère essentiellement hybride, / à la fois concrètement formés sur le modèle des espaces réels, mais également structurés selon la nature abstraite des contenus informationnels. D’où des conflits de plus en plus difficile à arbitrer entre les divers niveaux de réalité et de virtualité superposés. (...)

Les réalités artificielles ne sont
/ pas condamnées à
rester des illusions, des phantasmes inopérants. / Elles peuvent / nous préparer à mieux saisir le réel. / Cette réalité potentielle du virtuel peut, / en retour, nous amener à réfléchir sur l’essence de la réalité "réelle".


On constate que le texte source, celui de P. Quéau, a été assez peu modifié par le doctorant, au point même qu'il est difficile de parler à son sujet de paraphrase. Il serait plus pertinent de qualifier ce texte de copier-coller "retouché". Ce sont cependant ces modestes retouches qui ont probablement mis ce plagiat à l'abri des repérages de Compilatio.net.

Si nous retenons l'hypothèse (voir note 2), raisonnable, que la séquence type travaillée par le logiciel est une séquence de 10 mots (cf. l'exemple "
Universalis"), on peut remarquer en comparant le texte du résumé de thèse au texte original de Philippe Quéau, qu'on ne repère que 2 suites identiques constituées d'au moins 10 mots. Nous les donnons ici, avec leurs bornes respectives, en amont et en aval :
- ... formés sur le modèle des espaces réels, mais également structurés selon la nature abstraite des contenus informationnels ... (15 mots).
- ...
/ en retour, nous amener à réfléchir sur l’essence de la réalité "réelle"
(11 mots).

Il suffit donc que la césure entre deux séquences consécutives analysées par
Compilatio.net ne fasse apparaître aucune séquence identique d'au moins dix mots pour que le logiciel demeure aveugle à ces plagiats (dans l'hypothèse d'une unité de séquence de Compilatio.net de 10 mots, des séquences jusqu'à 18 mots peuvent échapper à son attention).

La première analyse de ce résumé de thèse par Compilatio.net a été faite le 30 janvier 2009. Google m'avait conduit, à cette date, à un texte strictement identique repéré à cette adresse : http://queau.eu/2006/11/23/chapitre-4-especes-despaces/. Aujourd'hui, 8 janvier 2010, cette adresse web aboutit nulle part ("Not Found"). Par contre, ce même texte s'affiche à l'adresse suivante, du même blog de Philippe Quéau mais sur une page différente : http://queau.eu/?cat=17.

Dans le blog actuellement en ligne de Philippe Quéau, il est précisé que ce chapitre "Espèces d'espaces" d'où ont été tirés les textes plagiés a été mis en ligne le jeudi 23 novembre 2006. La thèse en question a été soutenue en juillet 2006, antérieurement donc à la mise en ligne de ce texte. Le doctorant aurait-il donc fait l'effort de plagier ce texte depuis sa version papier ? En fait, il s'avère que, comme me l'a précisé Philippe Quéau, les textes de cet ouvrage étaient déjà en ligne sur le site de l'INA.

Remarquons, que Compilatio.net n'a facilité la découverte que d'un tiers environ des plagiats repérés et présentés ci-dessus.
Comme on peut le remarquer dans le texte intégral de ce résumé de thèse (voir ci-dessous), tous les plagiats découverts sont regroupés dans la première partie de ce texte. Une répartition aussi marquée des plagiats est peu probable. Il est donc plausible que la seconde moitié de ce texte cache d'autres plagiats, sous forme de paraphrases ou de traductions, plus difficilement décelables que les grossiers copier-coller.

Les plagiats déjà repérés dans ce résumé justifieraient à eux seuls que l'on prête une attention soutenue à la thèse de ce doctorant coréen. L'explication, souvent avancée, selon laquelle les cultures asiatiques entretiennent un rapport particulier à la notion "d'auteur" paraît un peu courte pour expliquer la nature de ce résumé de thèse. De plus, cet argument ne saurait aucunement justifier la délivrance d'un diplôme "occidental" associé à une thèse comportant une proportion importante de plagiats.

Notes :


Note 1. Dans son étude publiée en mai 2008, Didier Duguest parle à propos des analyses de Compilatio.net de "suites de 7 mots". Mais le modus operandi a depuis été modifié, et il semble que l'on soit passé à une unité de suite de 10 mots (DUGUEST, Didier (2008)."Étude comparative des logiciels anti plagiat". Article mis en ligne sur le site du Professeur Michelle Bergadaà à l'adresse www.responsable.unige.ch/documents/EtudeComparativeLogiciels.pdf).

Note 2. Même le simple emprunt systématique des citations peut être plagiat. Dans son ouvrage Plagiats, les coulisses de l'écriture (page 102), Hélène Maurel-Indart présente le cas d'un plagiat reproché à l'écrivain Henri Troyat. Elle cite des extraits des attendus du jugement en appel qui fondent sa condamnation. Il s'avère que les juges retiennent à la charge d'Henry Troyat qu'il cite souvent les mêmes citations des lettres de Juliette Drouet présentées par les 2 co-auteurs plaignants (plagiés) et "fait les mêmes choix de coupures" (2007. Paris, Éditions de la Différence, 282 p.).


LE DOCUMENT

Ci-dessous, dans ce texte intégral du résumé de thèse étudié, les plagiats repérés sont présentés avec le code couleur suivant : en rouge, les textes identiques (copier-coller); en violet, les textes plus ou moins modifiés et en vert, les traductions-plagiats

Résumé de la thèse de M. SANG HA SUH

GENESE ET ACTUALISATION HYPERMEDIATIQUE

DE SCHEMAS D’ARCHITECTURE

A PARTIR D’UN HYPERCUBE

Depuis la fin du vingtième siècle, les progrès spectaculaires des Technologies de l’Information et de la Communication (T.I.C.) créent une différence notoire entre la vie quotidienne des acteurs de la société actuelle et celle de leurs prédécesseurs nés cinquante ans auparavant.

Facilitant la vie physique, concevant l’existence comme un organisme dynamique, les TIC ouvrent de nouvelles perspectives à la perception.

Aujourd’hui notre environnement est construit selon des réseaux de perceptions qui sont dans une relation d’interdépendance avec les TIC. Celles-ci ne sont plus considérées comme un objet étranger à nous même, mais comme une extension de notre appareil sensoriel, déterminant non seulement la manière de véhiculer l'information, mais également la manière de percevoir et de comprendre notre environnement.(1)

En ce qui concerne la vision, la perspective se situe au niveau de la science, de la culture humaniste et de la pratique artistique, échappant ainsi à un traitement conceptuel univoque. Dans son acceptation technique, le terme moderne de perspective désigne un système particulier de projection, sur un plan bidimensionnel, des objets à trois dimensions et de leurs divers rapports spatiaux, de telle sorte que la vision de l’image représentée corresponde à la vision des objets dans l’espace, ce qui en privilégie l’aspect géométrique et mathématique. (2); (voir aussi 2 bis)

Il s’agit aujourd’hui de concevoir d’une autre manière la perspective de l’environnement. La perspective ne revient plus, en effet, à représenter l’espace à trois dimensions, c’est-à-dire les objets, l’espace ou l’environnement. Il s’agit de représenter un collectif communicant de manière horizontale par la juxtaposition de surfaces en mouvement temporel.

Dans la vie actuelle, nous savons que nous habitons à la fois le monde actuel et le monde virtuel. Comme le dit Toyo Ito, « Nous, les hommes contemporains sommes dotés de deux types de corps, le corps réel, relié au monde réel au moyen de fluides circulant en son sein, et le corps virtuel, relié au monde par le biais d’un flux d’électrons." (1) En réalité, ces deux corps ne sont pas séparés. Ils sont plutôt à la base de ce qui constitue aujourd’hui le type de présence propre à l’être humain. (3)

En ce qui concerne les deux états différents, l’actuel et le virtuel, beaucoup d’architectes, quand ils proposent leurs travaux - surtout lorsqu’il s’agit de projets prospectifs - les interprètent selon la définition de Gilles DELEUZE.

On touche là au paradoxe des mondes virtuels, à leur caractère essentiellement hybride : ils sont, à la fois, concrètement fondés sur le modèle des espaces réels, mais également structurés selon la nature abstraite des contenus informatiques : ce qui explique la parution de conflits de plus en plus difficiles à réduire entre divers niveaux de réalité et de virtualité superposées. (4). Les réalités artificielles ne sont cependant pas condamnées à demeurer des illusions, des fantasmes inopérants, car elles peuvent, tout au contraire, nous préparer à mieux saisir le réel. Et cette réalité potentielle du virtuel peut aussi, en retour, nous amener à réfléchir sur l’essence de la réalité tangible. (5)

Les TIC constituent sans doute une extension de l’esprit, mais elles transforment également notre perception des objets, en étendant le monde des sensations. Nos schèmes moteurs vont se trouver affectés, à leur tour, par les nouvelles interfaces que l’on développe aujourd’hui.

L’espace architectural est l'actuel invisible, et l'architecture est construite grâce à l’organisation de l'information. L’espace instrumental se trouve suspendu entre le silence et le virtuel.

Une dématérialisation électronique de nos corps étendus et flous, est inscrite sur l’horizon de l'événement.

Le processus de l’hypercube correspond, tout d’abord, à une multiplicité de juxtapositions, en une sorte de connexion parallèle avec une machine et entre machines.

L’extension d’un hypercube est un processus auto-semblable, qui présente essentiellement la même structure à toutes les échelles, propriété qui lui permet de mesurer l’irrégularité d’un ensemble.

L'environnement est la version décomposée et recomposée de la nature. La ville ne se reproduit pas dans la continuité, mais dans l'actualisation d'une multi-dimension, que constitue l'hyper-environnement. Le processus de l'hypercube est considéré comme le moteur de l’actualisation qui réalise l'extension de parcours et la juxtaposition des dimensions. Les systèmes d'interdépendance traitent les collectivités urbaines comme des processus d'hypercubes fonctionnels. Et les configurations spatiales des canaux de communication et de transport, des bâtiments et des activités, traitent leurs corrélats processuels comme des phénomènes de forme structurelle hypercubique.

La ville actuelle ne se construit plus dans la continuité, mais dans une conception utopique qui se réalise plus particulièrement au sein des réseaux de « virtualité incarnée » (Centre Xerox), la forme probablement la plus évoluée de l’hypermédiatisation. L’omniprésence des T.I.C. se fait particulièrement discrète dans l’« espace servi » ; l’« espace servant » est dissimulé ou plutôt camouflé dans l’environnement matériel familier. Satisfaite, sa puissance ne s’affiche plus !

 ce stade, donc, les réseaux virtuels deviennent l’environnement actuel, lequel gère des réseaux ouverts. Ceux-ci s’ouvrent sur d’autres réseaux en interdépendance. L’environnement nouveau - intégrant l’architecture et l’urbanisme - ne fait plus qu’un avec ces réseaux, où bilocation et ubiquité, téléprésence, tiennent de la sophistication audio-visuo-kinésthésique, parfaitement simulée.

(1) Toyo Ito, Tarzans in the Media Forest, in 2G, n°2, 1997, pp. 121-144, p. 132 in particular.



Libellés :

mardi 5 janvier 2010

* LES LOGICIELS "ANTI-PLAGIAT" APPLIQUÉS AUX TRAVAUX UNIVERSITAIRES : EFFICACITÉ ET LIMITES

NOUVELLE VERSION DU BLOG

http://archeologie-copier-coller.com/

(24 Janvier 2010, version non définitive)
Le plagiat dans les travaux universitaires a pris des dimensions nouvelles depuis l'arrivée d'Internet. Les plagiats sous forme d'emprunts non référencés de documents trouvés sur Internet sont largement répandus. Le simple "copier-coller" issu d'Internet est devenu la forme de plagiat la plus fréquente dans les travaux courants, mais aussi dans les mémoires, les thèses et les articles.

Contrairement aux grandes universités américaines qui ont vu naître Internet (elles furent les premières à s’inquiéter du copier-coller dans les travaux universitaires), beaucoup d’universités françaises n’ont pas encore pris pleinement conscience de l’ampleur du phénomène. Dans le monde francophone, c’est vers le Québec (
Université du Québec à Montréal), la Suisse (Université de Genève) et la Belgique (Université catholique de Louvain) qu’il faut se tourner pour trouver des études sur le sujet et la mise en œuvre de politiques exemplaires face à ce fléau.

Lorsque le problème du plagiat est ouvertement posé et traité dans les universités françaises, que ce soit au niveau des présidences, des conseils, des UFR, des départements, des écoles doctorales ou, individuellement, au niveau des enseignants, on croit encore trop souvent, en toute bonne foi, trouver dans le recours à un logiciel "anti-plagiat" le remède-miracle.

C’est à travers l’analyse de l’utilisation du logiciel
Compilatio.net, certainement le plus fréquemment utilisé dans les universités françaises et dont la presse s’est souvent fait l’écho, que nous mettrons en évidence à la fois les apports réels de ce type de logiciels dans la lutte contre le plagiat, mais aussi leurs sérieuses limites. Si ces limites sont sous-estimées, voire ignorées, les utilisateurs de ces logiciels anti-plagiat risquent de commettre de graves erreurs d’appréciation concernant les documents, mémoires ou thèses qu’ils soumettront à son contrôle. Plus grave, des appréciations erronées sur les logiciels de ce type conduiront immanquablement dans des impasses la lutte contre les plagiats dans les travaux universitaires.


COMPILATIO.NET
Le logiciel
Compilatio.net est un produit de l’entreprise savoyarde Six-degrés, créée en 2003. Ce logiciel de la seconde génération de logiciels anti-plagiats est arrivé sur le marché français en 2004.
Une première génération de logiciels "anti-plagiat" avait vu le jour au début des années 90. Créés par des informaticiens, au sein même de quelques universités des États-Unis, ces logiciels restaient le plus souvent à usage purement interne. Ils étaient également gratuits.

L’extension du phénomène du « copier-coller » dans les travaux universitaires aux États-Unis a favorisé l’arrivée sur le marché, fin des années 90, début des années 2000, de produits plus sophistiqués, aux interfaces améliorées, mais payants. On en connaît plusieurs dizaines, parmi les plus connus, citons :
Turn it in, lancé en 1998, Eve et le logiciel suédois Urkund* diffusés à partir de 2000, Ithenticate en 2003, Ephorus, d’abord développé aux Pays-Bas et en Norvège, toujours en 2003.
Compilatio.net, né en 2004, se rattache à cette seconde génération et a bénéficié d’améliorations notables depuis ses débuts. Il est aujourd’hui décliné en 5 langues : français, anglais, espagnol, italien et allemand qu’on trouvera aux adresses suivantes : compilatio.net.fr, compilatio.net.en, compilatio.net.es, compilatio.net.it et compilatio.net.de.


DES FORMULES DISCUTABLES
Les arguments mis en avant par les promoteurs de
Compilatio.net pour faire connaître ce produit sont « Compilatio.net est un outil en ligne de détection de plagiat », ou encore « Compilatio est un service d’analyse de document en ligne permettant la détection de plagiat ».
La première formulation est tout à fait excessive dans la mesure où
Compilatio.net, pas plus que les autres logiciels de ce type, ne détecte aucun plagiat en tant que tel. Il met seulement, ce qui est déjà beaucoup, à la disposition de chacun de ses utilisateurs, des moyens qui facilitent la détection d’un certain type de plagiat.
La deuxième formulation est également discutable. En effet, « permet » renvoie à une sorte d’exclusivité alors que «facilite» paraîtrait plus adapté à l’usage de ce logiciel (Google aussi «facilite», plutôt qu’il ne « permet » la recherche de plagiats). De même que le terme « plagiat », au singulier, paraît renvoyer « au plagiat » et donc à l’ensemble des formes de plagiat, et à tous les plagiats du texte contrôlé. Ceci, alors que précisément nous verrons que les plagiats dont
Compilatio.net facilite la détection correspondent essentiellement à la copie numérique, de type copier-coller.

L’analyse de ces seuls arguments, rédigés par le service communication de l’entreprise
Six-degrés pour promouvoir la diffusion de ce produit, résume une partie les problèmes que pose l’usage de Compilatio.net et des autres logiciels de ce type.
Notons cependant, que dans une sorte de mode d’emploi du logiciel, accessible sur le site de
Compilatio.net, l’entreprise précise que le logiciel : « détecte les passages similaires », plutôt que « le plagiat », ce qui est juste. Mais cette précision est faite dans un contexte textuel qui ne lève pourtant aucune des ambiguïtés signalées plus haut. En effet, ce mode d’emploi se présente sous la forme d’une série de 15 questions-réponses dont la première est la suivante : Que peut-on considérer comme du plagiat ? La réponse suit : Compilatio.net détecte les passages similaires entre le document analysé, l'ensemble des sources disponibles sur Internet (et) les documents analysés par le passé. C'est la quantité de passages "similaires" dans un texte qui permettra à l'utilisateur d'apprécier si le document a été plagié ou non. »

Les couleurs, vert, orange et rouge (voir plus bas), qui s'affichent aussitôt l'analyse du document terminée, participent à cette confusion entre "similitude" et "plagiat". Si un doute demeurait, rien ne pourrait mieux illustrer l’illusion cultivée à dessein par les promoteurs de
Compilatio.net que le logo qu’ils proposent
d’afficher sur le site de l’université, à celles qui ont adopté ce logiciel, Sous la forme d’une sorte de tampon officiel, ce logo met en scène ce texte un peu pompeux : "L'Engagement d'Excellence : Internet Certifié Sans-Plagiat" avec Compilatio.net ». Cette formule à la Édouard Leclerc est évidemment particulièrement excessive et donc nécessairement trompeuse.

Remarquons que pour d’autres entreprises de logiciels anti-plagiat, cette ambiguïté n’est pas entretenue avec autant de soin que par
Compilatio.net. Signalons le cas d’Urkund, logiciel à l’origine développé en collaboration avec le département d’Éducation de l’université d’Uppsala (version française, http://www.urkund.fr). Dans un mode d’emploi «questions-réponses» du même genre que celui de Compilatio.net, il est souligné très explicitement en réponse à la première question : « Les analyses d’Urkund ne font que présenter des similarités et non du plagiat avéré. C'est au corps enseignant/pédagogique que revient la responsabilité de déterminer la présence de plagiat avéré. » (cette remarque faite, il semble cependant que dans le domaine de l'efficacité, Compilatio.net repère mieux qu'Urkund les textes identiques. C'est l'avis de Didier Duguest** qui a testé avec beaucoup de rigueur les principaux logiciels Anti-plagiat).


UN INDICE NON PERTINENT
Pour atteindre leur objectif, les logiciels anti-plagiats comparent le texte qu’on leur soumet à l’ensemble des ressources accessibles librement sur Internet.
Compilatio.net repère les textes identiques, plus précisément des séquences d’une dimension donnée, d’un certain nombre de mots consécutifs identiques.
Une fois l’analyse de la totalité du texte soumis à ce contrôle terminée, la rubrique «
résultat » de Compilatio.net affiche « l’indice de plagiat», c’est-à-dire, en réalité, le taux du texte soumis pour lequel ont été repérées des séquences identiques sur Internet. Compilatio.net annonce la couleur : cet indice de plagiat s’affiche en vert s’il est inférieur à 10%, en orange pour un pourcentage compris entre 10 et 35%, en rouge au-delà de 35%.
Le choix chromatique est là sans aucune ambiguïté : un indice inférieur à 10% vaut à un document d’être considéré comme original («
une marge de tolérance est utilisée permettant à un document contenant peu de passages similaires d'être considéré comme un travail original. »).
Dans l'article
"Le retour du réel : cache-cache plagiat", nous exposons le cas d’un résumé de thèse auquel Compilatio.net avait donné son feu vert ("indice de plagiat" de 9%), et qui s’est révélé être un plagiat de bien plus grande ampleur. Ce qui constituait un indice certain que la thèse résumée par ce texte méritait d’être lue avec une attention particulière.

Notons que le terme «
indice de plagiat », lorsque plagiat est au singulier, pose ici, avec une acuité plus accrue, le même problème soulevé plus haut.. On ne s’en étonnera pas ; les lois du marketing — Compilatio.net est un « produit » qu’il faut d’abord vendre — ne sont pas toujours celles de la rigueur sémantique.
À ce stade pourtant,
compilatio.net n’a en fait que calculé non pas un pourcentage de « plagiat » mais bien le seul pourcentage de séquences identiques, « similaires », trouvées sur Internet. Aucune preuve n’a encore été apportée de la présence ou de l’absence de plagiats

Ainsi, ce premier indice de plagiat si rapidement affiché sous la forme d’un taux de « plagiat » n’est pas d’une grande pertinence. Il doit être discuté et réévalué. D’une part, l’existence sur Internet de textes identiques ne signifie pas qu’il y ait obligatoirement plagiat. D’autre part, tous les plagiats susceptibles d’être présents dans le texte soumis à cette analyse du logiciel ne prennent pas forcément la forme de copie fidèle du texte plagié et ne sont donc pas repérables par ce logiciel.


TEXTES IDENTIQUES ET PLAGIAT
Compilatio.net fait abstraction dans ses recherches comparatives des guillemets et autres marqueurs de citation. Il met donc sur le même plan des textes légitimement cités dans le respect des conventions (utilisation des guillemets et/ou des italiques, mise en retrait, explicitation des sources) et les textes copiés sans aucune des marques de citation ni mention d’origine que s’attribue donc implicitement l’auteur du travail universitaire soumis à l’analyse du logiciel de détection de plagiat.

Enfin, autre exemple, une grande partie du texte des bibliographies, essentiellement constituées de noms d’auteurs suivis de titres d’articles ou de livres, est ainsi, au premier stade de l’analyse de Compilatio.net, comptabilisée comme «plagiat». En effet, ces phrases-titres se retrouvent naturellement à de nombreuses occurrences sur Internet (librairies en ligne comme fnac.com ou amazon.com, ouvrages cités dans d’autres bibliographies de mémoires ou thèses, etc.). Elles sont donc, à priori, repérées par Compilatio.net comme textes identiques et, par voie de conséquence, comptabilisées pour le calcul de l’indice de plagiat (mais cette remarque n’exclue pas les cas, fréquents, de bibliographies issues de plagiat/« copier-coller. Nous en présenterons un exemple dans un prochain article concernant une thèse à cet égard remarquable, car
quasi entièrement composée de "copier-coller». Sa bibliographie est elle même constituée d'un assemblage des "copier-coller" réalisés sur les bibliographies des textes plagiés).
Signalons la notice « Repérer le plagiat dans les travaux des étudiants ? » mise en ligne sur le site de l’Université catholique de Louvain.
« ATTENTION, les logiciels de détection du plagiat recherchent en réalité les similitudes entre le texte de l'étudiant et les textes disponibles en libre accès sur Internet. Le résultat fourni représente donc un pourcentage de SIMILITUDE, et non un pourcentage de plagiat ! Certaines similitudes ne sont pas du plagiat : les citations entre guillemets avec mention de la référence, les références bibliographiques, des bouts de phrase du langage courant... ».
La conclusion suit : « La responsabilité de la correction reste entièrement entre les mains de l'enseignant : une interprétation du pourcentage fourni par le logiciel est indispensable. »


LES FAUX POSITIFS
Dans le cas du contrôle à posteriori d’un mémoire ou d’une thèse déjà soutenus, d’un article, la totalité du texte soumis au contrôle de
Compilatio.net peut aussi avoir déjà avoir été mis en ligne sur différents sites dans des contextes où ces différentes occurrences en ligne du même texte ne sont pas en soi significatives d’un quelconque plagiat. Ainsi, les mémoires de master, et surtout les thèses, sont, aujourd’hui, souvent mis en ligne sur le site de la bibliothèque de l’Université de l’étudiant, par exemple sous la rubrique «Les thèses de Paris 8 en ligne », la Bibliothèque de l’Université propose les fichiers pdf de plus de 150 des environ 400 thèses soutenues à Paris 8 depuis l’année 2006.
Des sites spécialisés sont par ailleurs dédiés à la mise en ligne des travaux universitaires (par exemple, le projet
DART Europe, portail de thèses européennes en ligne, le serveur TEL (thèses en ligne), ou mémSIC, mémoires de master en sciences de l’information et de la communication abritée par le CNRS).
Dans ces cas
Compilatio.net devrait théoriquement afficher un premier indice de plagiat de 100%. En réalité, dans cette situation, le taux affiché est souvent inférieur. La différence avec les 100% mesurant ici les imperfections du logiciel.

Toujours pour des mémoires et thèses déjà soutenus, ou des articles, des extraits du document soumis à
Compilatio.net peuvent aussi avoir été mis en ligne sans pour autant renvoyer à des plagiats perpétrés par l’auteur du document contrôlé:
• Un mémoire de master, une thèse, un article peuvent avoir été largement cités et commentés, dans le respect des règles de citation et d’emprunt, dans un document mis en ligne.
• Ils peuvent aussi avoir été largement plagiés, et ce texte avec plagiats, mis en ligne (voir l’exemple présenté plus bas). Dans ce cas, notons que
compilatio.net réagit à l’inverse de ce que la situation imposerait en mettant, dans son premier "indice de plagiat", au compte du plagié, le plagiat dont il est pourtant la victime.

Soulignons cependant que les approximations sémantiques de
Compilation.net ne l’empêchent pas de mettre à la disposition de ses utilisateurs des outils permettant de dépasser la non-validité du premier indice de plagiat proposé et d’accéder à des résultats plus pertinents.


DES OUTILS EFFICACES À USAGE LIMITÉ
Le premier «
indice de plagiat » affiché par Compilatio.net doit donc être ignoré dans l’attente de la recherche de preuves issues d’un travail plus approfondi sur la pertinence des résultats présentés. Nous verrons plus loin qu’une fois affiché ce premier résultat discutable, Compilation.net offre en aval, dans ses « rapports détaillés », les moyens à ses utilisateurs de distinguer les « copier-coller » dont on peut fournir la preuve de plagiats.

La copie, en l’occurrence ici le « copier-coller » numérique, la copie la plus fidèle qui soit, est la seule forme de plagiat détecté par Compilatio.net. Le « copier-coller » est aussi la forme la plus caricaturale du plagiat. Mais il existe de nombreuses formes de plagiat qui échappent au contrôle de
Compilation.net. Citons à nouveau les cas de la paraphrase et de la traduction, sans mention des sources, comme exemple de plagiats qui échappent aux recherches de Compilatio.net.
Pour cette raison supplémentaire, et bien qu’il puisse être d’une aide précieuse et permette de gagner du temps, répétons qu’il est abusif de considérer
Compilation.net comme un « détecteur de plagiat ». Il aide surtout, ce qui est déjà bien, à la détection de plagiats/« copier-coller », la forme la plus fréquente mais loin d’être exclusive, que prend le plagiat dans les travaux universitaires aujourd’hui. Il peut aussi, mais rarement, mettre sur la piste de plagiats sous forme de paraphrases du texte plagié.

L’utilisation de Google, totalement gratuite, comme l’utilisation de Compilatio.net, très onéreuse, permettent de détecter les plagiats/« copier-coller » sur Internet. La qualité des interfaces et des moyens proposés par Compilatio.net rend indiscutablement ces recherches plus aisées qu’avec Google. Mais
Compilatio.net, comme Google, laissent passer des «copier-coller».


LA RECHERCHE DE PREUVES : UN TRAVAIL FASTIDIEUX
Pour chaque supposé « plagiat » qu’il a détecté, « plagiat » pour l’instant encore comptabilisé pour le calcul du premier indice de plagiat affiché en couleur,
Compilatio.net offre à l’utilisateur, dans son « rapport détaillé » la liste des adresses des sites où ont été repérés ces « plagiats ». Il offre aussi les moyens d’accéder directement à ces sites et de comparer en vis-à-vis le texte soumis au contrôle et toutes les occurrences des textes identiques repérées sur ces sites.
C’est à ce stade que l’utilisateur doit, pour éviter toute accusation infondée de plagiat, s’atteler à un travail long et fastidieux. Il doit, séquence par séquence, comparer le supposé « plagiat » détecté par le logiciel avec les textes sur les différents sites Internet que le logiciel lui associe.

Il convient d’abord vérifier que le texte contrôlé ne présente pas comme citation, avec tous ses attributs légitimes, la séquence identique repérée par
Compilatio.net sur Internet, et encore à ce stade comptabilisée par le logiciel pour le calcul de « l’indice de plagiat».
Si cette première vérification n’a pas permis de lever le soupçon de plagiat, il devient indispensable de s’assurer de la preuve que le texte présenté par le logiciel comme plagié est bien antérieur au texte contrôlé soupçonné de plagiat. Cette vérification apporte parfois des surprises. Pour l’illustrer, je mentionnerai ici un cas que je développerai ailleurs en détail.
Il y a quelques années, à la fin de l’année 2005, la lecture d’un mémoire de DEA soutenu en septembre 2000, bien qu’il avait été jugé remarquable et mis en ligne par son directeur de recherche au vu de ses « qualités » (il est aujourd’hui toujours en ligne), m’avait cependant conduit à soupçonner quelques plagiats importants.
Des recherches effectuées avec Google, sans alors faire appel à Compilatio.net, m’avaient rapidement permis de retrouver sur Internet une introduction identique à celle du mémoire de DEA dans un rapport volumineux signé par deux éminents professeurs d’une autre université (rapport lui aussi aujourd’hui toujours en ligne).
J’ai, dans un premier temps, et j’oserai dire, presque naturellement, conclu au plagiat du rapport des deux professeurs par l’étudiant. Ceci, avant de me rendre compte quelques jours après que ce rapport avait incontestablement été écrit et mis en ligne sur Internet en février 2005, soit près de cinq ans après la mise en ligne du mémoire de DEA. La mention de ce mémoire de DEA et de son auteur figurait d’ailleurs dans la bibliographie très nourrie qui concluait le rapport (mais la mention dans la bibliographie des références du document plagié dans le corps du texte n’enlève rien au statut de ce plagiat si les copies de ces ouvrages n’ont pas été présentées comme citation dans le corps du texte. En l’occurrence, cette bibliographie dressait essentiellement la liste des sources des emprunts des professeurs plagiaires).
Poursuivant mes recherches sur ce mémoire de DEA, j’ai découvert, comme je l’avais de prime abord subodoré, d’autres parties importantes plagiées. Mais j’ai aussi retrouvé ultérieurement dans un document ministériel mis en ligne en 1999 une grande part de la fameuse introduction évoquée ci-dessus. Vérifications faites, j’ai pu établir que l’étudiant avait bien plagié, en 2000, un document ministériel mis en ligne depuis 1999. Et que ce même texte de 1999 avait été plagié par les deux professeurs d’Université, mais depuis la version déjà plagiée de l’étudiant, et non depuis la version originale.

Ce cas, réel, illustre l’importance des précautions à prendre avant de porter l’accusation de plagiat : indépendamment de la découverte ultérieure que l’étudiant avait lui-même plagié, contrairement à ma première hypothèse, ce sont bien les deux professeurs d’universités qui ont copié le mémoire (lui même plagiat) de l’étudiant et non l’étudiant qui avait fait des emprunts au rapport des professeurs.
Cette expérience illustre aussi une règle concertant la chronologie des textes comparés dans le cas de la recherche de plagiats. Dès le moment où il est prouvé qu’un texte A signé par un auteur A’ a été produit postérieurement à un texte B, identique à A, signé par un auteur B’, l’auteur A’ peut être considéré comme plagiaire. Ceci indépendamment du fait qu’on puisse ou non démontrer ultérieurement que B’ est lui-même le plagiaire d’un éventuel texte C signé par un auteur C’ produit antérieurement à B’. D’ailleurs, qu’il s’avère que A’ ait finalement copié B’ ou C’, peu importe… C’ est peut-être lui-même un plagiaire….
Ce type de figure, les plagiats en cascade parmi lesquels il n’est pas toujours aisé, et parfois même quasiment impossible, de distinguer à coup sûr l’original, est aujourd’hui assez fréquent sur Internet.
Cette expérience illustre enfin, qu’aujourd’hui, à l’ère d’Internet, avant même de citer, dans le respect des normes, un texte trouvé en ligne (thèses, mémoire, article, etc.), il faut, par prudence, se convaincre par un minimum de recherches que le texte que l’on s’apprête à citer avec ses références est bien l’original, non pas déjà un plagiat.

Les utilisateurs de
Compilatio.net et des autres logiciels du même type sont donc en mesure de distinguer un véritable plagiat/« copier-coller », fautif par conséquent, d’une citation correctement référencée. Ils peuvent donc confirmer ou infirmer la présence d’un « copier-coller » condamnable à cet endroit du document contrôlé. Ils peuvent aussi apporter les preuves incontestables du plagiat par la comparaison des dates de production du texte soumis au contrôle avec un texte antérieur identique.

Au fur et à mesure de ces vérifications, quand l’utilisateur du logiciel juge que la séquence identique repérée sur tel ou tel site Internet par le logiciel n’est pas à retenir comme plagiat/« copier-coller »,
Compilatio.net lui offre la possibilité d’«ignorer» (c’est l’intitulé de cette fonction) cette séquence et ses sites associés. Cette séquence est alors neutralisée en tant que « plagiat » et n’est plus comptabilisée pour le calcul de l’indice de plagiat. Cet indice de plagiat diminue donc d’autant.
Ce n’est qu’à la fin de ces opérations, fastidieuses, de successives neutralisations par la fonction «ignorer», que
Compilatio.net affiche un indice pertinent, mais toujours pas de véritable «indice de plagiat » comme il est annoncé. Plutôt un taux de plagiats/« copier-coller » découverts.
Cet indice final correspond au seul taux de plagiats/« copier-coller »issu d’Internet et laisse de côté bien d’autres formes de plagiats.


ÉCHAPPER AUX CONTRÔLES
Les plagiats issus d’Internet et qui ne sont pas repérables par Compilatio.net sont de deux ordres :
a) Les plagiats issus de textes ouvertement accessibles sur Internet mais plagiés sans être de simples « copier-coller » (paraphrases, traductions, etc.). Par exemple, dans le mémoire de DEA, plagié à plus de 95% et objet de mon étude «
Repérer avec Google les textes réécrits ou traduits», le taux de plagiats/copier-coller qui auraient été détectables par Compilatio.net, n’était d’environ que de 50%. L’autre moitié des plagiats correspondait à des traductions (en l’occurrence des traductions automatiques) à partir de textes en ligne. Ces plagiats/traductions restent pour l’instant indétectables par Compilatio.net comme par les autres logiciels anti-plagiat.
b) Les textes accessibles sur Internet à travers des sites payants. Quasi ouvertement, ou sous le couvert de bibliothèques payantes, on peut ainsi se procurer des travaux à plagier sur tous les sujets imaginables, inaccessibles à Compilatio.net.

En outre, comme avant l’ère d’Internet, les documents-papiers des bibliothèques universitaires (livres, mémoires, thèses, etc.), qui n’ont pas d’équivalents numériques mis en ligne, sont par nature inatteignables par
Compilatio.net.

Comme nous l’avons souligné, l’efficacité de
Compilatio.net est réduite à la seule découverte des plagiats de type copier-coller. Son usage ne saurait donc résoudre le problème des plagiats issus d’Internet dans les travaux universitaires. D’autant que la diffusion et la généralisation de ce type de logiciel pour le contrôle des travaux conduiront naturellement, non pas tant à dissuader les plagiaires de plagier, mais à faire évoluer les formes de leurs plagiats/« copier-coller »vers des plagiats/paraphrases ou des traductions pour échapper aux recherches des logiciels anti-plagiat. Il existe déjà des logiciels destinés aux étudiants et qui y aident.
En effet, l’entreprise américaine qui a créé le logiciel anti-plagiat
Turn in it et l’entreprise française qui diffuse Compilatio.net, logiciels, l’un et l’autre, en principe, réservés aux enseignants, diffusent aussi, respectivement, WriteCheck et le si candidement baptisé Pompotron.
Pompotron.com signale à l’étudiant « la proportion de texte original (non copié sur Internet) » et dresse la liste des sites sources, ceci afin de l’aider « à compléter sa bibliographie ». Je doute que les promoteurs de ces deux derniers logiciels ne sachent pas qu’ils sont aussi, sinon d’abord, utilisés par des apprentis plagiaires soucieux de mesurer la perméabilité de leurs travaux au contrôle des logiciels anti-plagiats que ces mêmes entreprises diffusent auprès des Universités.

Jean-Noël Darde


* Le logiciel
Urkund se décline aujourd’hui en 11 langues : norvégien, suédois, finlandais, danois, anglais, allemand, français, portugais, espagnol, italien et russe.

** DUGUEST, Didier (2008)."Étude comparative des logiciels anti plagiat". Article mis en ligne sur le site du Professeur Michelle Bergadaà à l'adresse www.responsable.unige.ch/documents/EtudeComparativeLogiciels.pdf





Libellés : , , , ,