_____________

À partir de textes produits par Marie-Renée VERSPIEREN, Maître de conférences en Sciences de l'Education, Université de Lille I pour les Actes de Lecture.

- Université de Caen, Centre d'Étude et de Recherche en Sciences de l'Éducation, École Doctorale Littérature, Cultures et Sciences Sociales, U.F.R. des Sciences de l'Homme


Étude statistique sur un échantillon d'enfants de onze ans

- Mémoire présenté en vue de l'obtention du diplôme d'études approfondies en Sciences de l'Éducation, par Denis FOUCAMBERT, sous la direction de Monsieur le Professeur Paul CLERC, 1997.


Introduction *

Chapitre 1 : Cadres théoriques et expérimentaux. *
1. Introduction *
1.1 Le modèle de FODOR (1983) *
1.2. Le modèle de JOHNSON-LAIRD (1983) *
2. Quelques travaux expérimentaux antérieurs
*
2.1. Autonomie entre la reconnaissance des mots et le contexte. *
2.2. L'importance du contexte dans la reconnaissance des mots. *
2.3. Une réflexion critique sur ces travaux *
2.4. Vision nette et vision dégradée *
2.5. La vision parafovéale et la lecture (recherches récentes) *
2.6. Quelques travaux ophtalmologistes *
2.7. La saccade occulaire. *
3. Première conclusion *

Chapitre 2 : Empans et silhouettes de mots : une vue statistique sur le lexique français des mots de dix lettres *
1. Une typologie des lettres en sept formes *
2. Un essai statistique : les silhouettes des mots de 10 lettres *
2.1 Les Mots=silhouettes (silhouettes originales) *
2.2 Les silhouettes ambiguës *
2.3 Silhouette et apparence *
3. Attentes et silhouette *
3.1. L'horizon syntaxique. *
3.2 l'horizon sémantique *
3.3 Croisement d'un horizon sémantique et syntaxique *
3.4 Récapitulation numérique (tableau 2) *
4. Conclusions *

Chapitre 3 : Hypothèses et Méthodologie *
1. Hypothèses *
2. Méthodologie. *

Chapitre 4 : La population expérimentale *
1. Les enfants *
2. Les écoles *

Chapitre 5 : Huit épreuves graphiques hors d'une situation de lecture. *
1. Épreuve A1 : tri entre pseudo-mots, construits sur la vraisemblance de leur silhouette *
Variables *
2. Épreuve A2 : "pendu" sur une phrase *
Variable numérique *
3. Épreuve A3 : Mots mêlés *
Variables *
4. Épreuve B1 : reconnaissance spatiale d'un mot *
Variables *
5. Épreuve B2 : association mot->silhouette *
Commentaires et critiques *
Variables *
6. Épreuve B3 : reconstitution de phrase *
Variable *
7. Épreuve B4 : phrase à trou avec pièges *
Variable *
8. Épreuve B5 : Tris syntaxiques *
Variables *
9. Récapitulation sur les huit épreuves graphiques *

Chapitre 6 : Des épreuves aux compétences techniques *
Première composante principale *
Deuxième composante principale *
Troisième composante principale *
Quatrième composante principale *
Cinquième composante principale *
Sixième composante principale *
Septième composante principale *
Huitième composante principale *
Conclusion *

Chapitre 7 : Rapports entre compétences techniques et performances de lecture *
1. Le modèle d'analyse. *
2. Les composantes techniques en rapport avec la performance de lecture. *
2.1. Première contribution technique *
2.2 Deuxième contribution technique *
2.3 Troisième contribution *
2.4 Quatrième composante *
3. Conclusions *

Perspectives *

Bibliographie *

Introduction
"Comprendre consiste à imaginer et à conclure avec une rapidité et une complaisance surprenantes. Deux mots suffisent pour que nous devinions une phrase, une voyelle et deux consonnes pour que nous devinions le mot, parce que nous n'avons cessé pendant ce temps d'imaginer et de déduire" NIETZSCHE

Cette recherche s'inscrit dans un suivi de cohorte, entamé par l'Institut National de la Recherche Pédagogique en mai 1990. Cette longue observation de 76 enfants, de 1990 à 1993, a déjà donné lieu à différentes publications, dont en particulier une thèse de doctorat en Sciences de l'Éducation (GOIGOUX, 1993) et un rapport de recherche de l'INRP/AFL (FOUCAMBERT, CHENOUF, VIOLET, GOIGOUX, 1994/95). La première étude longitudinale d'une durée de trois ans avait pour objectif d'étudier une question complètement ignorée des recherches classiques : "comment les enfants apprennent-ils à lire lorsque l'enseignement dont ils bénéficient ne repose pas sur l'acquisition préalable des règles de correspondance grapho-phonologique ?" (GOIGOUX, 1993). Les deux études citées étudient les conceptions psychologiques, les présupposés didactiques, les organisations pédagogiques, les capacités des enfants apprentis lecteurs, dans différents schémas d'apprentissage de la langue écrite.

Trois ans après la fin de cette première recherche, et juste avant que ces élèves ne se dispersent dans différents collèges, il aurait été dommage de ne pas regarder une dernière fois leurs performances en lecture, à la fin de l'école primaire. C'est ce que l'Association Française pour la Lecture et l'INRP ont décidé d'entreprendre durant l'année scolaire 1994/95. Travaillant à l'AFL, je me suis joint au groupe d'enseignants et de chercheurs qui s'est réuni à plusieurs reprises pour mettre au point les épreuves d'évaluation de ces enfants de 11 ans. J'ai donc participé à la définition des épreuves, puis ai réalisé les programmes informatiques sur lesquels les élèves ont directement travaillé, enfin je suis allé faire passer les épreuves (juin 1995) aux enfants des sites géographiques choisis.

L'objectif initial de cette recherche était de mesurer (six ans après) les effets à long terme des méthodes d'enseignement de la lecture. Ces résultats seront publiés par l'INRP. Nous n'entrerons pas dans ce type de débat.

J'ai utilisé les données recueillies sur cette cohorte d'enfants déjà constituée, pour essayer d'étudier d'autres phénomènes. Avant d'entreprendre ce travail, j'avais pris connaissance de travaux portant sur l'étude des actions, des gestes, et des fonctionnements cérébraux à l'œuvre dans l'acte de lecture. J'avais été frappé par le peu de cas que l'on y faisait de l'entité lecteur : on choisissait des personnes sans préciser leur niveau exact de lecture, alors qu'il est pour le moins probable que de grandes différences individuelles existent dans ce domaine. Il est ainsi vraisemblable que deux lecteurs dont la vitesse de lecture peut varier de 1 à 10 n'auront pas des déplacements oculaires identiques sur un texte simple ; ou que la connaissance du système graphique de la langue écrite va modifier la façon dont on va l'appréhender. Notre groupe avait donc mis au point des épreuves afin de partir sur la piste d'une éventuelle conscience graphique. Cette expression s'est dans un premier temps construite en liaison avec le concept de conscience phonologique (SPRENGER-CHAROLLES, 1991) dont nombre de travaux suggèrent qu'elle jouerait un rôle dans l'apprentissage de la lecture. On sait, par ailleurs, que les bons lecteurs utilisent une voie dite "orthographique" (FAYOL, 1992), qui traite directement l'information écrite. On peut se demander si ce traitement ne génère pas (et/ou ne prend pas appui sur) une expérience spécifique du fonctionnement de l'écrit, dans ses unités, leur fréquence, leur combinaison, bref dans la manière dont ils constituent un système directement utilisable et qui ferait le pendant pour l'écrit de ce que chacun s'accorde à identifier pour l'oral sous le terme de conscience phonologique. Nous l'avons appelé conscience graphique dans la mesure où ses unités doivent a priori concerner tout ce que l'œil est susceptible d'utiliser dans un texte au cours d'une lecture. J'ai donc décidé d'explorer un peu plus cette notion en cherchant s'il existait, d'une part, des compétences graphiques et si, d'aute part, elles entretenaient des liens avec la performance de lecture.

Nous emploierons les termes de compétence et de performance malgré les débats qui entourent leur usage par la grammaire générative. Du côté des compétences techniques, il s'agit pour nous d'identifier des savoir-faire qui interviennent dans (à l'occasion d') un traitement de l'écrit. Il n'est le plus souvent possible d'isoler ces savoir-faire que dans des situations artificielles où le sujet n'est manifestement pas en train de lire, au sens où il serait dans un rapport complexe à un texte écrit, c'est-à-dire produit par un travail d'écriture. C'est le cas des situations habituelles de laboratoire : identification de mots isolés, prononciation de trigrammes, traitement des anaphores, etc. dont il est toujours à craindre que leur exploitation prétende élucider ce qui se passe au cours de la lecture alors qu'elles ne dévoilent que ce qui est techniquement nécessaire pour les résoudre. Du côté de la performance, il s'agit pour nous de cerner la lecture, non à travers l'addition des savoir-faire qu'on supposerait nécessaires à son déroulement mais à travers l'évaluation du niveau de réussite à des situations sur lesquelles il y a accord pour dire qu'un lecteur doit les réussir. La lecture, c'est alors ce que réussit à faire un lecteur. Et il est plus facile de décider s'il le fait efficacement et dans quelles circonstances il le fait que de savoir comment il le fait. Dès lors, il devient possible de mettre en relation une performance de lecture évaluée sur des lecteurs dans des situations de lecture et des compétences techniques exercées par ces mêmes lecteurs lorsqu'ils ont à résoudre un problème mettant en jeu de l'écrit dans une situation expérimentale.

On peut espérer ainsi moins mal cerner ce qu'est le processus de lecture en recensant déjà les compétences techniques qui y contribuent. Pour aborder cette mise en rapport entre performances de lecture et compétences techniques dans l'écrit, on serait tenté de dire compétences graphiques, il nous faudra expliciter des concepts empruntés à plusieurs disciplines et notamment à la psychologie expérimentale, à la neurophysiologie, ou encore à l'ophtalmologie. Ces références théoriques seront construites dans le premier chapitre.

Le second chapitre résumera une étude intermédiaire que j'ai effectuée sur le lexique français des mots de 10 lettres et qui permet de mieux cerner la nature des informations graphiques que l'œil utilise lors de chaque fixation. Si l'écrit est un langage pour l'œil, il est probable qu'une partie des compétences techniques se construisent à l'intersection des caractéristiques de la vision et des caractéristiques du système de codage que l'écrit utilise.

Dès lors, il est possible de présenter dans le troisième chapitre les hypothèses de travail et la méthodologie de la recherche conduite sur la population dont la présentation fait l'objet du chapitre quatre. Il s'agit finalement de déterminer quelles sont les compétences techniques révélées par des situations artificielles de rencontre avec l'écrit qui contribuent à l'établissement de la performance de lecture et, au delà de repérer sur quelles spécificités du fonctionnement du système graphique s'élaborent ces compétences, ce qui devrait permettre de procéder à une première approche de la " conscience graphique ".

Le cinquième chapitre présentera donc les huit épreuves graphiques (hors situation de lecture) qui vont être utilisées. Le traitement des résultats dans une analyse en composantes principales permet dans le sixième chapitre de passer de la réussite à ces épreuves à la définition de compétences techniques. Les corrélations et les oppositions entre ces différents scores permettent de découvrir quelques savoir-faire transversaux probablement à l'œuvre simultanément dans les situations artificielles même si elles ont été conçues pour isoler au mieux les variables, ce qui explique qu'elles ne soient pas des situations réelles de lecture.

De la même manière, le septième chapitre présente les quatre épreuves utilisées pour évaluer la lecture ainsi que le score composite qui en a été tiré. A travers ce résultat, on prétend cerner avec précision un niveau de lecture mesuré sur des situations de lecture fort différentes mais très révélatrices de ce que c'est que lire, et bien lire, pour un élève à son entrée en sixième.

Enfin le dernier chapitre interroge, grâce aux régressions multiples, le rapport, au sein de notre population, entre cette performance de lecture et des compétences techniques sur l'écrit afin de déterminer lesquelles contribuent à la lecture et peuvent, à ce titre, être présentées comme compétences graphiques. On verra, parmi la douzaine de pôles que forment la suite des composantes principales qu'il est possible d'approfondir le modèle interactif par lequel se décrit aujourd'hui la lecture en révélant la spécificité des opérations qu'autorise l'écrit.

Chapitre 1 : Cadres théoriques et expérimentaux.
1. Introduction
On peut décrire la lecture comme une production de significations réalisée par un individu (le lecteur) à partir d'un texte écrit. Elle est le produit d'une interaction entre des données contenues dans le support et les connaissances générales du lecteur (linguistiques ET extra-linguistiques).

Cette conception communément admise oblige à différencier deux sources d'informations qui vont interagir :
des données de bas niveau, qui sont les indices graphiques portés par le texte.
des données de haut niveau, qui concernent les connaissances du sujet, ses capacités de raisonnement, ses attentes et ses buts.

Deux grandes familles de processus cognitifs sont à l'œuvre dans la lecture, au travers de ces types de données :
les processus ascendants, qui consistent à identifier les graphèmes, les signifiants et à leur faire correspondre des signifiés (utilisant donc les données de bas niveau)
les processus descendants, qui vont influencer les activités perceptives et guider la recherche d'information (utilisant donc les données de haut niveau).
Les modèles cognitifs de la lecture supposent une interaction entre ces deux processus. Pour distinguer ces modèles, il faut examiner la place relative qu'ils accordent à chacune des sources de cette interaction. Qui pilote ce système d'interaction ?

Le modèle dit "de bas en haut" considère que les données et leur traitement dirigeraient la construction de la signification. Pour le modèle dit "de haut en bas", ce seraient les concepts, les connaissances du lecteur qui guideraient son traitement des données du texte.

Certains psychologues américains (PERFETTI 1982, LESGOLD & PERFETTI 1985), se référant aux théories du traitement de l'information, insistent sur l'existence d'un "processeur central", sur le plan cognitif, qui gérerait les données d'ordre inférieur (lettres et mots) et les données d'ordre supérieur (connaissances du lecteur) au croisement des processus ascendants et des processus descendants. Leur hypothèse d'une capacité limitée de traitement les conduit à privilégier l'automatisation des procédures de bas niveau (que certains réduisent aux associations grapho-phonologiques) afin de "libérer l'attention active mobilisée pour traiter le flux ascendant d'informations" (ADAMS & STARR 1982).

Les modèles interactifs définissent l'interaction comme la combinaison de sources multiples d'information pour produire des processus tels que, par exemple, l'identification d'un mot. Ainsi le modèle de PERFETTI (1982) est interactif au sens où cet auteur affirme que "les décisions d'identification des mots sont guidées par les informations conceptuelles de haut niveau", Mais son interactivité est définie comme "faible", car même "si les lettres et le contexte affectent tous les deux l'identification des mots, ils n'ont pas nécessairement d'influence directe l'un sur l'autre".

Le débat ainsi abordé concerne la nature de l'interactivité et il ne peut être poursuivi sans faire référence à deux paradigmes explicatifs : celui de FODOR (1.1) et celui de JOHNSON-LAIRD (1.2).

1.1 Le modèle de FODOR (1983)
Le modèle de FODOR est un modèle "modulariste" reposant sur l'idée que "l'accès au lexique" est insensible aux effets de contexte dans la mesure où le traitement du langage s'effectue dans des modules séparés, n'échangeant pas d'informations entre eux et impénétrables par les processus centraux. Ces modules sont de véritables sous-systèmes automatiques, encapsulés, qui peuvent être étudiés en tant que tels, indépendamment des autres modules (processeur lexical, processeur syntaxique,...). Plusieurs travaux confortent cette hypothèse.

Les travaux portant sur des enfants en cours d'apprentissage tentent de mettre en évidence la faible influence du contexte sur la lecture de mots par les "bons" apprentis lecteurs (PERFETTI & al. 1979). STANOVICH (1981) indique que ce sont les "moins bons" lecteurs qui semblent le mieux profiter des effets facilitateurs du contexte ; il justifie ce résultat en ajoutant que c'est la maîtrise de procédures automatisées d'identification de mots qui rend les "bons" lecteurs moins dépendants du contexte. L'hypothèse explicative généralement retenue est celle d'un "processus interactif compensatoire" selon lequel les processus descendants viendraient suppléer la faiblesse des processus ascendants, autrement dit que la dépendance des "faibles" apprentis lecteurs vis-à-vis du contexte serait due à la médiocre automatisation de leurs procédures de reconnaissance des mots. Cette hypothèse se réfère au paradigme de FODOR : les interactions auraient lieu à la sortie des modules, après l'échec des procédures d'identification automatique. En effet, selon FODOR, les informations linguistiques provenant des niveaux supérieurs de traitement (syntaxiques et sémantiques) ne seraient pas susceptibles de moduler les premières étapes du traitement lexical. C'est cet argument qui est constamment repris aujourd'hui pour justifier le retour à un travail systématique d'enseignement du code de correspondance grapho-phonologique au début de l'enseignement de la lecture. On peut, à ce propos, s'interroger sur l'amalgame qui est fait entre automatisation des procédures de bas niveau et automatisation des règles de correspondance grapho-phonologique. N'y aurait-il donc comme procédure de bas-niveau que le décodage grapho-phonologique ? Peut-on admettre que les processus automatiques soient moins sensibles que les processus "attentionnels" aux effets d'inhibition dans le cas de non-congruence entre le contexte et le mot-cible en raison de l'inégale "charge" cognitive qu'ils représentent et de leur inégale vitesse d'exécution.? En tout cas, rien ne permet d'affirmer que ces processus automatiques se réduisent à l'encodage grapho-phonologique ; au contraire, on peut envisager l'automatisation des procédures de reconnaissance visuelle et la structuration d'un répertoire graphique comme d'autres moyens (plus efficaces ?) d'atteindre ce résultat.

1.2. Le modèle de JOHNSON-LAIRD (1983)
D'autres travaux viennent pourtant contredire les hypothèses modularistes de FODOR et conduisent à redonner toute sa place au modèle explicatif de JOHNSON-LAIRD. Ces travaux portent sur les processus "mécaniques" ou "intelligents" qui régissent les mouvements oculaires (O'REGAN 1988) : ils tendraient à montrer que le point de fixation du regard pour l'extraction de l'information pertinente serait sensible aux effets de contexte. Autrement dit, les processus descendants auraient une influence dans la régulation de la visée préférentielle du regard, c'est-à-dire avant l'identification des mots. D'autres travaux, sur la lecture d'énoncés comportant des ambiguïtés lexicales, vont dans le même sens apportant des arguments en faveur d'un modèle interactif (DUBOIS & AUBRET 1988).

Comme le prévoit le modèle de Johnson-Laird, ces travaux montrent des relations d'interdépendance entre les différents processus : identification des mots, interprétation... Au plan des traitements linguistiques (syntaxique, sémantique, pragmatique), ils conduisent à réexaminer positivement les modèles d'activation de diverses sources d'information, y compris contextuelles (modèles d'activation à seuil, comme celui de MORTON).

Le débat concernant le rôle respectif des processus ascendants et descendants dans la compréhension du langage écrit reste donc, en résumé, totalement ouvert au niveau des processus ; demeure la question de savoir jusqu'où les traitements descendants (connaissances préalables du sujet sur le monde, sur les textes, sur la langue, sur les conditions de production...) peuvent prévaloir et interagir avec les traitements ascendants des "entrées" graphiques.

2. Quelques travaux expérimentaux antérieurs
Les recherches sur la lecture, dans le champ de la psychologie expérimentale, sont nettement séparées en deux domaines, n'ayant que peu de rapport l'un avec l'autre :
un secteur où l'on s'intéresse aux processus de perception des mots et à l'accès au "lexique"
un autre secteur où l'on étudie la compréhension, à travers l'analyse de l'intégration sémantique, de l'inférence ou de la représentation.

L'étude de la compréhension reste encore peu développée, sans doute en raison de l'immense complexité des processus, où tout se modifie simultanément et en interaction : les signifiants, les signifiés, les procédures, les capacités de contrôle, etc… (FAYOL, 1989). De nombreuses recherches ont lieu sur des phénomènes précis, présentant des difficultés particulières, comme la maîtrise des anaphores pronominales dans la lecture (REMOND, 1993), la maîtrise des connecteurs logiques, spatio-temporels… On sait également que la compréhension d'un texte repose sur un " pilotage " exercé en fonction des buts du lecteur et de la prise en considération de schémas conventionnels de textes (DENHIERE, 1992).

En revanche, le courant dominant des recherches en psychologie expérimentale s'intéresse aux mécanismes de perception et d'identification des mots, ainsi qu'à l'accès et à l'intégration de ces données dans un lexique mental. Ses représentants considèrent que seuls leurs travaux de reconnaissance de mots sont spécifiques de la lecture, alors que les phénomènes de compréhension sont " communs aux aspects de la compréhension de la parole " (SINATRA, 1990 ; ALEGRIA, 1991). Pourtant, le message oral s'écoule de manière irréversible et s'oppose en cela à la permanence de l'organisation spatiale de l'écrit. Même s'il peut être interrompu et questionné, il reste dans le domaine du temporaire. " Dès que le texte reste disponible, dès que le lecteur peut moduler sa vitesse de lecture et revenir à volonté en arrière, la compréhension [du langage écrit] n'obéit sans doute plus aux mêmes règles " (FAYOL, 1992). On pourrait sans doute aller encore plus loin en rappelant la très faible segmentation du langage oral par rapport aux marques importantes de coupures (mots, phrases, paragraphes) du langage écrit, ou encore l'extrême différence de vitesse de traitement (50 000 mots/heure pour un lecteur expert, contre 10 000 mots/heure pour l'oral) ; cette différence doit bien être influencée par la nature des opérations en jeu.

2.1. Autonomie entre la reconnaissance des mots et le contexte.
Les recherches ayant le plus d'écho en France, dans certains milieux pédagogiques, sont actuellement celles menées par le laboratoire de psychologie expérimentale de l'Université libre de Bruxelles, sous la houlette de J.Alegria et J.Morais. Nous l'avons déjà mentionné, cette équipe dissocie la perception des mots de la compréhension de ceux-ci. Il s'agit d'une séparation temporelle (on identifie, puis on traite cette information) ; c'est de fait une séparation cérébrale : la forme écrite doit activer un signifiant dans " un lexique interne où les mots qu'il [le lecteur] connaît, sont stockés de manière relativement stable. Ce lexique lui permet de comprendre et de produire le langage, tant écrit qu'oral. " (ALEGRIA, 1991). Cet auteur apparente le rôle du contexte (dans le sens où celui-ci produirait une activation des entrées lexicales qui ont un rapport avec lui) aux phénomènes d'" amorçage sémantique ". Ces travaux, très nombreux dans ce champ, montrent que l'identification d'un mot active un domaine sémantique, et que la reconnaissance d'un mot présenté ensuite dans un laps de temps très court (environ 30 ms) sera bien plus rapide si ce deuxième stimulus appartient au même réseau sémantique. Alegria ne considère pas que ce processus soit de quelque utilité dans la lecture véritable, car l'activation reste trop attachée à un réseau activé par la présence d'un mot. Pourtant, Sereno montre comment une amorce sémantique peut aussi être activée par une phrase entière (SERENO, 1992), tout en rappelant des études antérieures allant dans ce sens (SCHUBERT, 1977). L'étude de Sereno, portant spécifiquement sur les effets d'amorçage sémantique introduits par une phrase, démontre clairement que cet amorçage existe bien pendant un temps très court (28-31 ms) ; cette courte durée de vie (Sereno a montré qu'il disparaissait après 40 ms), surtout quand cet amorçage n'est rappelé qu'à partir d'influences lexicales, permet bien souvent de nier le rôle du contexte dans la lecture.

En résumé, pour les tenants de cette dissociation entre le contexte et l'identification des mots, le lecteur commencerait par traiter les données graphiques, à un niveau inférieur, puis le résultat de cette tâche serait communiqué de manière hiérarchique à un niveau de traitement supérieur. La détection des mots serait donc insensible aux effets de contexte, effets qui n'entreraient en jeu que dans les processus de décision relevant d'un niveau de traitement plus élevé (FORSTER, 1979) . Les différents sens des mots possibles seraient ainsi tous activés, le contexte se chargeant ensuite de la sélection du bon sens.

Ce type de travaux s'inscrit tout à fait dans l'hypothèse modulariste (FODOR, 1983). On y considère que le contexte discursif précédant un mot (ambigu par exemple) n'est d'aucune utilité sur les premiers moments du processus d'assignation de sens. Le contexte ne commencera à jouer un rôle que quand le sens sera sélectionné. Le lecteur accédera à la signification du mot dans un processus temporel qui est indépendant du contexte discursif. Dans le cas d'un accès au sens d'un mot ambigu (soit parce qu'un des sens est très fréquent mais improbable dans ce contexte, soit parce que plusieurs sens ont tous le même degré de possibilité), pour chacun des sens successivement révélé, le "processeur" va essayer de l'incorporer au contexte. Quand un des sens est intégré avec succès, le processus d'accès lexical sera stoppé. Plus concrètement, ce modèle présuppose que le sens dominant d'un mot ambigu sera sélectionné en premier. Le modèle de Fodor considère que le "processeur" essayera d'intégrer le sens au contexte précédant dès qu'il y aura accès.

Dopkins (DOPKINS, 1992) a travaillé sur la lecture de phrases contenant des mots-cibles ambigus possédant un sens dominant et un sens secondaire. Ils sont précédés de contextes antérieurs "positifs" (qui influenceraient la sélection du sens secondaire d'un mot, sans rendre impossible le sens dominant), "négatifs" (qui empêcheraient la sélection du sens dominant) ou encore "neutres" (sans influence possible sur la sélection du sens). Il a fait suivre ces mots-cibles de séquences levant l'ambiguité, mais toujours en n'autorisant que la sélection de la signification secondaire du mot-cible. Dans le cas du contexte antérieur positif, le modèle de Fodor prévoit que le "processeur" intégrera le sens dominant du mot-cible, sans recourir au sens secondaire, puis continuera la lecture du reste de la phrase. En y rencontrant la séquence désambiguïsant le mot-cible, le "processeur" réalisera sa faute et recalculera le sens du mot. Dans le cas du contexte négatif, le contexte précédant le mot-cible interdira au "processeur" d'intégrer le sens dominant et attendra que le processus d'accès lexical lui propose le sens secondaire. Du coup, le matériel linguistique suivant le mot-cible ne jouera plus son rôle désambiguïsant.

En conséquence, ce genre de prédiction amène à prévoir :
des temps de travail sur les mots ambigus plus longs pour les contextes antérieurs négatifs que positifs ou neutres (parce que le "processeur" devra y faire une pause pour attendre que le sens secondaire soit activé)
des temps de travail plus longs sur des contextes postérieurs de mots ambigus dans des situations antérieures positives ou neutres (parce qu'il y sera fait le recalcul de sens du mot ambigu)

Ce genre de système reste très marqué par l'approche computationnelle du cerveau. On y conçoit un mode de travail séquentiel, certes très rapide, mais toujours très proche du type de fonctionnement d'un ordinateur. Si un temps, on a cru pouvoir modéliser un certain nombre de fonctions cérébrales supérieures, aujourd'hui le propos est certainement de souligner les différences essentielles de comportement entre un cerveau et un ordinateur (DAMASIO, 1995 ; BERTHOZ, 1996).

2.2. L'importance du contexte dans la reconnaissance des mots.
Malgré le poids important du modèle modulariste, de nombreux travaux viennent contredire cette thèse.

Si l'on continue l'exemple donné précédemment, traitant des contextes positifs, négatifs ou neutres, un modèle plus interactif prévoit que le contexte précédant le mot-cible aura un effet sur l'accès initial à la signification en cas de contexte positif, mais pas si le contexte est négatif ou neutre. Dans le contexte positif, le matériel linguistique contient des informations qui influencent le choix du sens secondaire, favorisant donc sa sélection première, avant de se mouvoir sur la suite de la phrase. Dans les conditions négatives et neutres, le contexte ne permettra pas de "pré-lever" le sens secondaire et l'on se retrouverai proche du problème décrit plus haut. Dans le contexte négatif, le sens dominant ne devrait pas être sélectionné, mais le modèle prévoit plus de bénéfices positifs que négatifs. En effet, si le modèle permettait des incrémentations négatives, il deviendrait impossible de prendre des décisions dans un contexte discursif complet, tant les mots recèlent de sens cachés et donc inappropriés à un contexte particulier. Ce modèle prévoit donc :
un temps de travail sur les mots ambigus plus long pour les contextes négatifs que pour les contextes neutres.
un temps de travail sur les séquences désambiguïsant les contextes positifs et négatifs plus court que pour les contextes neutres (il n'est pas nécessaire de recalculer le sens parce que le contexte l'a "pré-levé").

Un point important reste en suspens dans ce modèle : que se passe-t-il pour les mots ambigus en contexte positif ? Dans ce cas, le contexte précédent va influer sur la sélection du sens secondaire, de sorte que la signification sera accessible plus tôt. Il est impossible de prédire le gain exact dans ce cas. Soit le sens secondaire est activé en même temps que le sens dominant et les deux significations sont en concurrence, soit le sens secondaire est accessible avant le sens dominant, car le contexte le fera devenir temporairement dominant. Malgré tout, dans ce cas, la résolution du dilemme se fera avant de continuer la lecture. On est ici devant un cas exemplaire de la question de la force de l'interaction. Soit elle est faible et les deux sens sont en compétition et le contexte résout le problème, soit elle est forte et elle l'a résolu avant, en modifiant de façon temporaire la représentation dominante du mot ambigu.

Dopkins, Morris et Rayner ont montré que le temps de fixation sur les mots ambigus (comprenant le premier passage et les retours éventuels sur ces mots) était significativement inférieur pour les contextes positifs et négatifs. En conséquence, il semble bien exister un effet de contexte sur les processus d'identification des mots, amenant ces auteurs à déclarer " ces résultats sont incompatibles avec le modèle modulariste et suggèrent que le contexte influence l'accès au lexique" (DOPKINS, 1992).

De nombreux travaux se situent dans cette optique qui semble aujourd'hui dominer le champ, même si la force de l'interaction reste très discutée. Citons en particulier Trueswell qui travaille sur des ambiguités grammaticales, introduites par des formes passives. Il postule pour encore plus d'interactivité, non seulement lexicale, mais aussi grammaticale et thématique (TRUESWELL, 1994). Il intègre aussi des compétences linguistiques en travaillant sur les fréquences de formes verbales dans cette résolution d'ambiguïtés sur le passif. Notons que sur un plan purement lexical, on a pu observer des effets de fréquence du vocabulaire sur le temps de fixation des yeux (VITU, 1990 ; INHOFF, 1986).

2.3. Une réflexion critique sur ces travaux
Toutes ces recherches de laboratoire de psychologie appellent quelques commentaires plus généraux.

Tout d'abord, on comprend bien le continuum que représente l'appel au contexte sur la façon de prendre des décisons quand au sens des mots. D'un côté, il n'existe que pour juger le sens après qu'il ait été sélectionné, de l'autre il contraint la sélection du bon sens (même si après, cette décison peut être remise en cause). On va donc d'un processus autonome à une prise en compte de différents aspects dans la reconnaissance des mots. Cependant, le contexte, quand il est évoqué par des psycho-cognitivistes de laboratoire, reste cantonné aux quelques mots précédant une ambiguité. Or, qu'il joue ou ne joue pas, ce contexte est nécessairement bien plus vaste et s'il joue, il inclut alors une multitude de compétences et de savoirs qui ne sont jamais pris en compte par ces recherches. On peut donc supposer qu'on est loin d'avoir épuisé la question et que le contexte peut jouer un rôle plus important que ce qui est décrit ici.

D'autres part, ces expériences s'intéressent à la reconnaissance de mots isolés, dans des dispositifs expérimentaux très réducteurs. Il importe pour ces recherches que l'œil fasse une fixation sur chacun des mots présentés. Pourtant, affirmer avec Gombert (GOMBERT, 1996) que l'on sait, maintenant que l'on peut enregistrer des mouvements extrêmement rapides, que l'œil se pose pratiquement sur tous les mots du texte est une extrapolation audacieuse des travaux de recherche en cours. Pour autant, ces travaux sont à examiner avec attention. Bien peu annoncent la "vitesse de compréhension" du lecteur au cours de leurs observations. Il semble toutefois qu'un accord existe sur la durée des deux événements repérables : en moyenne, 250 millièmes de seconde pour une fixation et 50 ms pour une saccade de déplacement (VITU, 1990). Si l'on tient compte des retours en arrière et des passages à la ligne, on peut alors considérer qu'il y aurait dans une lecture suivie environ 13 000 paires fixation+déplacement à l'heure. S'il était exact que chaque mot donne "pratiquement" lieu à une fixation, on ne dépasserait pas une vitesse de lecture de 13 000 mots/heure, à rapporter, comme par hasard à la vitesse de l'oralisation et au choix des conditions expérimentales. Pour autant, les bons lecteurs en lecture "intégrale" (donc sans recourir à "l'écrémage") comprennent aisément un texte ordinaire à plus de 20 000 mots/heure. Aucun chercheur ne devrait pouvoir affirmer aujourd'hui et en ces termes que l'œil s'arrête sur tous les mots.

Bien au contraire, une recherche conduite en 1991 à l'INSERM U305 de Toulouse par L.BASSOPU, M.GRANIE, A.P.PUGH et J.P.MORUCCI sur la coordination binoculaire chez de jeunes lecteurs apporte de nouvelles précisions. Ces chercheurs tiennent notamment compte de la vitesse de lecture des sujets. "L'amplitude de la saccade de progression détermine la plage de lecture. Plus celle-ci est étendue, plus le nombre de fixations est réduit et plus la lecture est rapide. Les lecteurs lents (vitesse de lecture inférieure à 9000 mots/heure) font des saccades de progression de faible amplitude par rapport aux lecteurs rapides (2°39' contre 4°23)." Cette amplitude est donnée ici en degrés d'arc mesurant l'angle visuel . Dans leur protocole de recherche, une ligne de texte est vue sous un angle de 21°10' et, par exemple, le mot "les" affiché à l'écran est vu sous un angle de 1°08'. Si une saccade moyenne chez un lecteur lent (2°39') dépasse déjà la longueur moyenne d'un mot (entre 5 et 6 caractères en français), c'est plus du double chez un enfant de 10 ans bon lecteur, soit en moyenne 3 mots, ce qui ne signifie pas non plus une amplitude régulière et mécanique des empans mais invalide complètement l'existence d'une fixation par mot. Notons que les meilleurs lecteurs que nous avons pu voir lisaient à des vitesses voisines de 60 000 mots/heure, soit environ 100 signes par seconde. A cette vitesse-là, nous arrivons à des empans moyens de 25 signes soit environ 6 mots. De ce rapide calcul, nous pouvons déduire que la taille de l'empan de lecture pour un lecteur véritablement expert est d'environ 10°, soit approximativement la moitié d'une ligne.

Le recrutement, par les laboratoires de recherche, des sujets d'expérience se fait, le plus souvent, parmi les étudiants de l'université, sans jamais mesurer leur degré de compétence en lecture. Nos propres observations, portant sur des populations de professeurs, montre une vitesse moyenne de lecture de l'ordre de 12 000 mots par heure. On verra plus tard que certains enfants de notre cohorte ont déjà des performances bien supérieures… Il est donc évident que les études de psychologie ne tiennent pas compte de ce qui se passe ordinairement chez un lecteur expert en situation réelle de lecture. Et, en particulier, si l'empan de lecture augmente de façon aussi considérable, peut-on se dispenser de s'interroger sur les performances intrinsèques de l'œil.

2.4. Vision nette et vision dégradée
Chez l'Homme, la fovéa, petite dépression d'environ 1,2 mm de diamètre située au centre de la tache jaune ou macula, se caractérise par une grande finesse dans son pouvoir de discrimination spatiale, ainsi que par son importance pour la vision des couleurs. Elle contient exclusivement des cônes, tous les éléments non récepteurs ainsi que les vaisseaux sanguins étant refoulés à sa périphérie, ce qui a l'avantage de laisser la lumière frapper directement les récepteurs. Leur densité est très élevée. Chaque cône est connecté à une cellule bipolaire. Au fur et à mesure qu'on s'éloigne de la fovéa, les cônes deviennent plus rares ; les bâtonnets progressivement prédominent. Ici, les prolongements dendritiques des cellules bipolaires font contact avec un nombre important de bâtonnets.

Figure 1 : Schéma de l'œil

La vision fovéale, donc la vision la plus nette, couvre environ 1° du champ visuel, chez l'Homme, alors que le champ total, incluant la vision périphérique, totalise près de 160° degrés. La dégradation de la netteté se fait progressivement, au rythme d'environ 50 % de dégradation par degré d'écartement.

Figure 2 : densité relative des cônes (ligne continue) et des bâtonnets (ligne pointillée), et la fidélité d'identification d'un mot-cible à une distance variable du centre de la rétine (ligne hachurée). (Rayner & Pollatsek, 1989)

Nous avons vu que chez un lecteur expert, la taille de l'empan de lecture peut atteindre 10°. En conséquence, ce lecteur traite des informations très dégradées en bord d'empan, informations provenant des régions plus périphériques de l'œil. Ces régions sont communément appelées parafovéales. Elles jouent sans conteste un rôle à chaque fixation de l'œil.
Nous allons maintenant évoquer le rôle des informations parafovéales sur le temps de fixation de l'œil.

2.5. La vision parafovéale et la lecture (recherches récentes)
Quelques équipes de recherche se sont particulièrement spécialisées dans l'étude de la prise parafovéale d'informations dans la lecture. La question est ici de savoir le rôle exact du mot à droite (donc dans la zone parafovéale) du mot fixé qui se trouve, lui, dans la zone fovéale. Depuis 1981 et les travaux de Rayner, on sait que si on retire des informations (par des systèmes de masques) de la zone parafovéale, la vitesse de lecture décline d'environ un tiers. Cette réduction de vitesse est due à l'accroissement des temps de fixation, à des saccades oculaires plus courtes, et à un plus grand nombre de fixations. Les informations sur les mots, obtenues par une vision parafovéale, facilitent l'identification du mot suivant (INHOFF & RAYNER, 1986). On peut se demander quels sont les modes d'action de cette prise d'informations. D'après Inhoff (INHOFF, 1982), il paraît improbable que la vue parafovéale active directement une attente sémantique qui accélérerait la reconnaissance du mot. Pour preuve, les bénéfices habituellement observés dus à la vision parafovéale disparaissent si, lors du déplacement de l'œil sur le mot suivant, on remplace celui-ci par un mot sémantiquement proche. Précisons que l'œil ne prend pas d'information pendant le déplacement (BERTHOZ, 1996), ce qui justifie le choix du moment où on modifie le mot suivant.

On a pu croire que la reconnaissance des mots pouvait se faire de manière séquentielle, ce modèle étant défini par TAFT & FORSTER (TAFT & FORSTER, 1976). Il s'agirait ici d'un accès dans un fichier qui contiendrait des représentations de morphèmes des radicaux, classées par fréquence. La vision parafovéale aurait donc permis de pré-activer la bonne entrée dans ce " fichier ", grâce à la vue anticipée du radical du mot suivant. Inhoff (INHOFF, 1989) montra que cette hypothèse était fausse. Il rejeta aussi, l'hypothèse de l'influence de la première syllabe comme activation du mot à trouver ("La reconnaissance d'un mot lors de sa fixation n'est facilitée par la vision parafovéale antérieure de ses premières lettres, qu'elles forment une syllabe ou non. " ).

Les observations conduisent cet auteur (et de nombreux autres à sa suite) à recommander des modèles qui contiennent au moins deux aspects. Les modèles viables doivent d'abord considérer que le début et la fin des mots contribuent à la reconnaissance périphérique des mots et ensuite que les bénéfices dus à la vision parafovéale sont fonction de la totalité de la morphologie du mot dans lesquelles les lettres apparaissent. En effet, on obtient de plus grands bénéfices en tenant compte des informations données par l'ensemble du mot périphérique qu'en cumulant les données issues du premier trigramme et de la fin du mot.

Ce type d'observation renforce les modèles de reconnaissance logographique, développés en leur temps par Adams (1979), McClelland & Rumelhart (1981). Ces modèles semblent offrir un bon point de départ pour la compréhension des bénéfices de la vision parafovéale dans la lecture normale. Par exemple, " toutes les lettres (où les silhouettes des lettres) d'un mot accessible par la vue périphérique peuvent activer des représentations de lettres (et de possibles représentations lexicales) " (INHOFF, 1989).

Ces modèles logographiques sont aujourd'hui très décriés, surtout dans les modèles développementaux de la lecture. On les considère comme des phénomènes très primitifs (" …les modalités primitives (logographiques) de traitement de l'information graphique ") (SPRENGER-CHAROLLES, 1992), appelés à être remplacés par des modalités grapho-phonologiques ou alphabétiques (FRITH, 1986 ; GOMBERT 1996). On associe, souvent de manière caricaturale, cette capacité à certains types d'enseignement " qui prennent la lecture pour une tâche de mémorisation visuelle " (MORGAN & COLTHEART, 1988). Pourtant, elles semblent nécessairement à l'œuvre dans la reconnaissance par la vue périphérique, capacité " mathématiquement " indissociable d'une lecture experte.

En effet, ces travaux continuent de faire l'hypothèse que l'on marque un temps d'arrêt sur chacun des mots d'un texte. Il est facile de montrer qu'il n'en est rien. Il faut en déduire que le cerveau d'un lecteur traite les informations floues, parafovéales, non seulement pour guider la position du point de fixation suivant, mais aussi pour en extraire des données sémantico-lexicales.

2.6. Quelques travaux ophtalmologistes
Le laboratoire de recherche sur la vision de l'Université du Minnesota a entrepris des recherches pour comprendre les conséquences sur la lecture de la perte de champ visuel. Ces travaux retiennent l'attention, tant il apparaît que l'ensemble de l'œil participe à la lecture, et pas seulement la fovéa. G.LEGGE et son équipe ont développé un modèle informatique d'observation et de simulation de la lecture, nommé Mr Chips. Ils ont évalué les performances en lecture en fonction de la taille de l'empan visuel, c'est-à-dire du nombre (N) de caractères adjacents qui pouvaient être reconnus. La tâche de Mr Chips était de se mouvoir dans un texte en un nombre minimum de saccades, tout en identifiant tous les mots. Deux sources d'informations étaient disponibles pour Mr Chips :

Des données visuelles, N lettres identifiables clairement ; plus des données périphériques de moindre résolution, qui présentaient les lettres par des * et les espaces par des signes (_). Un peu comme des données de bas niveau…
Des données lexicales, les mots possibles et leurs fréquences. Un peu comme des données de haut niveau…

Les distributions des saccades oculaires furent mesurées pour des empans visuels variant de 1 à 11 lettres.

Figure 3 : étude du champ visuel

Variation du champ périphérique.
Les quatre schémas suivants montrent l'effet de la perte d'information due à une amputation d'une partie périphérique du champ visuel.

La figure 4 montre les saccades oculaires quand le
lecteur n'est pas perturbé par des masques.

La figure 5 représente un cas où les saccades sont exactement égales au champ visuel, par suppression des deux champs périphériques.

En figure 6, on a retiré le champ gauche. On remarque une légère diminution de la taille moyenne des saccades.

Figure 7 : la suppression du champ périphérique droit cause une sévère diminution de la taille moyenne des saccades, un plus grand nombre de régressions et une plus grande variabilité de la taille moyenne des saccades.

Ainsi, si la vision d'un empan se limite à la zone centrale, les performances diminuent sensiblement, les mouvements des yeux deviennent erratiques (on constate un grand éparpillement des saccades). Les informations données par les zones périphériques jouent donc un grand rôle dans la fluidité de la lecture.

L'influence du lexique sur les saccades

Figure 8 : Augmentation de la taille des saccades quand les connaissances lexicales sont utilisées.

Dans une autre expérience, on introduit deux types de lexique, variant par leur taille et par la connaissance du lexique que l'on peut avoir. La figure 8 montre une augmentation de la taille des saccades quand on mobilise des connaissances lexicales, ce qui conforte un peu plus les hypothèses interactionnistes.
On remarque également que plus le nombre de lettres (N) (largeur de l'empan) est élevé, moins les connaissances lexicales sont utiles. Les données purement graphiques augmentant en proportion de la taille de l'empan considéré, les phénomènes logographiques pourraient intervenir de façon plus importante que ce qui est communément admis. Nous reviendrons sur ce point dans le chapitre II.

2.7. La saccade occulaire.
Il est régulièrement fait état de l'étude des saccades oculaires dans la lecture. Mais ce phénomène est aussi un objet d'étude physiologique ; on l'observe dans les différentes aires corticales et dans le cerveau profond. Son étude est d'une trop grande complexité pour être véritablement traitée ici, néanmoins nous allons évoquer quelques points.

Le mécanisme neuronal de production des saccades est contrôlé au moins autant par des neurones excitateurs que par des neurones inhibiteurs. Ainsi, "la décision de faire un mouvement des yeux, accompagné ou non d'un mouvement de la tête est prise à travers une hiérarchie de mécanismes parallèles excitateurs et inhibiteurs" (BERTHOZ, 1996). Il semble que l'évolution ait amené dans le cerveau des primates un bien plus grand nombre de mécanismes inhibiteurs, ce qui a été utilisé pour "bloquer l'exécution d'un mouvement, de façon à permettre la simulation interne des mouvements planifiés et à tester de façon endogène ses conséquences potentielles" (BERTHOZ, 1996). Ces simulations permettent de faire des prédictions et de " sélectionner les stratégies motrices ". De plus quelques données montrent même, dans certaines conditions, une capacité du cerveau à anticiper sur la saccade qui suivra la saccade à faire.

On peut donc déduire de ces quelques faits, l'extrême capacité du cerveau à simuler les actions à effectuer, dont les saccades oculaires, à les piloter en fonction du résultat qu'il pense en obtenir. On n'est plus du tout dans une conception mécanique de la saccade, comme une suite de mouvements servant à prélever de l'information, on est bien dans un mouvement dont les conséquences ont déjà été anticipées. La perception n'est plus seulement préparatoire à l'action, c'est l'action qui définit la perception dont elle a besoin.

Berthoz a résumé ce nouveau modèle en écrivant que "le cerveau n'est pas une machine réactive, c'est une machine proactive qui projette sur le monde ses interrogations" (BERTHOZ, 1996b). Sauf en lecture ?

3. Première conclusion
On le voit, toutes ces recherches sont loin d'avoir épuisé le domaine. Au contraire, les multiples spécialités (psychologie, neurologie, ophtalmologie, neurophysiologie, pédagogie) renforcent un peu plus la complexité de la question de la lecture, d'où la nécessité de recouper les informations de toutes les disciplines.

Nous avons insisté sur l'importance des données contextuelles pour la reconnaissance des mots (bien que cette hypothèse ne soit pas celle majoritairement retenue dans le domaine de la pédagogie, si l'on se réfère aux instructions officielles ou aux contenus de manuels scolaires). Thèse néanmoins chère aux interactionnistes. L'interaction pose cependant également un problème : présentée d'abord comme une modélisation du processus de lecture, c'est-à-dire de l'opération qui permet d'attribuer une signification à de l'écrit, elle devient progressivement l'opération par laquelle s'opère l'identification de l'écrit (les unités de haut niveau se réduisant alors à des effets de contexte), renvoyant à l'extérieur de l'interaction (ensuite) la compréhension de cet écrit identifié, c'est-à-dire décrypté. Ce qui reviendrait alors à nouveau à séparer le processus interactif de l'intention de lecture, autrement dit à le rendre autonome de l'intention de lecture. Ne retourne-t-on pas à l'encapsulage du processus interactif dès lors qu'on propose de remplacer la définition " lire, c'est comprendre " par " lire, c'est pour comprendre " ?

Pourtant, l'intention semble bien être la base de l'action. Aucun des modèles psychologiques que nous avons étudié ne met au centre de l'action le but qu'elle se fixe, que l'objet d'étude soit la saccade oculaire, l'identification de mots, la compréhension d'un énoncé. Cela nous semble un point assez faible des modèles explicatifs de la lecture. On se contente d'étudier la (une) façon dont le cerveau traiterait des stimuli, en construisant des modèles qui éloignent le but de l'action. Or les neurophysiologistes les plus avertis considèrent le cycle perception-action comme indissociable. " L'exploration du monde visuel par un sujet serait défini par des schèmes anticipatoires définis comme des plans pour l'action perceptive. " (BERTHOZ, 1996b). Cette grande place accordée à l'anticipation est de fait exclue des recherches que nous avons citées auparavant qui déconnectent la perception de cette anticipation.

Un autre point préoccupant est la non prise en compte du niveau de lecture des sujets participant aux expériences de psychologie cognitive. Alors qu'on prétend étudier une lecture " experte ", on ne contrôle pour ainsi dire jamais cette variable. Or, le problème de la vitesse de lecture est en réalité celui de la taille de l'empan à chaque point de fixation de l'œil. Presque toutes les recherches reposent sur le postulat d'un point de fixation par mot. Nous avons vu que cette assertion est impossible, et que le lecteur expert procède par groupes de plusieurs mots. Il est donc confronté à des informations dégradées à la périphérie de son point de fixation.

Les lettres se situant en dehors de la zone nette (3-4 lettres) sont de moins en moins identifiables au fur et à mesure qu'elles s'éloignent du centre de la fixation oculaire. Comment sont-elles traitées ? Nous allons, dans le chapitre suivant, nous livrer à une simulation de cette vue dégradée en utilisant cette fois comme matériau d'étude les mots français.

Chapitre 2 : Empans et silhouettes de mots : une vue statistique sur le lexique français des mots de dix lettres.
Revenons sur l'évidente contradiction entre la plage de netteté de la vision, plage définie par des contraintes physiologiques très stables, et la plage de lecture, décrite comme la quantité d'écrit séparant deux fixations, plage très variable selon la compétence du lecteur. C'est précisément ce non-recouvrement de l'empan visuel (vision nette au sens de Legge, étudié dans le chapitre I) et de l'empan de lecture qui permet de questionner les processus psychologiques à l'œuvre chez le lecteur.

La comparaison des deux empans oblige à se demander pourquoi la plage d'écrit chez le lecteur expert déborde largement les trois ou quatre signes concernés par la zone de netteté de l'empan visuel, alors qu'on sait que la perte de netteté est déjà de 50 % à 1 degré de part et d'autre de la fixation, et se dégrade de 50 % à chaque degré supplémentaire. On peut se demander si le lecteur expert ne travaille pas majoritairement sur du flou, autrement dit si le lecteur expert n'utilise pas un autre système de codage que celui constitué des quelques 80 signes du système alphabétique, un système de codage beaucoup plus court (constitué de beaucoup moins d'éléments) puisque, en vision floue, plusieurs vont être remplacées par une même forme, une même silhouette. Ce système de codage court qui correspondrait à la réalité de la vision parafovéale fait perdre de l'information. Par quoi le lecteur expert remplace-t-il cette information manquante dans le bas niveau ? Cette information compensatrice ne peut provenir que du haut niveau (il n'y a pas de troisième source). Cette information viendrait alors déjouer le flou, lever les ambiguités en créant un horizon d'attente dans lequel le codage court redeviendrait pertinent.. Je crois qu'on cherche très loin le principe de l'interaction alors qu'il est peut-être là sous nos yeux, à tous les sens du mot. Les informations graphiques ne sont pas exploitables de la manière où on les voit, elles ne permettent pas d'identifier un signifiant, et encore moins un signifié si on ne va pas à leur rencontre muni d'informations probabilistes qui anticipent l'incertitude. On rejoindrait alors les analyses de BERTHOZ : la prise d'informations et la compréhension, c'est la même opération, ce qu'a tendance à faire oublier le mot interaction qui en vient à faire exister deux processus distincts qui se rejoindraient. Ne vaudrait-il pas mieux imaginer qu'il y a deux sources d'informations qui sont traitées par une seule opération ?

Mais cette interaction n'est "visible" qu'à travers l'impossibilité de comprendre des mots formés de caractères flous ; on ne peut l'observer que chez le lecteur expert en situation de lecture. Dès qu'on quitte cette position, on se retrouve à travailler sur un codage long et en vision fovéale : les informations graphiques peuvent être efficacement transformées sans recours à d'autres informations sauf un système autonome de décodage ; il n'y a plus d'interaction mais une identification qui précède un traitement. En 1994, sans connaître la recherche de LEGGE, j'ai procédé, à la demande de l'équipe INRP/AFL, à une simulation de cette interaction par ordinateur, travail qui a donné lieu à la publication d'un article en 1995 dans LES ACTES DE LECTURE.

La question : est-ce le même traitement de l'information, le même processus psychologique qui permet de comprendre un texte, selon que l'information prélevée est de 2 ou 3 lettres vues simultanément ou d'une quinzaine individuellement mal identifiables ? Au cours de la lecture, que faut-il ajouter pour qu'un groupe de mots s'identifie, non à partir des lettres qui le composent, et que l'œil ne peut voir dans leur détail, mais à partir d'une silhouette créée par la forme générale de ces lettres perçues en vision périphérique ? L'article s'est intitulé : Empan et silhouettes. Il s'agit essentiellement d'une approche statistique des phénomènes de silhouettes sur les mots français de huit à onze lettres, approche croisée avec une indexation sémantique et syntaxique de ces mêmes mots. Nous avons envisagé principalement ceux de 10 lettres, leur taille garantissant à la fois une fréquence relativement élevée, et une complexité lexicale.

Une typologie des lettres en sept formes
Retenons ici 7 formes de lettres :
- 6 lettres tiennent dans un carré : n r u v x z n
ce sont des lettres basses dont les éléments sont rectilignes
- 5 lettres tiennent plutôt dans un rond a c e o s a
encore des lettres basses mais où domine du courbe
- 2 lettres s'inscrivent dans un rectangle horizontal : m w m
des lettres basses qui se distinguent par leur largeur
- 6 lettres dans un rectangle ascendant : b d f h k t b
des lettres larges et hautes en imprimé comme en manuscrit
- 6 lettres dans un rectangle descendant : g j p q y ç y
les mêmes mais sous la ligne
- 2 lettres tiennent dans un trait vertical : i l l
les anti m ou w, des lettres "fil"
- 11 lettres accentuées â

Pourquoi retenir sept formes plutôt que cinq ou quinze? Aucun choix ne saurait se justifier complètement. Et là n'est sans doute pas la question car personne ne sait les formes de lettres que chaque lecteur opérationnalise. Ce que nous allons tenter de mettre en évidence avec ce regroupement des lettres en sept formes serait sans doute localement différent avec un autre choix mais ne serait pas, pour autant, affecté dans sa signification générale qui porte sur les conséquences du passage d'un codage long à un codage plus court.

2. Un essai statistique : les silhouettes des mots de 10 lettres
Pour conduire cette exploration, nous utilisons les possibilité d'un logiciel : Analyse de textes. Il possède un corpus de 33 742 mots-souches (sans compter les expressions) dont la déclinaison (conjugaison, féminin, pluriel) génère 263 041 mots. Nous nous attachons dans ce travail à toutes les formes écrites comptant 10 lettres déclinables à partir des mots souches. Ainsi nous trouverons les mots qui, dans leur forme canonique (leur entrée dans un dictionnaire, ce que nous appelons mot-souche), comptent 10 lettres : par exemple, volontiers graduation malheureux échafauder ; et aussi les formes déclinées de n'importe quel mot-souche, lorsqu'elles comptent 10 lettres : par exemple, échiquiers dangereuse trouveront... Le total est de 39 896 formes.

En remplaçant chaque lettre par l'une des sept formes présentées, nous transformons ces 39 896 mots en autant de silhouettes de mot ;
par exemple :

volontiers nalanblana
graduation ynabnablan
malheureux malbannann
échafauder âababanban
échiquiers âablynlana
dangereuse banyananaa
trouveront bnannenenb

Deux mots distincts peuvent avoir exactement la même silhouette. Le nombre théorique de silhouettes différentes qui pourraient se rencontrer en combinant sept formes différentes de lettres à n'importe quelle place dans un mot de 10 lettres est la dixième puissance de 7, soit : 282 475 249.

Voici le tableau résultant de la transformation des lettres par le codage en 7 formes :

Tableau 1 : répartition des mots par silhouette

Mot(s) par silhouettes

Nombre de Silhouettes

%

Nombre de mots

%

1

18987

68,83 %

18987

47,59 %

2

6547

23,73

13094

32,82

3

1060

3,84

3180

7,97

4

658

2,38

2632

6,59

5

182

0,66

910

2,28

6

79

0,29

474

1,18

7

27

0,10

186

0,47

8

15

0,05

120

0,2

9

9

0,03

81

0,2

10

12

0,04

120

0,3

11

0

12

1

0,003

12

0,03

13

1

0,003

13

0,03

14 et +

6

0,02

84

0,21

27584 silhouettes

39896 mots

Le tableau 1 donne la répartition générale. On le lit ainsi : 18 987 silhouettes (soit 68.83 % des silhouettes) contiennent 1 mot, ce qui représente 18 987 mots (soit 47.59 % des mots de 10 lettres) ; 6 547 silhouettes (soit 23.73 % des silhouettes) contiennent 2 mots, ce qui représente 33 % du corpus, ...

Les mots de 10 lettres donnent 27 584 silhouettes distinctes ; 8 597 silhouettes auxquelles au moins deux mots correspondent ; 18 987 mots originaux c'est-à-dire qui sont seuls à avoir la silhouette qu'ils ont. On rencontre donc, en moyenne, 2.43 mots par silhouette "multiple" et, d'une manière générale, le rapport entre le nombre de mots de 10 lettres et le nombre de leurs silhouettes est de 1.45, ce qui semble assez faible. En effet, on passe d'un codage à l'aide de 38 signes (on n'a pas utilisé ici les majuscules ni les signes de ponctuation) à un codage à l'aide de 7 signes donc un répertoire de signes 5 fois moins étendu et on aurait pu s'attendre à ce que ce codage court différencie beaucoup moins bien les mots réellement codés par 38 éléments. Il y a, certes, une perte du pouvoir différenciateur de la silhouette par rapport au mot réel mais faible puisqu'on passe de 1 mot pour 1 mot à 1 silhouette pour 1.45 mots. Cette perte est à rapprocher du gain puiqu'avec ce codage court, l'empan de lecture "traite" dans le même temps cinq fois plus de matière que l'empan visuel. Nous ne sommes pas, pour autant, en train de suggérer qu'il serait plus simple de remplacer l'alphabet par sept archi-signes. La vision parafovéale s'en charge bien toute seule...

2.1 Les Mots=silhouettes (silhouettes originales)
Le signe (=) est ici une convention volontaire.

Ces 18 987 "mot=silhouette" constituent une catégorie intéressante : chaque mot a une silhouette originale. Par exemple, le mot "prendrions" a la silhouette ynanbnlana et cette silhouette ne correspond qu'à prendrions. On rencontre dans cette catégorie des mots peu fréquents en français (par exemple, bouquetins, inventorié, hypnotisme) mais aussi des mots fréquent (tels population, professeur, mettraient). On peut affirmer que si l'alphabet ne comptait que les 7 "archi-signes" retenus, au lieu des 38 lettres usuelles, ces mots continueraient à être parfaitement différenciés par leur silhouette. Avec d'autres archi-signes, on obtient certes d'autres résultats mais qui ne changent rien à la problématique. Un codage avec seulement 7 signes (au lieu de 38 lettres) est suffisant pour différencier 48 % des mots de 10 lettres. On perd alors leur valeur phonologique et celle-ci ne peut plus être utilisée pour accéder au signifiant (la voie indirecte est alors impossible). Sans doute est-ce là l'avantage de l'écriture alphabétique dans ses rapports à l'activité visuelle au cours de la lecture : d'une part, il y a la prise en compte des formes générales des lettres, qui permet des saccades oculaires englobant des mots ou des groupes de mots ; d'autre part, il y a la différenciation en vision centrale des lettres elles-mêmes mais qui ne donne pas directement accès aux mots.

2.2 Les silhouettes ambiguës
Les 20 909 autres mots de 10 lettres se répartissent entre 8 597 silhouettes. Avec eux, le codage par 7 archi-signes n'est pas aussi discriminant que l'est le codage long (38 caractères). Plus du tiers des silhouettes(6 547) ne correspondent toutefois qu'à 2 mots qui sont, le plus souvent, deux déclinaisons du même mot souche (par exemple, disgracier et disgraciez). Les 2 050 silhouettes recouvrant au moins 3 formes se répartissent comme en figure 9 :

Figure 9 : répartition des silhouettes de 10 signes

Il y a donc 1 060 silhouettes désignant chacune 3 formes, 658 silhouettes de 4 formes, etc.
Pour ces 20 909 formes, il est donc évident que la silhouette ne suffit pas à différencier le mot, du moins si les silhouettes apparaissaient de manière totalement aléatoire.

2.3 Silhouette et apparence
Les informations complémentaires auxquelles il semble naturel de songer sont les lettres elles-mêmes dans la mesure où, au cours de la fixation visuelle, 2 ou 3 vont être perçues nettes au centre de l'empan de lecture. On peut tenter de simuler l'information réellement disponible, pour différencier des mots ayant même "silhouette", lorsque la fixation visuelle a lieu en leur centre.

Nous dirons que deux mots ont non seulement même "silhouette", mais même "apparence" quand les 2 lettres au centre sont identiques et quand les 4 lettres de part et d'autre ont même silhouette. Par exemple, auvergnats et auvergnate ont même apparence : leur différence n'est pas apparente dans un codage en 7 éléments, même en identifiant les deux lettres centrales (rg). Ce sont d'ailleurs deux formes déclinées du même mot souche. tu " ovaliseras " et tu " avaliseras " ont, eux aussi, même apparence mais ils sont issus de souches différentes et il est donc encore plus nécessaire de bien les différencier. Existe-t-il beaucoup de ces doublons, c'est-à-dire de mots issus de mots souches différents et ayant strictement la même apparence (les mêmes deux lettres au centre et les mêmes quatre "archi-signes" de part et d'autre) ?

À défaut d'une recherche complète, voici quelques exemples de doublons. L'ordre choisi et le partage en deux colonnes n'ont pas de signification.

crânassent avérassent

effraction attraction

effondrait attendrait

escomptiez assomption

envasaient arrosaient

opposition apposition

spectacles apostasies

encastrais ancestrale

sidérante altérante

clignement alignement

clouteront alerteront

striations adulations

chassaient adossaient

saoulaient acculaient

essouchées accouchées

chômerions abîmerions

obstineras abstinence

cheminions abominions

farfouillé barbouillé

tartelette bandelette

oreillette cueillette

excisaient croisaient

soutenance contenance

socquettes casquettes

sardinière cantinière

facilement docilement

totalement fatalement

quenouille grenouille

plissement glissement

porcheries gaucheries

L'existence de tels doublons oblige donc à s'interroger sur les informations simultanées qui doivent nécessairement être prises pour que soient levées les confusions sémantiques.

3. Attentes et silhouette
D'autres informations sont donc incontestablement nécessaires. On peut même se demander si ces "autres" informations ne sont nécessaires que pour désambiguïser des différenciations douteuses ou si ces autres informations sont de toute façon constitutives du processus interactif ? En effet, nous avons fait jusqu'ici comme si l'apparition d'un mot sous les yeux d'un lecteur était un événement isolé, isolé d'autres mots, isolé d'un contexte de sens. Dans la perspective interactionniste, il est évident que, simultanément à ces informations graphiques (de bas niveau), existent des informations de haut niveau, qui ont rarement fait l'objet d'investigations tant elles participent du discrédit actuel stigmatisé par la "devinette psycho-linguistique" (GOODMAN, 1967). Sans faire preuve d'une grande audace, on peut supposer, pour commencer, que ces informations intervenant dans la lecture du mot suivant viennent au moins de deux horizons, un horizon syntaxique et un horizon sémantique.

3.1. L'horizon syntaxique.
On trouve très peu de mots dans un texte qui sont imprévisibles ou totalement prévisibles sur le plan grammatical. Dans la simulation informatique que nous faisons, nous informons l'ordinateur sur la catégorie grammaticale du mot qu'il rencontre sous la forme de silhouette. Dans quelle proportion la prise en compte de la catégorie grammaticale réduit-elle l'ambiguïté d'une silhouette ? Dans le domaine désormais familier des mots de 10 lettres, on se souvient que sur un total de 39 896 formes, 18 987 sont déjà parfaitement différenciables en tant que silhouettes. Le nombre de mots différentiables passe de 18 987 à 21 307 si on ajoute la catégorie grammaticale à la silhouette, soit un gain relativement faible de 2 320 mots. Il reste encore 18 589 mots ambigus répartis entre 8 220 " silhouettes grammaticales " (à la fois une silhouette et une catégorie grammaticale). En bref, la prise en compte de la nature grammaticale désambiguise 2 320 mots mais réduit de très peu (577 sur 8 597) le nombre de silhouettes multiples.

3.2 l'horizon sémantique
De la même manière qu'une anticipation grammaticale réduit l'éventail des possibles et permet de différencier des mots supplémentaires, on peut concevoir qu'une attente sémantique va produire, par d'autres cheminements, un effet analogue. Nous allons simuler cette information sémantique en précisant à l'ordinateur quel lien il existe entre la silhouette du mot et 32 thèmes construits autour de 826 mots-centres fonctionnant un peu comme des sèmes, dans la mesure où ils tentent de figurer des " unités élémentaires de sens ". Ces 826 mots-centres, repris du ROBERT, les idées par les mots, pourraient constituer une sorte de métaphore informatique d'une partie d'un mode d'indexation du lexique mental (au même titre que les catégories grammaticales précédentes). Par exemple, le seul sème correspondant à l'idée de "désir" active 151 formes de 10 lettres parmi les 39 896 que notre base comporte : parmi eux lorgnerais insatiable fièvreuse charnelle affamèrent arriviste convoitise soupirâmes passionner prétendant impatience envierions démangeras desiderata aiguillons appétence ambitieuse, etc. Le thème correspondant à l'idée de "croire" active, pour sa part, 94 formes de 10 lettres (crédulité confiances dogmatisme goberaient jobardises persuasion surnaturel, etc.) La prise en compte simultanée du sème "désir" et du sème "croire" active 9 formes qui tournent d'ailleurs toutes autour de la même souche : espérances espéraient espérasses espérerais espérerait espéreriez espérerons espéreront espérèrent. Mais il n'y a, par exemple, que le mot espérerons qui corresponde à la fois à "désir" et à "attendre" et qui ait la silhouette aayânanana.

Le nombre de mots différenciables par le croisement de leur silhouette et de leur appartenance à un des 32 thèmes est de 25 248 soit 6 261 de plus que par la seule silhouette (+33 % mais + 15.7 % de l'ensemble des mots de 10 lettres). Les 14 648 mots non différenciables se répartissent dans 6 642 silhouettes, soit 2.2 mots par silhouette multiple. Cette fois l'augmentation du nombre de mots identifiables par leur silhouette grâce à la prise en compte de l'attente sémantique s'accompagne d'une réduction importante (1 955) du nombre de silhouettes multiples. Encore convient-il de rappeler que nous n'avons pas défini l'attente sémantique à travers les 826 mots centres que nous avons évoqués mais seulement à travers leur regroupement en 32 thèmes généraux... On peut donc imaginer que le pouvoir différenciateur d'une intersection " silhouette X sèmes " est encore plus net que les résultats que nous en donnons.

3.3 Croisement d'un horizon sémantique et syntaxique
Si nous revenons un instant sur le croisement précédent entre désir et croyance, on a vu qu'il donnait accès à 9 mots ; la prise en compte supplémentaire d'un critère grammatical isole "espérances" des 8 formes verbales. Que se passe-t-il alors pour nos 39 896 mots de 10 lettres répartis entre 27 584 silhouettes lorsqu'on prend simultanément en compte leur indexation syntaxique et sémantique ?

On observe cette fois que 36 314 mots sont parfaitement différenciés au croisement de leur nature grammaticale et de leur indexation sémantique (rattachement à 32 thèmes généraux), soit 17 327 de plus que par la seule silhouette (91 % de l'ensemble des mots de 10 lettres). Il reste 3 582 mots ambigus, se répartissant entre 1 725 silhouettes multiples mais le nombre de celles-ci diminue de 6 872.

3.4 Récapitulation numérique (tableau 2)
T = nombre total de mots : 39896.
S = nombre total de silhouette : 27584.

à l’aide de la silhouette seule

à l’aide de la silhouette et de la nature grammaticale

à l’aide de la silhouette et de l’indexation sémantique

à l’aide des trois entrées simultanément

a

mot différenciés par leur silhouette seule

18 987

21 307

25 248

36 314

a/T

% sur total des mots

47,6 %

53,4 %

63 %

91 %

T-a

mots restant ambigus

20 909

18 589

14 648

3 582

Sm

Nombre de silhouettes ambiguës

8 597

8 220

6 642

1 725

Sm/S

% du nombre total de silhouettes

31 %

30 %

24 %

6,25 %

(T-a)/Sm

Nombre moyen de mots ambigus par silhouette multiple

2,43

2,26

2,20

2,08

Il est évident, nous y avons déjà fait allusion, que ces recensements concernent la totalité des mots de 10 lettres sans tenir compte de leur fréquence dans des écrits réels. Il est à peu près certain (mais nous ne l'avons pas chiffré) que la majorité des silhouettes ambiguës regroupe massivement des formes fléchies d'un même mot, telles que indulgents et indulgente ou gourmander et gourmandez, etc. Si bien qu'en situation dans un texte, ces mots seraient différenciés aisément par une précision syntaxique portant sur un déterminant ou une personne verbale presque toujours présent au sein de l'empan de lecture lui-même.

4. Conclusions
Ce travail a en commun avec celui de LEGGE de prendre appui sur une simulation informatique. Il partage aussi quelques conclusions importantes, notamment sur la nécessité d'ajouter des informations de haut niveau pour compenser la perte d'informations de bas niveau, perte liée à la dégradation en vision parafovéale. On peut se demander si les résultats de LEGGE n'auraient pas été encore plus nets s'il n'avait pas représenté cette dégradation de manière uniforme par une. Je pense que l'hypothèse de silhouettes rend mieux compte de cette dégradation qui ne se réduit pas à du tout ou rien. Mais, dans les deux expériences, ce qui ressort, c'est un approfondissement de ce concept d'interaction qui vient de la nécessité d'apporter des informations de haut niveau pour pouvoir tirer parti d'informations dégradées, lesquelles ne relèvent évidemment plus d'une transformation de type grapho-phonologique. C'est bien des signifiants visuels, de nature graphique, qu'il faut traiter et qui n'ont pas d'existence phonologique avant d'avoir acquis le statut de signifié.

Or ce statut de signifiant visuel n'est pas séparable de la manière de voir : selon que les recherches portent sur les stratégies du lecteur expert dont les empans de lecture sont beaucoup plus larges que l'empan de vision nette ou sur des stratégies construites par l'expérimentateur et qui feraient que l'empan de lecture et l'empan de vision nette coïncident, on décrit une interaction complètement différente. Dans un cas, l'intervention des informations de haut niveau est nécessaire pour traiter les informations graphiques, l'interaction est le processus organique de lecture. Dans l'autre, il se surajoute au traitement, plutôt comme un contrôle a posteriori. On peut alors faire l'hypothèse que l'expérience graphique du lecteur, sa conscience graphique, n'est pas de même nature que celle d'un déchiffreur qui avancerait dans l'écrit en transformant en syllabes les trigrammes qui s'inscrivent successivement sur sa fovéa.

Chapitre 3 : Hypothèses et Méthodologie
1. Hypothèses
Il est peu satisfaisant de considérer le fonctionnement cérébral comme étant la réplique de celui d'un ordinateur alors que notre particularité est d'agir par rapport à un but, à une intention. Pour l'ordinateur, agir c'est appliquer un algorithme ; pour l'homme, c'est produire cet algorithme. Il faut espérer que le fonctionnement, encore mal connu, de la "machine proactive" chère à Berthoz, va nous réserver encore des surprises. Quoiqu'il en soit, on peut dire aujourd'hui que le cerveau traite en un instant, simultanément et non successivement, une grande quantité d'informations et que c'est sur cette simultanéité d'entrées que procède l'intelligence. Il n'y a pas de raison pour supposer que cette façon de faire ne se retrouve pas dans l'acte de lecture.

On a vu que la définition de l'interactivité en lecture se positionnait, selon les recherches, sur un continuum allant du très faible à l'à peine fort. Il y a, en outre, une dérive possible dans l'usage à la mode de ce concept d'interaction qui vient, fort à propos, se substituer à la notion difficile à manier de rapports dialectiques. Ainsi, les éléments, lorsqu'il s'agit d'interaction, se seraient plus ou moins constitués séparément, aboutissant au maniement d'unités graphiques dont l'existence ne doit rien aux raisons et à la manière de les interroger ; quant à l'autre terme, le fonctionnement conceptuel et sémantique, il serait propre au langage en général et ne devrait rien aux caractéristiques du code sur lequel il s'exerce. La compréhension de l'écrit n'aurait rien à voir avec la manière dont nous rencontrons l'écrit et choisissons d'y puiser de l'information. En revanche, dans une approche dialectique, les deux termes en relation se constituent à travers cette relation : leur existence et leur structure ne sont pas séparables de l'action par laquelle ils se structurent. Le système graphique s'organise en fonction de la manière dont les éléments de haut niveau l'interrogent ; le système conceptuel et sémantique se transforme pour intégrer la spécificité de ces nouvelles unités d'information. C'est en ce sens, qu'avec GOODY (1979). On peut parler de la spécificité d'une raison graphique, d'un mode de pensée qui se construit à travers le maniement d'un langage particulier qui impose ses caractéristiques aux processus de compréhension et, en retour, les enrichit.

Ce rapport dialectique que nous entrevoyons conduit à supposer que le "pilotage" par les informations conceptuelles de haut niveau aboutit à une structuration différente des processus de bas niveau. A ce titre, nous sommes assez proches des modèles "fortement interactifs" qui envisagent eux aussi "des influences directes entre les processus contextuels et les processus graphiques" (RUMELHART & MAC CLELLAND, 1981).

Le lecteur choisit des indices, pas n'importe lesquels et encore moins leur totalité, à l'intérieur de structures attendues ou activées. Autrement dit, plus le lecteur a accès à des unités larges, plus il est à même de prélever les seuls indices dont l'interaction a besoin, y compris en en négligeant d'autres, redondants ou peu pertinents pour ce questionnement. Tous les mots sont susceptibles de porter la présence ou l'absence d'indices graphiques en interaction avec l'univers sémantique mais c'est la répétition ou la répartition de ces indices entre plusieurs mots (donc leur repérage simultané) qui saute au... sens. C'est le processus de compréhension (= de lecture) qui détermine la nature, la quantité et la répartition de la prise d'informations graphiques.

En conséquence, nous poserons une première hypothèse : la performance de lecture va de pair avec une prise d'indices diversifiés. Alors que le mauvais lecteur se contente d'un seul type d'indices (souvent grapho-phonologiques), le bon lecteur utilise de manière concomitante des indices de nature différente : graphique, sémantique, grammaticale et lexicale. Cette diversité d'indices a sans doute quelque chose à voir avec la diversité des attentes donc avec l'existence d'un contexte ouvert.

En second lieu, on peut faire l'hypothèse qu'il existe de mauvauses façons de prélever l'information dans l'écrit qui rendent systématiquement improbable sa compréhension.. Contrairement à ce que pense Alegria ("L'analyse de la situation de lecture permet de concevoir une série d'opérations élémentaires qui interviennent dans le processus de compréhension. Une distinction importante à faire parmi ces opérations concerne celles qui précèdent l'identification des mots et y conduisent, de celles qui suivent l'identification." (Alegria, 1991)), et avec lui beaucoup de recherches actuelles, nous ne présupposerons pas une indépendance fonctionnelle entre les opérations liées à l'identification et celles liées à la compréhension. Le principe même d'une relation dialectique plutôt que d'une interaction impose de penser que la compréhension est le processus par lequel se traitent les données, et que ce traitement n'est pas séparable de la manière dont ces données sont prélevées. Il n'y a pas d'un côté une identification et, de l'autre, une compréhension qui parviendrait plus ou moins bien à interpréter ces données sans être pour quelque chose dans leur définition. On doit trouver trace de cette relation dialectique dans la capacité à utiliser l'information parafovéale, c'est-à-dire à tirer de l'information des silhouettes, ce qui suppose la conscience d'une spécificité graphique comme langage pour l'oeil. Ainsi la deuxième hypothèse porterait sur l'existence d'un lien entre la performance de lecture et la capacité à utiliser les formes graphiques dégradées telles qu'elles apparaissent en vision parafovéale. Dit autrement, il devrait exister un lien entre la performance de lecture et la taille de l'empan de lecture.

Je voudrais signaler la difficulté que j'ai à formuler des hypothèses car la méthodologie que j'utilise est davantage tournée vers l'investigation que vers la vérification. Ces deux hypothèses sont alors plutôt des principes organisateurs de la méthodologie d'investigation que des attentes qui devront impérativement être confirmées ou refusées.

2. Méthodologie.
Le groupe d'enseignants et de chercheurs dont j'ai parlé dans l'introduction a fait passer huit épreuves à une cohorte d'enfants de 11 ans suivis depuis la Grande Section de maternelles. Ces huit épreuves ont été construites dans le but d'explorer le champ supposé des compétences techniques vis-à vis de l'écrit hors d'une situation de lecture. Pour chacune d'elles, un score qui tente de quantifier ce qui a semblé être la manière efficace de réussir l'exercice proposé a été établi. Pour des raisons évidentes à l'échelle d'une population d'enfants de 11 ans, le nombre des épreuves est limité même s'il faut tenter de couvrir un champ technique incertain et vaste correspondant aux hypothèses recensées dans la littérature sur cette question. Quelles compétences observer ? Le savoir supposerait les recherches abouties et donc celles-ci inutiles. Et comment savoir que tel exercice permet d'évaluer telle compétence ? Est-il même concevable que la solution d'une situation-problème dépende de l'exercice d'une seule compétence à la fois ? Il est probable, au contraire et même si la conception d'un exercice vise à le spécifier par rapport à une compétence technique supposée, que son résultat va témoigner de compétences différentes, parfois insoupçonnées au départ et toujours dans des proportions inconnues. L'écrit est un matériau que sa fréquentation rend tellement polymorphe qu'il est assuré que sa rencontre fait appel dans le même instant à plusieurs savoir-faire. L'autonomie des compétences est une hypothèse de travail pour les chercheurs mais qu'en est-il pour les lecteurs ? Il semble donc prudent de ne surtout pas définir les compétences techniques par les épreuves techniques qui ont été proposées.

Devant ce problème méthodologique, nous avons choisi une méthode statistique qui semblait répondre à notre problématique : l'analyse en composantes principales. Ce type d'analyse factorielle permet de mesurer les liaisons des variables entre elles ; on va chercher par cette analyse à savoir comment se structurent les variables, celles qui vont dans le même sens, ou celle qui s'opposent. Dans le système d'épreuves que nous avons développé, nous obtenons 8 variables correspondant aux 8 épreuves. Les différents individus auraient donc du être représentés dans un espace à 8 dimensions. Difficile d'y voir clair… L'analyse en composantes principales va nous permettre d'étudier des espaces plus petits, à une ou deux dimensions. Les droites et les plans d'une analyse en composantes principales ne sont pas réalisés avec les variables initiales, mais avec des " indices synthétiques " obtenus par ce que les statisticiens appellent des " combinaisons linéaires " de ces variables. Parmi tous les indices possibles, l'analyse en composantes principales recherche d'abord celui qui permet de voir au mieux les individus, c'est-à-dire celui pour lequel la variance des individus est maximale : cet indice est appelé la première composante principale. Ensuite, une deuxième composante principale est recherchée, sous deux conditions :
- avoir une corrélation linéaire nulle avec la première
- avoir, à son tour, la plus grande variance.

Le processus se déroule ainsi jusqu'à l'obtention de la dernière composante principale.

Ainsi, l'analyse en composantes principales en éliminant successivement les corrélations multiples entre les résultats aux différentes épreuves permet de décomposer chaque épreuve en fonction des liens multiples que son résultat entretient avec les autres. Cette analyse aboutit à remplacer ici les résultats de 8 épreuves (dont on ne sait pas toujours ni si elles mesurent ce qu'on croit ni si elles ne mesurent que cela) par 8 composantes plus ou moins simultanément à l'œuvre dans chaque résultat. C'est comme si on avait remplacé les 8 épreuves réelles (dont chacune demande à la fois mais dans des proportions différentes plusieurs compétences) par 8 épreuves théoriques qui (si on ne s'est pas trompé dans l'interprétation du calcul des axes factoriels) n'interrogent chacune qu'une seule compétence. Ce qui expérimentalement est impossible dès lors qu'il s'agit d'une tâche complexe.

On voit bien l'intérêt d'une telle démarche. À ne pas la suivre, des expérimentateurs se condamnent à simplifier tellement la tâche que la situation expérimentale n'a que d'improbables rapports avec ce qu'elle prétend explorer. Rend-on compte de ce qui est à l'œuvre dans la lecture d'un texte en mesurant la variation du temps mis pour prononcer des pseudo-mots hors contexte selon qu'ils contiennent ou non des trigrammes fréquents ? À ne pas la suivre, on en vient à présenter des compétences techniques sans les avoir jamais mises en rapport avec la lecture.

En revanche, il faut considérer aussi le risque que contient l'analyse des données afin d'en tirer des composantes principales. C'est le risque inhérent à toute interprétation et qu'on ne peut tenter de réduire que par une connaissance minutieuse des épreuves initiales, une observation attentive de leur déroulement, une confrontation avec d'autres travaux, etc. Pour autant, il faudra bien oser, à un moment donné, l'hypothèse que ce qui peut le mieux rendre compte de l'opposition de deux groupes d'épreuves de part et d'autre d'un axe, c'est une compétence qui tourne, par exemple, autour de la sensibilité au contexte, toutes choses étant égales par ailleurs. On mesure bien ce risque mais il y en a un autre plus grand encore si on oublie que ces composantes ne sont construites qu'à partir des variables d'origine. Quelle que soit la rigueur apportée ensuite à la définition des composantes, elles ne seront jamais qu'une autre organisation, certes plus puissante, de ce que les épreuves ont mis en œuvre. Une compétence est une sorte d'abstraction transversale à plusieurs épreuves mais ce n'est pas l'analyse qui la fera exister si les épreuves utilisées ne la sollicitent pas. D'où la nécessité de les diversifier. Les 8 compétences techniques construites ici à l'aide d'une analyse en composantes principales ne sont donc pas encore des compétences techniques de lecture mais simplement des compétences exigées par les seules épreuves techniques qui ont été retenues. On découvrira plus tard que certaines, importantes dans l'effectuation des épreuves techniques, ne jouent pas de rôle ou pas ce rôle lors d'une activité réelle de lecture. Ce qu'on ne saura jamais, et pour cause, c'est le rôle qu'auraient joué au cours de la lecture celles qui, n'étant pas impliquées dans nos épreuves techniques, n'ont pas été construites par l'analyse en composantes principales. On en sera réduit à imaginer leurs poids en creux, sinon leur nature, dans la part de la variance qui restera inattribuée.

Ce n'est qu'ensuite que nous étudierons le poids et la valeur de ces facteurs dans la performance de lecture. Nous le ferons cette fois au moyen d'analyses de régression linéaire multiple pour évaluer la contribution de ces compétences techniques à une lecture réussie. Ainsi parviendrons-nous peut-être, sinon à quelques réponses, du moins à une manière plus pertinente de poser des questions.

Chapitre 4 : La population expérimentale
1. Les enfants
Comme annoncé, nous utilisons des observations faites dans une cohorte déjà constituée.

Cette étude longitudinale concernait initialement 84 enfants entrés au CP en septembre 90. En fin de cours préparatoire (-CP-) nous disposions encore d'un échantillon de 81 enfants. Seuls 76 d'entre eux ont pu être suivis jusqu'à la fin du cycle 2 (-CE2-), au prix parfois d'efforts considérables (certaines épreuves ont même eu lieu au domicile d'enfants malades!). Finalement, à la fin du cycle 3 (-CM2-), c'est-à-dire au moment où nous nous intéressons à ces enfants (en juin 95), nous n'en connaissons plus que 59.

Les enfants que nous avions retenus avaient tous le même âge (six ans au 1er juin 1990, plus ou moins 75 jours). Ils étaient issus de 17 classes d'écoles différentes, à raison de cinq par classe. Au sein de chaque classe, outre le critère de l'âge, les enfants avaient été choisis en fonction de critères sociologiques: 2/5ème des enfants devaient avoir des parents ayant un niveau de qualification supérieur au baccalauréat, 3/5ème un niveau inférieur (échantillonnage analysé par ailleurs par catégorie socio-professionnelle).

Nous présentons les données pour les 59 enfants, suivies de celles pour les 76, entre crochets [], puis entre accolades {} le résultat au test du KHI-2.

L'échantillon de 59 enfants qui va être au centre de nos analyses est constitué de 32 [39] garçons et 27 [37] filles {KHI-2 = 0,1 ; dll = 1 ; P = 73.55%}.

25 enfants (42 %) [36 (47%)] ont au moins un parent qui dispose d'un niveau de qualification supérieur ou égal au baccalauréat; 34 (58 %)[40 (53%)] sont dans le cas contraire {KHI-2 = 0,116 ; dll = 1 ; P = 73.27%}.

À l'issue d'un regroupement des catégories INSEE en trois grands types, nous avons pu vérifier que:
- 8 (14 %) [11 (14%)] sont issus de catégories socio-professionnelles aisées (cadres, professions libérales,...)
- 20 (34 %) [28 (37%)] sont issus de catégories socio-professionnelles moyennes (techniciens, agents de maîtrise, petits commerçants...)
- 31 (53 %) [37 (49%)] sont issus de catégories socio-professionnelles modestes (ouvriers, employés,...).
{KHI-2 = 0,2 ; dll = 2 ; P = 90.5%}

2. Les écoles
Les élèves sont tirés de 17 classes implantées dans 11 écoles. Quarante-trois [53] de ces enfants sont issus de douze classes dont les instituteurs faisaient tous partie d'un même mouvement pédagogique, l'Association Française pour la Lecture. Leur pédagogie, commune en théorie, donne priorité à la compréhension de textes écrits dès le début de l'année scolaire, et n'accorde qu'une place minime à l'enseignement du système de correspondance grapho-phonologique.

Huit de ces classes scolaires faisaient partie du réseau d'écoles expérimentales coordonné par l'INRP dans la période 1972-1981. Ces écoles sont organisées au sein de cycles multi-âges, ce qui conduisait vingt-huit [35] enfants de notre échantillon à partager leur temps de travail avec des enfants d'âges différents.

Seize [23] autres enfants avaient été pris dans des classes plus "traditionnelles", accordant notamment beaucoup plus de place à la maîtrise du code de correspondance grapho-phonologique.

Notre population expérimentale se trouve en conséquence répartie de la manière suivante:
5 [8] enfants dans l'école n°1 : Le Lac
8 [9] enfants dans l'école n°2 : Les Buttes
6 [8] enfants dans l'école n°3 : Les Charmes
4 [5] enfants dans l'école n°4 : J. Prévert
8 [9] enfants dans l'école n°5 : Marie Noël
5 [5] enfants dans l'école n°6 : La Montagne
2 [4] enfants dans l'école n°7 : Nestor Perret
5 [5] enfants dans l'école n°8 : Aristide Briand
5 [7] enfants dans l'école n°9 : Edgar Quinet
7 [10] enfants dans l'école n°10 : Alphonse Daudet
4 [6] enfants dans l'école n°11 : Nébouzat
{KHI-2 = 1,01 ; dll = 10 ; P = 99.9%}

Au vu des tests statistiques, on peut espérer que l'échantillon des 59 élèves reste relativement proche de la composition de l'échantillon plus vaste (les 76 enfants de CE2 et les 84 de CP) étudié par le passé.

Les élèves ont été observés à l'aide d'épreuves standardisées spéciales, décrites dans le chapitre 5 et le chapitre 7.

Chapitre 5 : Huit épreuves graphiques hors d'une situation de lecture.
Dans ce chapitre, nous décrivons les huit épreuves standardisées, créées pour décrire des compétences techniques et, notamment, tenter de cerner celles qui se sont forgées, à travers la lecture et son apprentissage, au contact des caractéristiques graphiques de l'écrit. Nous les appellerons, avec l'espoir de mieux les décrire, des compétences graphiques.

Conditions générales de passation des épreuves.
Toutes les épreuves dont il va être fait mention se sont déroulées dans des conditions normalisées.
- Les épreuves se déroulaient en deux séances d'une heure, réparties sur deux jours.
- Chaque épreuve commençait par un certain nombre d'exemples : pour ménager un temps d'apprentissage, la réponse ne comptait pas dans les résultats. Le premier exemple permettait toujours à l'expérimentateur de stopper le déroulement pour s'assurer de la bonne compréhension de l'exercice.
- Six expérimentateurs se sont déplacés pour rencontrer les élèves de la cohorte initiale dans les seize écoles. Ces six expérimentateurs avaient fait passer les mêmes épreuves à des sujets ne faisant pas parti de la cohorte, et s'étaient réunis avant de commencer pour normaliser les modalités exactes de passations ; ces modalités étaient écrites.
- Trois épreuves (A1, A2 et A3) ont toutes été passées le premier jour, cinq épreuves (B1, B2, B3, B4 et B5) l'ont été le deuxième. L'ordre de passation était imposé.
- Ces épreuves sont présentées sur l'écran d'un ordinateur (tous les ordinateurs avaient des écrans de 14 pouces, réglés dans la résolution 640*480). Les élèves en connaissaient le maniement, même si, ici, les tâches informatiques s'avéraient rudimentaires.
- Sur certaines épreuves, c'est l'expérimentateur qui valide les réponses.

1. Épreuve A1 : tri entre pseudo-mots, construits sur la vraisemblance de leur silhouette
La première des épreuves consiste à classer des formes composées de lettres et qui apparaissent au centre de l'écran, prenant la place d'un point de fixation. C'est volontairement que nous ne parlons pas ici de mots car ces formes ne correspondent pas à des mots qui existent actuellement en français et nous ne comprenons pas ce que sont des pseudo-mots ou des non-mots. Deux types de formes apparaissent : celles qui peuvent exister parce qu'elles ressemblent à celles de mots qu'on peut voir en français, et celles qui ne correspondent à aucune forme de mots français. L'enfant répond en utilisant respectivement la touche 1 ou 3 du pavé numérique.

Les formes qui peuvent exister ont été construites sur les silhouettes les plus fréquentes de mots de 6 lettres (exemple : avexse construite sur la silhouette ananaa, et contenant entre autre le mot "avance"). À l'inverse, celles qui ne peuvent pas exister, sont construites sur des silhouettes de 6 lettres qui ne contiennent aucun mot français (par exemple iwalou, construite sur la silhouette lmalaa).

Nous avons choisi cette longueur de 6 lettres pour plusieurs raisons : c'est tout d'abord la longueur moyenne des mots d'un texte en français ; ensuite cette longueur nous permet de choisir des silhouettes de mots assez différentes les unes des autres tout en gardant une longueur assez faible, n'handicapant pas les enfants qui auraient un empan court.

Constitution des séries
Pour fabriquer ces deux listes de pseudo-mots, nous sommes partis des 15253 mots de 6 lettres générés par la base à partir des 39896 mots-souches de cette même base (ces souches génèrent 263 041 mots déclinés).

Puis, nous avons transformé ces mots en silhouettes en suivant la règle énoncée dans le chapitre II (section 1).

Le nombre théorique des silhouettes différentes de mots est de 279 936 (6 puissance 7) ; car chaque lettre d'un mot de 6 lettres peut appartenir à une des 7 classes de lettres.

Le nombre de silhouettes différentes réellement rencontrées est de 4922 (soit 1,76 % des silhouettes potentielles).

Nous avons sélectionné 4 silhouettes très fréquentes et nous avons créé 12 formes ayant les mêmes silhouettes, en respectant les répartitions des fréquences d'apparition des silhouettes :

Silhouettes réelles

Exemple de mots réels

Formes créées

ananaa

avance encres excuse ananas avares

cronce avexse suance arause

banaaa

douces fausse housse tenace tousse

benacs fauces tovase henose tarosc

banana

banane douane devons ferons tenons

hancra hanove

ananab

anorak

exouaf

D'autres part, 12 formes vont être construites sur des silhouettes qui ne correspondent à aucun mot :

Silhouettes

Formes créées

aâaaya

césage aîsaçe

lmalan

imsieu imelau imaler iwalou lmeisn

âmâaâs

émîoïs ômésîc émésüs âmâcés âmèsîc

Le temps de présentation de chaque forme est de 300 ms. Le temps de réponse est laissé libre mais enregistré. L'épreuve est notée sur les 24 formes présentées (dix autres formes étaient préalablement présentées à l'élève comme exemples mais ne comptaient pas dans l'épreuve ; elles ne sont pas données ici).

Commentaires
On comprend bien qu'on est ici dans le souci de cerner de plus près la "conscience graphique". Les épreuves sur les pseudo-mots sont d'ordinaire proposées pour décrire la maîtrise du décodage, pour observer le rôle de la conscience phonologique dans la décision d'appartenance ou non au lexique ; voir par exemple les techniques d'Amorçage Sémantique Médiatisé par la Phonologie (ou ASMP) (PAIRE-FICOUT, 1996)). Les pseudo-mots sont aussi utilisés pour mesurer la familiarité de trigrammes (GOIGOUX, 1993). Ici, on franchit encore un pas : par exemple, le trigramme eqr n'existe pas mais il a la même silhouette que le trigramme opu, qui, existe. Autrement dit, certaines formes créées ne pourraient pas exister du fait des trigrammes qu'elles contiennent mais elles peuvent exister car leur silhouette, au-delà des strictes lettres qui les composent, existe. L'objectif est bien de discerner une silhouette qui peut exister, habillée par un mot qui n'existe pas, que ce mot se prononce ou pas. Un lecteur habile connaît-il les silhouettes communes par sa vision parafovéale, donc au-delà des lettres ? Même si elle n'existe plus en vision centrale, l'habitude de traiter cette structure spatiale (gestalt) devrait favoriser sa reconnaissance rapide. Cette habileté à repérer des silhouettes fréquentes est, de fait, annoncée par certains travaux (INHOFF, 1986) qui montrent, pour la vision parafovéale, un net bénéfice quand il s'agit de mots fréquents, donc de silhouettes fréquentes. Cette volonté de repérer une conscience graphique abstraite est augmentée encore, dans cette épreuve A1, par le temps de présentation extrêmement bref.

Critique de l'épreuve
Nous avons bâti nos deux listes de formes à partir de leur catégorisation en silhouette. Mais un point nous a échappé, ou du moins était moins clair à l'époque, dans la constitution de ces listes : on remarque, à la lecture à voix haute, que les 12 formes possibles peuvent se prononcer mais que 5 formes impossibles posent aussi des problèmes de prononciation (imsieu, émîoïs, ômésîc, émésüs, âmèsîc). D'autre part, 4 formes possibles ont une silhouette rare alors que 8 formes impossibles ont une silhouette rare. On peut donc penser qu'il est plus facile à un individu qui passe par la "médiation phonologique" (voie indirecte) de repérer les formes possibles, alors qu'il sera plus facile à un individu n'employant que des indices visuels (voie directe) de repérer les formes impossibles.

Pour résumer, un lecteur utilisant exclusivement la voie directe peut prendre appui sur ses indices favoris dans 12 formes sur 24, alors qu'un déchiffreur (conversion grapho-phonologique) peut prendre appui sur ses indices favoris dans 17 formes sur 24. On peut donc s'attendre à ce que ces dernières soient favorisées. En conséquence, pour refaire une épreuve de ce type, il faudrait davantage veiller à ce que les silhouettes soient équilibrées, notamment du fait que les formes impossibles doivent être prononçables.

Variables
Dans un premier temps, nous avons construit deux variables qui travaillaient les formes possibles et impossibles. Toutes les données brutes qui ont servi ont été centrées et réduites.

Le score des formes possibles était calculé de manière à tenir compte à la fois de la réussite et du temps de réponse mais dans un rapport de 3 à 1 :
Score = (trois fois le nombre de bonnes réponse) moins (le temps mis pour répondre), le tout divisé par l'écart-type de la distribution résultante, afin d'avoir un score dont l'écart-type égale 1.
Moyenne 0,00
Écart-type 1,00

Le score des formes impossibles était calculé de la même manière :

Par cette opération, on donnait un score centré et réduit pour chacun des types de formes, en privilégiant le fait de bien répondre à chacun des items, mais en pénalisant aussi les enfants lents à répondre. Nous avions donc deux scores, montrant les performances pour les silhouettes existantes et celles pour les silhouettes inexistantes.

Nous avons vu plus haut que la réussite sur les silhouettes existantes témoigne d'une habileté grapho-phonologique, alors que la réussite sur les silhouettes inexistantes montre une habileté graphique. Ces habiletés ne sont pas en concurrences. Mais dà cause du biais que nous avons expliqué dans la critique de cette 'épreuve, chaque compétence intervient aussi dans l'autre épreuve. En calculant une variable "différence" : score des silhouettes inexistantes moins score des silhouettes existantes, on annule le rôle de la compétence grapho-phonologique pour garder ici le seul niveau de compétence graphique. On arrive donc à la variable que nous garderons pour cette épreuve : elle témoigne de la compétence graphique (A1).

A1 : Plus Value graphique.

Moyenne

0,00

Erreur-type

0,21

Médiane

0,18

Mode

1,16

Écart-type

1,60

Plage

8,39

Maximum(1)

4,02

Minimum(1)

-4,37

L'écart-type de cette nouvelle variable (égale à 1,6) montre une corrélation entre les deux variables de départ.

En bref, avoir un bon score dans cette épreuve A1 est à mettre au compte de la mobilisation d'une expérience graphique, d'une compétence graphique dans une tâche de décision lexicale au niveau du mot, sans référence à un contexte.

2. Épreuve A2 : "pendu" sur une phrase
Dans cette épreuve, on présente un court texte et on demande de retrouver la phrase qui suit ce texte. Cette phrase est présentée suivant son gréement, c'est-à-dire en remplaçant chacune des lettres par un point. Voici un exemple de texte présenté, ainsi que la phrase à compléter (c'est ici la phrase servant d'exemple) :

Texte

C'était devenu un geste instinctif : chaque fois que je rentrais de l'école, je balançais mon cartable dans un coin.

Phrase

· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·· · · · · · · · .

qui correspond à :

Je courais rejoindre mes copains au bas de l'immeuble.

Pour se faire aider, l'élève demande au programme de lui donner des lettres en frappant sur une touche. Quand il pense avoir trouvé la phrase, il tape sur 3 (J'ai trouvé ! ! !) et dit sa proposition à l'examinateur. Si ce n'est pas la bonne réponse, on continue. Si une minute se passe sans aucune action sur le clavier, le programme introduit une lettre. L'ordre d'introduction des lettres est fixé, chacune des 14 lignes ci-dessous correspondant aux groupes de lettres introduites à chaque demande :

j b k q f x g z
m n v
d
p
c ç
t
s
l
r
o
u
a à
i
e é è

Si, lors de la première demande, la phrase à trouver contient deux f et un j, ces trois lettres seront écrites sur l'écran à leur place respective.

L'ordre de la liste a été choisi en sens inverse de la fréquence des lettres en français ; donc en commençant par les consonnes les plus rares. Les indices graphiques les plus forts pour trouver la bonne phrase sont les lettres rares, en conséquence les consonnes. On retrouve ici certains faits déjà exposés dans Hyönä (HYONA, 1995) : les combinaisons de lettres rares seraient saillantes dans la vision parafovéale. En conséquence, avoir conscience du gréement orthographique pourrait influer sur les performances de lecture. C'est ce que cette épreuve tente de montrer.

Ce qui va différencier les élèves, c'est uniquement le nombre de lettres demandées et, dans une moindre mesure, le temps mis pour trouver la bonne réponse. Ainsi, le choix que nous avons fait de ne pas afficher d'abord les voyelles pourrait discriminer les lecteurs ayant une bonne conscience graphique, une bonne conscience de la structure consonantique du français écrit.

Après le texte d'exemple, 5 phrases sont évaluées :

Textes

Phrases à trouver

J’extirpais mon pied de sa chaussette. Mon copain se tenait déjà au pied de l'escalier branlant, tout au bord du barrage, avec l'eau jusqu'aux chevilles. Je remontais mes bas de pantalon.

Puis je ramassais baskets et chaussettes, et le suivis.

Un jour le géant, pour jouer un peu, lui propose un pari.

Cent pièces d'or pour celui qui enverra la toupie le plus loin.

Bonaparte part en expédition en Egypte. Il est accompagné de savants. Le capitaine Bouchard découvre un fragment de stèle.

La découverte est sensationnelle et Bonaparte félicite son capitaine.

Les hommes de l'Antiquité utilisaient l'argile pour façonner des tablettes. Ils taillaient les tiges de roseau en pointe.

A l'aide de ces pointes de roseaux ils traçaient des dessins.

Les rayons du soleil brûlent cruellement la peau des rhinocéros. Ils s'avancent et plongent dans la boue à la recherche de fraîcheur.

Les animaux se retrouvent prisonniers, enfoncés dans la vase.

Variable numérique
Nous disposons de deux variables "sources" : le nombre de demandes et le temps.
- le nombre moyen de demandes de lettres par phrase Moyenne 11,1 Mode 11,6 Écart-type 1,1 Minimum 7,6 Maximum 13,6

On peut d'abord être étonné que ce nombre moyen de demandes soit si élevé puisqu'il ne reste ensuite que 3 recours possibles à une aide. Les 11 lignes demandées en moyenne fournissent 21 lettres. Ainsi, en reprenant l'exemple de la phrase de présentation, la réponse sera trouvée, en moyenne, seulement au-delà de cet affichage :
J* cour**s r*jo*ndr* m*s cop**ns *u b*s d* l'*mm*ubl*.

Il reste 15 lettres cachées sur les 44 de la phrase, donc encore plus du tiers, ce qui est finalement considérable, au contraire de l'impression initiale. Quelles compétences se trouvent alors à l'œuvre dans cette résolution de problèmes ? On trouve seulement deux syllabes constituées et prononçables (sur les 15 de la phrase) mais aucun mot achevé. Une structure quasiment consonantique comme celle de l'arabe littéraire. À l'exception de deux élèves, tous ont au moins besoin de neuf apports : les neuf lignes initiales de la liste fournie, soit toutes les consonnes. L'accès au sens se fait par un travail effectué à partir des indices disponibles qui ne donnent pas accès à des formes orales.
- la deuxième donnée utilisée est le temps moyen pour aboutir à l'identification d'une phrase. (en secondes)
Moyenne 115,08
Écart-type 59,06

La prise en compte du temps est un élément important du fait même du déroulement de l'exercice. En effet, on peut trouver la phrase en demandant très vite la totalité des lettres, ou en réfléchissant longtemps afin d'économiser l'affichage de lettres nouvelles. On peut aussi trouver rapidement avec peu de lettres, ce qui représenterait ici la meilleure réussite.

C'est pourquoi il est souhaitable de synthétiser les deux informations dans un score unique d'efficacité (A2). Comme pour A1, après avoir centré et réduit les deux variables précédentes, on calcule A2 par la formule :(moins trois fois le nombre de lettres demandées) moins le temps. Les stratégies d'élucidation tournent ici vraisemblablement autour de confrontations entre des entrées sémantiques (la phrase inductrice, la forme syntaxique de la phrase, etc.) et des entrées visuelles ou graphiques à travers des mots que suggèrent les formes. La réussite à cette épreuve pourrait témoigner d'une compétence technique centrée sur du sémiographique en contexte et au niveau de la phrase et du texte.

Score A2.

Moyenne

0,0

Erreur-type

0,14

Médiane

0,13

Écart-type

1,04

Plage

5.98

Minimum

-2,59

Maximum

3,59

En bref, cette épreuve révèle une expérience graphique, s'exerçant dans un fort contexte (sémiographique), au niveau d'une structure de phrase. Elle révèle également une sorte de créativité, d'anticipation et de richesse linguistiques.

3. Épreuve A3 : Mots mêlés
Il s'agit ici de retrouver le plus vite possible le mot français le plus long qui se cache dans une suite de lettres affichées à l'écran (le mot n'étant pas en désordre au sein de la suite). La réponse est donnée en tapant le mot au clavier, le groupe de lettres n'étant plus visible. On a trois essais par mot, au maximum.

groupe de lettres

Mot à trouver

almarcheronsdelle

marcherons

elyvolibrement

librement

enusousamrine

sous

aidoigtalismnes

doigt

Commentaires
C'est ici une épreuve de repérage visuel d'une forme écrite hors contexte. C'est en fait un exercice assez facile, la qualité de la performance tenant à la bonne réponse dès le premier essai et dans un temps court.

Cette épreuve pose un problème. On connaît depuis les travaux de Reichter en 1969, l'"effet-mot" : un mot sera mieux identifié que les lettres qui le composent de façon séparée. On supposa alors que c'est la perception du mot qui influence la reconnaissance des lettres, et non l'inverse. Notons qu'on peut interpréter les données de Inhoff (INHOFF, 1989) sur la perception de mots en vision parafovéale comme pertinente avec l'effet-mot. De plus les travaux de Posner (POSNER, 1978) montre l'importance de l'organisation des lettres en mot comme participant du processus visuel. Or, dans l'épreuve A3, on prend la question à l'envers. En effet, en lecture, le mot est une unité saillante, visible par les séparateurs qui l'entourent toujours. Ici, il n'y a pas de séparateurs entourant les mots.

Dans la suite de lettres "almarcheronsdelle", en accord avec les écrits sur l'importance des espaces dans la reconnaissance de mot, le mot le plus prégnant se situe à la fin " elle ". Ce n'est pas celui qui est le plus long, il faut donc reprendre du début, et procéder à un découpage syllabique, puis à de l'assemblage : marche + r + ons = marcherons (tout cela après avoir éliminé un éventuel mot .commençant par le trigramme alm (almanach ou almée s'élimine rapidement). On est donc dans une épreuve qui ressemble à ce que nous avons écrit sur le modèle autonomiste (FODOR, 1983), où on perçoit, on assemble, puis on décide si ça existe, tout cela hors contexte. En conséquence, réussir à cette tâche demande la réalisation d'un processus de type combinatoire, sur des unités syllabiques, et de l'assemblage de sous-unités, hors contexte.

Variables
Même après avoir émis quelques réserves quant à la parenté de cette épreuve avec la lecture réelle, nous allons présenter ses résultats. Deux variables ont d'abord été retenues :
- le nombre de réponses correctes (sur 4)
Moyenne 3,2 mots
Écart-type 0,8

On remarque la très bonne réussite, avec une moyenne de 3.2 mots trouvés et un écart-type assez faible. Cela semble corroborer nos remarques précédentes.
- le temps moyen mis quand on donne une bonne réponse
Moyenne 29,79 secondes
Écart-type 22,5
- Finalement, nous avons construits une variable unique qui tient compte du moment où la réponse est apparue. C'est le score de qualité pour les mots mêlés (A3). Elle est calculée de la façon suivante :
Pour chaque mot, on attribue :
1 point pour une réponse correcte au premier essai
2 points pour une réponse correcte au deuxième essai
3 points pour une réponse correcte au troisième essai
6 points pour un échec

On fait le total des points. Comme il y a quatre mots à trouver, avoir 4 est le signe d'une très bonne réussite, alors que 24 points montre un échec total. Ce résultat (X) est ensuite centré et réduit (X moins la moyenne ; le résultat est divisé par l'écart-type). Enfin le signe est inversé afin que la réussite ait un score plus élevé que l'échec (simple problème de lisibilité des données ensuite).

score de qualité pour les mots mêlés

Moyenne

0,00

Erreur-type

0,13

Médiane

-0,03

Mode

-0,03

Écart-type

1,0

Plage

4,29

Minimum

-3,06

Maximum

1,23

4. Épreuve B1 : reconnaissance spatiale d'un mot
Cette épreuve, B1, s'inspire du jeu "Scrabble". Il faut remettre en ordre le plus vite possible toutes les lettres affichées à l'écran, pour former un mot français. Les lettres sont affichées de manière désordonnée (mais identique pour chaque élève). Huit mots étaient à retrouver (malade, barrer, forces, partir, manger, roseau, bleues, écrire). Il n'y a qu'une seule solution par projection de lettres.

On aurait voulu rechercher ici une éventuelle compétence graphique à l'œuvre dans la reconnaissance spatiale d'un mot. Est-ce que l'ensemble des lettres d'un mot est en relation avec le mot, évoque ce mot même quand elles ne sont pas ordonnées ? Il semble, au contraire, que pour bien réussir à cette épreuve, il faut être capable de tâtonner rapidement des mises en ordre de lettres pour former des syllabes et des mises en ordre de syllabes pour former des mots. En bref, une sorte de fusion d'éléments simples avant et après la syllabe, à base de correspondance grapho-phonologique, sans référence à un contexte sémantique ou grammatical : c'est là tout l'art de la combinatoire. Ce travail fait aussi appel à la richesse linguistique de l'enfant.

Nous avons pris en compte, dans cette épreuve, la réussite et le temps mis pour la mener.
Variables
V9 score global Scrabble (B1). Il est calculé de la manière suivante. Pour chacun des mots, on attribue :
si réussite en moins d'une minute 2,4 pts
si réussite en moins de 2 minutes 1,8 pts
si réussite en moins de 3 minutes 1,2 pts
si échec 0 pts.

Le score final est la moyenne des points (sur les huit mots évalués).

Score global Scrabble

Moyenne

1,27

Erreur-type

0,06

Médiane

1,20

Mode

1,20

Écart-type

0,44

Plage

1,95

Minimum

0,45

Maximum

2,40

5. Épreuve B2 : association mot=silhouette
Un mot isolé est présenté à l'écran, pendant un temps très court (250ms). Il faut décider de l'affectation de ce mot présenté à une silhouette, à choisir parmi 3 silhouettes proposées ou bien l'attribuer à la catégorie AUTRE.

Voici le lot des silhouettes. L'expérience est répétée pour 26 mots. Le tableau suivant donne l'épreuve en clair.

les 3 silhouettes

Les 26 mots présentés

banna

benne bonne bravo brune dures durez faces faons farce fours fusas fuser

bnabe

bruts daube farts faste forte

yanba

gonds jacta juste parka pendu perds pesta

autre

nages orque

Commentaires et critiques
On voulait, à travers cette épreuve, évaluer la capacité à passer d'un mot à sa silhouette, à substituer l'une à l'autre. En quelque sorte, un mot devrait activer la silhouette correspondante. Notre impression, après observation, est que c'est le processus inverse qui existe. C'est la vue d'une silhouette qui active un mot, ce n'est pas l'inverse. Si l'on considère (avec Inhoff, Rayner, Legge et d'autres) que la vue parafovéale, donc dégradée, stylisée ici par nos silhouettes, permet d'accélérer le traitement du mot en activant une représentation logographique de ce mot, on est bien dans le sens silhouette -> mot. Or cette épreuve voulait montrer le lien inverse, mot=silhouette. En conséquence, on ne peut pas s'attendre à ce que les bons lecteurs, ceux qui possèdent une lecture "fluide", réussissent bien (ou mal) à cette épreuve. En effet, pour mener à bien cette tâche, il fallait surtout trouver un moyen de résoudre un problème : il valait mieux faire complètement abstraction du mot présenté, de son sens, et se cantonner à la prise de trois informations visuelles : si on perçoit deux lettres montantes, il s'agit du deuxième type de silhouette, s'il y a une lettre qui descend en début de mot, c'est qu'on a affaire au troisième type, et si une seule lettre monte , c'est le premier type. Ainsi, cette épreuve est plutôt révélatrice d'un niveau de résolution de problème, et de l'acceptation de ne travailler que sur des indices visuels.

Variables
Plusieurs données brutes étaient recueillies pour cette épreuve :
- le temps moyen pour donner une réponse, quelle qu'elle soit.
Moyenne 4,07 secondes
Écart-type 1,33

- temps moyen pour donner une bonne réponse
Moyenne 4,08 secondes
Écart-type 1,33

- le temps moyen pour donner une mauvaise réponse
Moyenne 3,92 secondes
Écart-type 1,79

On remarque le temps assez long pour répondre. On est loin d'une procédure automatisée. Les mauvaises réponses demandent un temps de réponse légèrement plus faible, comme si le temps de réflexion que l'on s'accorde améliore la réponse. Cela va dans le sens d'une résolution de problème plutôt que dans celui d'une réponse graphique.

Finalement, nous ne retiendrons qu'une seule variable, sans prendre en compte le temps mis. C'est :
- le nombre total de bonnes réponses aux 3 types de silhouettes. (B2)

Score B2

Moyenne

18,32

Erreur-type

0,48

Médiane

19

Mode

19

Écart-type

3,73

Minimum

5

Maximum

23

6. Épreuve B3 : reconstitution de phrase
L'épreuve rappelle un peu l'épreuve B1. Au lieu de lettres, les unités présentées ici sont des mots ; et il s'agit de reconstituer une phrase. Tous les mots en font partie. Huit phrases sont à trouver ; le temps est important dans la réussite à l'épreuve.
Phrases présentées :


Certains ne supportent pas le soleil sans lunettes.
Il y a des marées exceptionnelles deux fois par an.
Les jeux de ballon sont interdits dans la cour.
Je ne peux pas prendre mon vélo parce qu'il a un pneu crevé.
A ce jeu de dés, celui qui a 6 peut rejouer.
La grippe et l'angine donnent souvent beaucoup de fièvre.
Son réveil n'a pas sonné et il a raté son train.
Il faut se méfier des chiens qui n'aboient pas.

Sont ici probablement sollicitées :
la qualité de la reconnaissance des mots isolés mais cette fois, pour leur valeur de signifié, voire même dans la polysémie de ce signifié
une capacité syntaxique,
- avec le besoin de prendre comme point d'entrée le mot ayant une majuscule
- avec la nécessité de partir à la recherche d'un sujet en rapport à l'accord du verbe
- le besoin de reconnaître l'expansion possible des groupes nominaux (adjectifs…).

Une fois résolu le problème de l'entrée de la phrase (à l'aide d'un indice purement graphique : la majuscule), le contexte se construisait au fur et à mesure de la résolution du problème. Si le premier mot est au pluriel, Certains, le seul mot qui est aussi au pluriel est lunettes mais le genre ne correspond pas : Certains sera donc un pronom indéfini sujet. La connaissance du système de la négation oblige à placer ensuite l'adverbe ne, puis le verbe (un seul est proposé) suivi de l'autre adverbe pas : à ce stade, le contexte est déjà très fort puisqu'on est devant la structure :
Certains ne supportent pas + lunettes + le sans + soleil
Reste à placer l mots mais, ici, la solution saute aux yeux… pour des raisons sémantiques.
On est donc devant la mise en place d'un raisonnement et d'une résolution de problème au niveau syntaxique et sémantique, dans une unité phrastique.

Variable
score global de réussite à la mise en ordre de phrases qui est calculé de la manière suivante (B3) . Pour chacune des phrases, on attribue :
si réussite en moins de 30 s 2,4 pts
si réussite entre 30 et 60 s 1,8 pts
si réussite entre 60 et 120 s 1,2 pts
si échec 0 pts.

Le score final représente la moyenne des points sur les huit phrases évaluées.

score B3

Moyenne

1,39

Erreur-type

0,06

Médiane

1.58

Mode

1,65

Écart-type

0,48

Plage

2,02

Minimum

0,15

Maximum

2,17

7. Épreuve B4 : phrase à trou avec pièges
Dans cette épreuve, une phrase est présentée, avec un mot manquant. Six mots possibles sont présentés sur l'écran, et il faut choisir celui qui convient. Voici la phrase d'exemple ; les six mots proposés sont dans l'ordre :
Le bûcheron ...... une maison dans la forêt.
- un seul mot est complètement possible : loue
- un autre est quasiment possible à un détail graphique : Habite
- un autre est possible phonétiquement mais pas graphiquement, c'est un homophone non homographe : loup
- deux mots appartiennent à un champ sémantique possible globalement mais pas localement : coupent et arbre
- un autre est un intrus : prêt

Voici les autres phrases, à traiter successivement :


Phrase n°1 :
Très ......, les pompiers maîtrisèrent l'incendie.
rapide
casques
Vite
rapidement
fatiguer
or

Phrase n°2 :
Veux-tu me prêter ton ...... ?
Cartable
jouer
crayons
jouet
maintenant
jolie

Phrase n°3 :
Il se promène ...... son chien.
sans
laisse
sang
cent
Avec
toujours

Phrase n°4
...... homme, depuis des années, rêvait d'aller au cirque.
Sept
l'
Cette
Les
un
Cet

La réussite à cette épreuve sur des phrases avec des lacunes impose une rapidité dans la prise de décision, sur des mots mis dans un contexte sémantique. Il faut procéder à une élimination graphique (par exemple, Cartable dans la phrase n°2 est impossible avec une majuscule en fin de phrase), une sélection orthographique (sans, sang, cent dans la phrase n°3), une élimination sémantique et/ou grammaticale (fatiguer, or dans le phrase n°1)..

Variable
La réponse donnée peut être rapportée à une de ces 4 catégories :
1. c'est le bon mot (catégorie 1)
2. c'est autre chose, qu'il s'agisse d'un intrus ou d'un mot du champ sémantique mais impossible (catégorie 2).
3. c'est ce mot à une variante graphique près qui n'en fait pas un autre mot (catégorie 3)
4. phonétiquement, c'est ce mot mais graphiquement, c'est impossible (catégorie 4) : c'est un homophone non homographe.

Dans toutes les 295 réponses de cette épreuve, il n'y a que 4 réponses qui soient de catégorie 4. Finalement on calcule un score unique tenant compte du type de réponse et de la vitesse de réponse. On attribue 1 point pour les bonnes réponses et 0.2 point pour les réponses de catégorie 3, c'est à dire pour les confusions de type purement graphique. Les bonnes réponses sont pondérées par le temps de réponse suivant la règle :
+ 0,4 point quand le temps de réponse est court (c'est à dire inférieur à (moyenne - la moitié de l'écart-type))
- 0,3 point quand le temps de réponse est long (c'est à dire supérieur à moyenne + la moitié de l'écart-type)).

Enfin, on retire 0,5 point si la réponse est de catégorie 2 ou 4 et si le temps de réponse est long (même règle que précédemment).

Point(s) pour réussite

Catégorie 1

Avec un temps court

Avec un temps long

1.4

0.7

Catégorie 2

0.2

Catégorie 3

-0.5

Catégorie 4

-0.5

Le score minimum théorique est de -2,5 et le maximum théorique est de 7.

- score exercice à trous (B4).

score B4

Moyenne

2,92

Erreur-type

0,15

Médiane

3

Mode

2,20

Écart-type

1,19

Plage

6,10

Minimum

0,10

Maximum

6,20

8. Épreuve B5 : Tris syntaxiques
Dix mots s'affichent à l'écran. Il faut les répartir en deux catégories grammaticales. Les mots restent visibles jusqu'à la décision. On enregistre la réponse et le temps mis.

Quatre listes de dix mots sont à traiter après quelques essais pour chaque liste. Les deux catégories grammaticales changent d'une liste à l'autre.

Liste 1

liste 2

liste 3

liste 4

Distinguer les verbes des autres

distinguer les adverbes des autres mots

Distinguer les verbes des autres mots

distinguer les masculins des féminins

tapions

camions

créations

soulevions

partions

solutions

religions

buvions

aviations

marchions

lentement

retournement

absolument

vraiment

aiment

prudemment

renomment

emprisonnement

aisément

encadrement

méfait

forfait

mangeait

parlait

portrait

lisait

lait

trait

chantait

poussait

belle

petite

gros

bonne

bel

chaud

lourde

méchant

maladive

sportif

Ce qu'on espère mesurer à travers cette épreuve, c'est la capacité à opérer des tris syntaxiques sur des mots ayant des caractéristiques visuelles semblables. Le nombre de bonnes réponses peut donner des indications sur la structuration du lexique. Le temps pour répondre informe sur le processus de décision ; plus il est court, plus les critères visuels suffisent pour décider ; plus il est lent, plus un intermédiaire est nécessaire, qui passe probablement par la représentation orale. Cette épreuve provoque des décisions grammaticales, hors contexte, sur des mots isolés. La prononciation n'a aucun effet sur la prise de décision, elle témoigne seulement d'un accès indirect au lexique et doit générer une augmentation du temps de réponse.

Variables
- le nombre total de mots correctement triés (sur 40)

Bonnes réponses

Moyenne

32,39

Mode

32

Écart-type

4,37

Minimum

15

Maximum

40

- Le temps moyen mis pour prendre une décision syntaxique

Temps moyen

Moyenne

3,83 secondes

Écart-type

1,83

Minimum

0,56 seconde

Maximum

10,64 secondes

On remarque une assez bonne réussite à cette épreuve : 33 réponses correctes, le maximum étant de 40 bonnes réponses. Pour ce qui est du temps de réponse (temps moyen par mot), il est élevé (presque 4 secondes par mot).
- le score d'efficacité à l'épreuve de tris syntaxiques (B5)

C'est la variable que nous garderons comme résumé de cette épreuve. Elle combine temps et réussite. Les deux variables sont additionnées, après avoir été centrées et réduites. Le résultat obtenu est divisé par deux.

efficacité B5

Moyenne

0,0

Erreur-type

0,96

Médiane

0,2

Mode

0,3

Écart-type

1,0

Minimum

-3,0

Maximum

1,8

L'écart-type très proche de 1 montre que les deux variables sont très peu corrélées.

9. Récapitulation sur les huit épreuves graphiques
On peut regrouper les caractéristiques de ces huit épreuves dans un tableau :

Épreuves Rappel Contexte Unités Indices Stratégie Compétence Disposition lexicale
A1 Silhouette possible ou impossible Absent Pseudo-mot Silhouette du mot Décision lexicale Graphique Non
A2 "Pendu" sur une phrase Présent Phrase + lettre Consonnes Utilisation de la structure consonantique de l'écrit Graphique + syntaxique Nécessaire
A3 Mot caché Absent Lettre Syllabe Combinatoire Grapho-phonologique Non
B1 Scrabble Absent Lettre Mot Combinatoire Grapho-phonologique Nécessaire
B2 Classer des mots en fonction de leur silhouette Absent Mot Lettre Résolution de problèmes Graphique Non
B3 Reconstitution de phrase Progressif Mot Grammaticaux Combinatoire Syntaxique Non
B4 Phrase à trous Présent Mot et phrase Grammaticaux Décision lexicale Orthographique + sémantique Non
B5 Tri syntaxique Absent Mot Mot Décision grammaticale Graphique + lexicale +grammaticale Non

Chapitre 6 : Des épreuves aux compétences techniques
Nous avons déjà mentionné au chapitre III (section 2) tout l'intérêt de relire les variables issues des épreuves techniques au moyen d'un outil statistique puissant : l'analyse en composantes principales. C'est ce que nous nous proposons de faire ici. Rappelons que pour isoler de façon fiable une compétence, il faut s'abstraire des épreuves, pour retrouver ce qui les unit, à travers les " gestes " qui y sont déployés ainsi que leurs circonstances. La référence à un contexte sémantique se trouve par exemple activée dans les épreuves A2 et B4, mais l'épreuve B4 révèle aussi, avec d'autres épreuves, la capacité à opérer des décisions lexicales rapides. Les variables issues de A2 et B4 sont moyennement corrélées entre elles (.31), pourtant elles font références toutes deux à la capacité de se servir du contexte. Et ce qu'on recherche ici, ce sont bien ces compétences techniques transversales aux épreuves (comme l'aptitude à se référer au contexte) pour les mettre ensuite en relation avec la lecture.

L'Analyse en composantes principales va nous permettre de transformer nos 8 variables quantitatives initiales en plusieurs nouvelles variables quantitatives, non corrélées, appelées composantes principales. Nous allons donc examiner successivement ces 8 composantes principales, qui constituerons 8 facteurs techniques indépendants.

1 Première composante principale
Pourcentage de la variance expliquée par l'axe 1 : 32.62 %

Variables

Corrélation variable / facteur 1

A1

0.11

A2

-0.79

A3

-0.72

B1

-0.18

B2

-0.52

B3

-0.73

B4

-0.57

B5

-0.54

On observe un effet classique de niveau avec une contribution significative de 6 variables. Une seule échappe à l'effet, sans pour autant l'équilibrer sur l'autre pôle : A1, la seule à travailler sur les silhouettes.
Cette première composante représente le niveau général de compétences techniques, autour de 6 variables : à l'ouest sont groupés les bons résultats.

2 Deuxième composante principale
Pourcentage de la variance expliquée par l'axe 2 : 16.03 %

Variables

Corrélation variable / facteur 2

A1

0.56

A2

-0.09

A3

0.10

B1

-0.83

B2

-0.23

B3

0.07

B4

0.05

B5

0.45

On constate sur ce plan tout le poids des épreuves A1 et B1 :
- dont les résultats sont parfaitement indépendants de l'effet général porté par l'axe 1 (donc indépendants de l'effet de niveau)
- dont les résultats sont rigoureusement opposés : les compétences pour réussir A1 apparaissent ici antagonistes de celles nécessaires à B1.

C'est l'opposition de A1 et de B1 qui forme cette deuxième composante principale. Qu'est-ce qui est opposé ici ?

Rappelons-nous que le mode de calcul de l'épreuve A1 révèle la capacité à décider qu'un mot prononçable en français ne peut malgré tout pas exister, autrement dit qu'il ne correspond pas à une silhouette graphique possible. On suppose que la réussite passe par l'habitude de traiter les silhouettes communes autant que les mots, donc renvoie à une efficacité de l'empan de lecture, y compris dans la partie parafovéale.

À l'inverse, réussir à B1 nécessite l'habitude de traiter des indices très courts, de la lettre à la syllabe. Le processus de décodage phonologique qui est à l'œuvre dans cette épreuve se déroule par définition sur des unités grapho-phonologiques, de quelques lettres.

L'axe qui se dessine oppose nettement une utilisation de l'écrit qui passe par un codage indirect au traitement de formes graphiques abstraites. Ce facteur va du grapho-phonologique au graphique, de la voie indirecte à la voie directe. La présence de B5 (graphique + décision rapide) du côté de A1 confirme cette interprétation. Cette opposition de la voie indirecte (B1) à la voie directe (A1) repose sur l'habileté à traiter des empans de longueurs diverses, de quelques lettres, à plusieurs mots. Cet axe représente donc la composante de la nature des indices traités.

3 Troisième composante principale
Pourcentage de la variance expliquée par l'axe 3 : 13.40 %

Variables

Corrélation variable / facteur 3

A1

0.72

A2

-0.09

A3

0.05

B1

0.15

B2

0.25

B3

0.05

B4

0.38

B5

-0.56

L'axe 3 fait éclater l'aspect graphique qui s'oppose sur l'axe 2 au grapho-phonologique par la maîtrise de différents indices. Les deux épreuves (A1 et B5), assez semblables (absence de contexte, décision rapide sur mot, compétence graphique, absence de disponibilité lexicale) se différencient quant à la nature du traitement à exécuter pour parvenir à opérer les classements demandés :
- pour A1, on ne peut pas justifier la décision que l'on prend. En effet, on prend cette décision sur des prégnances de silhouettes de mots, de toute façon, inconnues. Pourtant, la décision est prise rapidement : on est donc devant une grande automatisation de la tâche.
- pour B5, on peut prendre le temps de réfléchir pour donner sa réponse. La décision passe par des catégories, par des schèmes c'est à dire par des représentations intermédiaires entre les phénomènes perçus et les catégories de l'entendement.

En conséquence, cette troisième composante est celle de l'automatisation des décisions lexicales, dans un traitement d'unité graphique.

L'opposition n'est pas totale du fait de leur contribution commune à l'axe 2 ; on peut (et on devrait ?) être bon dans les deux compétences.

4 Quatrième composante principale
Pourcentage de la variance expliquée par l'axe 4 : 11.76 %

Variables

Corrélation variable / facteur 4

A1

-0.18

A2

-0.29

A3

0.35

B1

0.14

B2

-0.64

B3

-0.01

B4

0.52

B5

-0.05

L'axe 4 se construit autour de deux épreuves (B4 et B2) également et inversement indépendantes de A1 (perpendicularité).

B4, a-t-on le droit de l'avouer, est pour nous l'épreuve la plus pertinente dans sa problématique et dans sa réalisation. Pour réussir à B4, il faut franchir le plus vite possible le premier obstacle de la compréhension de la phrase lacunaire, donc éliminer les mots sur des opportunités sémantiques, il faut ensuite procéder à une élimination sur des critères grapho-morphologiques alors que le sémantique conviendrait, il faut enfin décider sur des critères orthographiques puisque les derniers mots candidats sont homophones. C'est une bonne panoplie des compétences (en dehors du traitement des indices flous) dans l'écrit. Cette épreuve montre la capacité de prendre en compte la quasi totalité des indices disponibles (contextuels et visuels) dans une activité ayant un but précis.

Pour réussir à B2, il faut développer une stratégie artificielle (en vision parafovéale, on ne va pas du mot à la silhouette, mais de la silhouette au mot) en ne tenant volontairement pas compte des indices, notamment sémantiques, sur lesquels repose l'usage de l'écrit. On est devant une capacité à prendre des indices en les isolant compètement de tout rapport au signifié.

Cette quatrième composante décrit le mode de traitements des indices graphiques, depuis, on serait presque tenté de dire leur encapsulage jusqu'à leur simultanéité ; c'est la capacité de traitement simultané d'indices.

5 Cinquième composante principale
Pourcentage de la variance expliquée par l'axe 5 : 10.38 %

Variables

Corrélation variable / facteur 5

A1

0.29

A2

-0.11

A3

-0.15

B1

0.40

B2

-0.31

B3

0.57

B4

-0.33

B5

0.17

C'est essentiellement B3 qui construit l'axe 5.

B3, c'est une résolution de problème qui s'appuie sur une créativité linguistico-sémantique nourrie par un bon traitement d'indices syntaxiques. Comme dans B1 (important aussi pour cette composante), il faut faire tourner (combiner) les éléments, être créatif et rapide dans la combinatoire en référence à du sémantique, mot ou phrase. la langue.

C'est la composante de la créativité linguistique

6 Sixième composante principale
Pourcentage de la variance expliquée par l'axe 6 : 6.54 %

Variables

Corrélation variable / facteur 6

A1

0.04

A2

-0.33

A3

0.52

B1

0.07

B2

0.18

B3

-0.08

B4

-0.31

B5

0.03

L'axe 6 est tiré par A3, la seule épreuve qui suppose un travail sur la lettre et la syllabe, dans l'absence même du mot, lequel n'existerait qu'encadré par des blancs. La réussite passe par un tâtonnement grapho-phonologique.
À l'opposé A2 suppose un pilotage (et/ou un contrôle) par le contexte sémantique (phrase inductrice), ce que semble confirmer d'une part la présence de B4 qui est aussi une épreuve faisant appel au contexte, et d'autre part la présence de B3 (avec une faible incidence sur l'axe) présente du même côté avec un pilotage progressif par le contexte.
C'est la composante de l'horizon d'attente.

7 Septième composante principale
Pourcentage de la variance expliquée par l'axe 7 : 5.30 %

Variables

Corrélation variable / facteur 7

A1

0.04

A2

-0.30

A3

-0.20

B1

0.18

B2

0.21

B3

-0.12

B4

0.24

B5

0.37

C'est un axe qui oppose une conscience grammaticale au niveau des mots hors contexte (B5) à une image de la syntaxe au niveau de la phrase (A2), ce que viennent confirmer l'opposition de A2 à B2 (mots) et le rapprochement de A2 et B3. Même si cette fois, on travaille sur des unités différentes (phrases vs. mots), on est bien, du côté de A2 et B3, dans la capacité de prendre comme unité de réflexion, une unité de grande taille : la phrase. Cette septième composante dessine finalement la conscience de la phrase, la conscience phrastique.

8 Huitième composante principale
Pourcentage de la variance expliquée par l'axe 8 : 3.98 %

Variables

Corrélation variable / facteur 8

A1

0.20

A2

0.28

A3

0.08

B1

0.20

B2

-0.15

B3

-0.33

B4

-0.06

B5

0.15

Bien que de faible contribution, on est sans doute devant une composante assez précise. La septième composante avait isolé cette conscience de la phrase comme unité de traitement, cette huitième composante va séparer la façon d'aborder cette unité phrastique. Dans les deux cas, il s'agit de reconstituer une phrase. Mais dans A2, la solution va venir de la phrase en s'aidant de l'ajout de lettres pour trouver des mots ; c'est rapidement un closure. En revanche, dans B3, c'est le sens d'une phrase qu'il faut construire (dans toutes les acceptions du mot sens) à partir de mots dont la signification dépend aussi de la place qu'ils auront dans la phrase. Dans les deux cas on est sur la phrase mais c'est seulement du côté de B3 qu'elle est à construire. On peut donc faire l'hypothèse que la réussite à B3, à la différence de la réussite à A2 témoigne de l'habileté, au sens d'agilité, à créer un sens global nouveau à partir d'éléments ayant isolément un sens, une sorte de créativité linguistique à tester des hypothèses sémantiques, une capacité à la pensée divergente tandis qu'A2 est davantage du côté du contexte, de l'intégration, de la convergence.
C'est sans doute la capacité à émettre des hypothèses sémantiques sur des unités longues (la phrase) et à les vérifier.

Conclusion
Les composantes principales obtenues répartissent désormais la variance des résultats de tous les individus à propos de toutes les épreuves autour de 8 axes dont le principe de construction progressive est l'absence totale de corrélation, ce qui n'était pas le cas pour les variables de départ. Désormais, pour ce qui concerne cette population de 59 élèves et les 8 composantes principales étudiées, aucune position d'un individu sur un facteur ne permet de prévoir sa position sur un autre facteur. De ce fait, toute rupture de cette indépendance qui viendrait à être observée sera à interpréter comme imputable à la relation de ces facteurs indépendants à une variable extérieure à expliquer ou aux critères autour desquels se constitueront et s'opposeront des sous groupes au sein de la population totale. On poursuivra donc logiquement cette investigation grâce à des analyses de variance si les variables explicatives sont nominales ou à des régressions multiples si elles sont continues.
À ce stade, le risque est pris de 8 compétences techniques décrites par la position de chaque individu sur 8 axes. Les voici à nouveau :

N° Composante

(% variance expliquée)

composante…

1 (32,62 %)

du niveau général

2 (16,03 %)

de la nature des indices traités.

3 (13,40 %)

de l’automatisation des décisions lexicales

4 (11,76 %)

de la capacité de traitement simultané d’indices.

5 (10,38 %)

de la créativité linguistique

6 (6,54 %)

de l’horizon d’attente.

7 (5,30 %)

de la conscience phrastique.

8 (3,98 %)

des hypothèses sémantiques sur des unités longues

Cette évaluation a été faite à travers 4 épreuves de manière à couvrir des situations de lecture différentes et bien représentatives de ce qu'on attend d'un lecteur à l'entrée en sixième.

1. Recherche documentaire
Il s'agit d'une épreuve chronométrée de consultation documentaire pour répondre à des questions, le document étant en permanence disponible. On est devant deux pages bien structurées avec des modes de présentation diversifiés, textes, graphiques, photos, cartes…

Les documents sont présentés en annexe 1. Il y a douze questions, l'épreuve n'utilise pas l'ordinateur.

Il s'agit d'entourer la bonne réponse pour chacune des 12 questions qui font appel à des techniques d'information différentes. L'épreuve est chronométrée.

On pense évidemment à enregistrer le temps mis pour répondre à l'ensemble des questions et le nombre de bonnes réponses
- Le temps pour répondre (T)

Moyenne 

606 secondes

Écart-type 

288

- nombre de bonnes réponses (N)

Moyenne 

9.75

Écart-type 

1.89

Ces deux informations prises isolément n'ont guère de sens : on peut aller très vite pour ne fournir aucune réponse correcte et inversement. On s'intéresse alors au temps mis pour fournir une bonne réponse (T/N) ou, mieux encore au nombre de bonnes réponses fournies dans une unité de temps, par exemple l'heure (N/T multiplié par 3600), ce qui permet d'avoir exactement la même information mais plus lisible puisqu'un score élevé correspond alors à une bonne performance.
- temps pour une bonne réponse

Moyenne 

65.3 secondes

Écart-type 

34.1

variable choisie
- nombre de bonnes réponses à l'heure

N bonnes réponse / heure

Moyenne

71,89

Erreur-type

4,817

Médiane

67,5

Mode

116,47

Écart-type

36,97

Plage

144,33

Minimum

21,82

Maximum

166,15

C'est cette variable que nous conserverons pour décrire la performance à ce type assez fréquent de lecture pour consulter des documents qui ne sont pas exclusivement du texte, même si l'écrit y est toujours nécessaire, et qui fait appel en permanence à de la compréhension et du traitement d'information, depuis le texte même des questions jusqu'à la structure des pages. Le résultat tient compte à la fois de la qualité et de la promptitude de la réponse.

2. Lecture de textes courts
On précise à l'élève qu'on cherche à mesurer quelle est sa vitesse efficace de lecture, c'est-à-dire celle qui le fait aller vite en lui assurant une issue favorable, ici la bonne réponse à une question qui lui est posée après la lecture du texte. Les textes sont standards pour la classe d'âge et sont diversifiés (presse, documentaire, fiction). L'épreuve se déroule sur l'ordinateur. Il y a neuf textes possibles.

Les documents (textes et questions) sont présentés en annexe 2.

Chaque texte s'affiche, l'élève indique quand il a terminé la lecture et doit répondre alors à une question. L'épreuve s'arrête lorsque 3 réponses correctes sont données à la suite. En fait, ces 3 réponses exactes et consécutives ont été obtenues pour tous les élèves au plus tard au 7ème texte.

variables
Trois informations vont être prises ou construites : vitesse moyenne textes courts
On calcule ici la vitesse moyenne sur les différents textes en ayant éliminé la vitesse maximum et minimum, quelle que soit la réponse donnée.
Moyenne 14940 mots/heure Écart-type 9905 Min. 3406 Max 51844 Presque 15000 mots/heure de moyenne pour cette population, c'est une bonne performance, qui correspond à des empans moyens de 8 à 9 signes lors de chaque fixation.
La vitesse la plus faible n'est pas loin d'une exploration syllabique (moins d'un mot à la seconde) et la vitesse la plus grande correspond, en lecture intégrale, à des empans proches de 5 mots. Notons que cet élève satisfait néanmoins à la condition des 3 réponses correctes consécutives dès le 5ème texte, ce qui le situe un peu au-dessus de la moyenne. le nombre de textes courts nécessaires On enregistre le numéro du texte auquel l'élève s'est arrêté. Le score 3 signifie qu'on a satisfait à la condition (3 bonnes réponses de suite) dès le troisième texte. Moyenne 5.15 Écart-type 1.05 Min. 3 Max 7 On peut considérer que l'élève procède à la recherche de sa bonne vitesse de lecture, celle qui va lui permettre de donner la réponse à une question qu'il ne connaît pas encore au moment de la lecture, donc qui l'oblige à une vigilance large. Pour ceux dont le score est 3, il est impossible de savoir s'ils sont à leur bonne vitesse ou s'ils fonctionnent en dessous de leurs capacités réelles. C'est pourquoi nous avons construit une nouvelle variable afin de mieux définir une efficacité de lecture à partir de la vitesse moyenne et du nombre de textes nécessaires.. vitesse efficace textes courts On calcule une vitesse pondérée par le nombre de textes qu'il a été nécessaire de lire pour établir cette vitesse efficace.
Nous utilisons une formule (vitesse divisée par la racine carrée du (nombre de textes moins 2)) qui conserve sa vitesse à celui à qui seulement 3 textes ont été nécessaires. Ainsi celui qui a lu le plus lentement (3406 mots/heure) mais à qui seulement 3 textes ont suffi conserve cette vitesse tandis que le plus rapide (51844 mots/heure) mais à qui il a fallu 5 textes voit sa vitesse efficace descendre à 29332 mots/heure. C'est cette information que nous conservons pour décrire la performance sur cette épreuve, qui correspond à une forme de lecture très courante, sans doute à l'œuvre dans plus de 60 % des situations ordinaires, celles où il s'agit de travailler simplement sur l'explicite du texte, ce qui correspond à ce que la Direction des Etudes et Prospective du Ministère de l'Eductaion Nationale décrit comme une " compétence approfondie ". Vitesse efficace textes courts Moyenne 8589,08 m/h Erreur-type 763,39 Médiane 6261 Écart-type 5863,76 Minimum 1949 Maximum 29932 3 Lecture d'un texte long C'est une épreuve qui aborde la lecture savante, le travail sur l'implicite du texte, ce que la DEP donne comme " compétence remarquable " et dont semble ne disposer que 20 % des élèves qui entrent en sixième.
Il s'agit de dépasser ce que dit le texte pour atteindre ce qu'il veut dire, l'intention de l'auteur qui avance masqué derrière les moyens qu'il emploie au niveau de l'organisation d'ensemble d'un texte Le texte, long de 1526 mots, est présenté à l'écran d'ordinateur ; l'élève peut parcourir à sa guise les 9 pages écran pendant le temps qu'il estime nécessaire. Ensuite, il répond à des questions sur une fiche papier, mais le texte n'est plus consultable. L'auteur de ce texte est Gianni Rodari. Cette épreuve sera dorénavant nommée RODARI.
Les documents sont présentés en annexe 3.
Variables Vitesse de lecture en mots/heure
Moyenne 11835 m/h Écart-type 7328 Min. 3537 Max 45030
La vitesse est ici inférieure à celle des textes courts, ce qui témoigne en faveur de l'adaptation des stratégies à la tâche. Toutefois, les enfants ayant des vitesses lentes restent lents quoiqu'il arrive par impossibilité technique de faire autrement. Ce point n'est pas pour nous un sujet d'investigation mais on rencontre tant d'a priori sur la vitesse en lecture qu'il est utile de donner, en passant, ces résultats opposant les 8 plus lents et les 8 plus rapides lecteurs des textes courts : Vitesse textes courts Vitesse Rodari Compréhension Rodari
Les 8 plus lents aux textes courts 4308 mots/heure 4178 mots/heure 55.5
Les 8 plus rapides aux textes courts 34835 mots/heure 22097 mots/heure 53.5
On observe que devant un texte plus difficile, le lecteur rapide réduit sa vitesse d'un tiers, tandis que le lecteur lent lit toujours à la même vitesse. Et si on en juge à la performance en compréhension (variable sur laquelle nous anticipons puisque nous la présenterons ensuite), il n'y a pas à chercher d'explication du côté d'un quelconque 'niveau général'. On est devant une insuffisance technique : les lents lisent 2 fois moins vite que l'expression orale, les rapides 2 fois plus vite, soit une variation du temps de 1 à 4, pour le même résultat en compréhension. Aussi ne faut-il pas s'étonner que les lents se détournent de l'écrit dès qu'ils n'y sont pas contraints. Compréhension Rodari Elle est calculée à partir de la grille des réponses, remplie par l'élève. Un barème a été établi par des 'juges' qui ont considéré qu'une compréhension n'est jamais du tout ou rien mais qu'il y a des degrés d'interprétation qu'ils ont tenté d'évaluer. Il devrait être possible de perfectionner cette approche en cherchant à cerner l'existence ou non d'une cohérence entre toutes les questions à propos de scénarios interprétatifs. L'épreuve comptait dix-sept questions, mais une a été écartée du résultat final. Toutes les questions sont présentées en annexe 3. Le score est la somme des questions 1 à 11 à laquelle s'ajoutent les 2/3 de la somme des 5 questions classées à la question 13. La question 12 n'a finalement pas été retenue. Le maximum possible est 94.
Compréhension Rodari Moyenne 54,2 points Écart-type 10,1 Maximum 75 Minimum 31
Nous considérons que cette manière de décrire la compréhension correspond assez fidèlement aux définitions qu'on peut donner des effets d'une lecture experte, observée sur un texte littéraire se rapprochant de ce qu'il est convenu d'attendre ensuite dans les classes de premier cycle. Efficacité Rodari L'efficacité sur cette épreuve est calculée d'après cette formule qui vise à établir une parité entre la contribution de la vitesse et de la compréhension. Efficacité rodari Moyenne 24,00 Erreur-type 1,06 Médiane 22,38 Mode 21,98 Écart-type 8,11 Plage 36,03 Minimum 11,95 Maximum 47,98 C'est cette mesure de l'efficacité que nous conserverons pour caractériser cette forme de lecture savante qui porte sur l'écriture littéraire. Si nous ne devions conserver qu'une seule mesure de la performance en lecture (mais ce n'est pas l'option que nous avons retenue), c'est incontestablement ce résultat qui nous servirait de point de repère car il nous semble que c'est dans la confrontation à l'écriture dans ce qu'elle a de plus élaborée, c'est-à-dire face au texte littéraire, que la qualité de la lecture se révèle le plus complètement 3 Lecture de recherche C'est un type d'épreuves qui a déjà été utilisé avec les mêmes enfants lorsqu'ils étaient au CE1 (février). On demande à l'enfant, en CM2, de retrouver le plus vite possible un extrait dactylographié, parmi des ouvrages disposés devant lui. Cette situation conduit le lecteur à mettre en œuvre successivement des stratégies diversifiées, qui font également appel à sa connaissance des productions écrites et de leurs particularités : compréhension de l'extrait afin d'en tirer des pistes de recherche (de quoi il parle, pour quel public, avec quel style, dans quel cadre, dans quelle intention, etc.) ; élimination des ouvrages qui ne correspondent pas ; consultation des ouvrages sélectionnés (recours aux tables des matières, index, etc.) ; localisation (appui sur la mise en page, les hiérarchies, lecture sélective, recherche rapide, etc). On a là une panoplie assez large et bien finalisée de gestes de lecture. L'épreuve demande de localiser deux extraits (un documentaire, un de fiction) dans le même lot de livres.

Premier extrait : " Tout autre est le fonctionnement de l'alphabet qui permet, en principe, avec une trentaine de signes, de tout écrire. Ce n'est évidemment pas tout à fait aussi simple et les vingt-six lettres de notre alphabet, par exemple, ne traduisent pas tous les sons… d'où de cruciaux problèmes d'apprentissage de l'orthographe pour les écoliers. "

Deuxième extrait : " Cette idée-là lui vint au lit alors qu'elle repassait dans sa tête le film qu'elle avait vu à la télévision, l'après-midi même. C'était un film d'espionnage si compliqué que la plupart du temps elle aurait été bien en peine d'expliquer ce qui se passait, - surtout qu'elle avait pris l'histoire en marche, alors qu'il y avait déjà un cadavre au pied de l'escalier dont elle n'avait vu que la fin de la chute. "
La liste des dix-sept ouvrages proposés : Jaffabules, Pierre Coran La boîte aux lettres secrètes, Jan Mark Journal d'Anne Franck Prête-moi ta plume, Jacques Charpentreau Carnets de bord, les enfants de la baleine blanche Les trois plumes et douzes autres contes, Grimm Lettres de mon moulin, Daudet Les voleurs d'écriture, Azouz Begag À vos plumes citoyens, Gérard Gengembre L'écriture mémoire des hommes Hiéroglyphes, l'écriture de l'égypte ancienne La lettre brûlée, Rolande Causse Point d'interrogation, le hamster qui aimait les livres Les lettres et la typographie L'écriture et le livre Écritures, signes et codes secrets Un livre des hommes

L'observateur a pour mission de décrire au plus près des gestes en utilisant les grilles de comportements présentées en annexe 4.
Variables Pertinence des stratégies
Le dépouillement de ces grilles va permettre d'évaluer la pertinence des stratégies lors de l'élimination/sélection des ouvrages puis lors des tentatives de localisation à l'intérieur des ouvrages retenus.
Moyenne 22.02 Écart-type 9.03 Min. 1 Max 39 Réussite
Il s'agit, au-delà des stratégies, de décrire leur efficacité à travers la localisation effective des extraits et la prise en compte du temps pour y parvenir.
Réussite lecture de recherche Moyenne 3,32 Erreur-type 0,60 Médiane 0,00 Mode 0,00 Écart-type 4,62 Minimum 0,00 Maximum 17,00
On voit que cette épreuve est très sélective puisque 36 élèves y échouent, ce qui donne plus de prix à la réussite des autres. Malgré une distribution peu orthodoxe, nous gardons ce résultat car il témoigne, certes de manière brutale, de performances différentes à une forme de lecture de recherche fréquente et qui suppose, à côté de techniques spécifiques, que le lecteur ait une familiarité avec les caractéristiques et l'organisation de la production écrite.

3 Construction d'un indice composite de performance de lecture
Les quatre épreuves différentes utilisées pour décrire la performance de lecture s'articulent autour de 4 situations de lecture ; elles nous ont semblé révélatrices de ce qui attend un lecteur adolescent : utiliser un texte documentaire (manuel) pour en tirer des informations ponctuelles parcourir des textes relativement simples (journal) pour en extraire de l'explicite conduire une lecture savante sur un texte (littérature) procéder à la consultation de nombreux ouvrages (BCD ou CDI) pour localiser une information. Nous n'avons pas fait le choix de les additionner comme si elles étaient équivalentes et indépendantes les unes des autres. Nous avons, au contraire, choisi de construire un indice de niveau général de performances à partir des axes d'une analyse en composantes principales. Analyse en composantes principales TABLEAU DES 2 PREMIERES VALEURS PROPRES Numéro Valeur propre Pourcentage Pourcentage cumulé 1 1.7394 43.39 43.39 2 1.2458 31.15 74.63 Part de chaque variable active dans la construction de l'axe
1. Variable Corrélation variable-facteur
1 Recherche documentaire RHNY 33 % Vitesse corrigée textes courts VCTC 78 % Efficacité rodari EfRo 92 % Réussite lecture de recherches REGR 40 %
On voit que le premier axe est clairement celui du niveau auquel concourent les 4 épreuves. L'axe 2 différencie la performance selon qu'elle porte sur une consultation de documents ou sur un survol assez superficiel de textes faciles. C'est donc la coordonnée des individus sue l'axe 1 qui déterminera leur performance composite en lecture, performance dans laquelle aura été retirée la répétition, d'une épreuve à l'autre, du niveau de cette performance. Il est donc maintenant possible de procéder à la dernière étape de ce travail en mettant en relation une performance de lecture qui nous semble solidement construite et des compétences techniques construites sur des situations de traitement de l'écrit hors de la lecture.
Chapitre 8 : Rapports entre compétences techniques et performances de lecture. Nous disposons de 8 compétences techniques et d'une performance de lecture mesurée indépendamment d'eux. Comment explorer les liens entre ces variables ?
1. Le modèle d'analyse. Cette exploration sera conduite à travers l'étude des régressions linéaires multiples : La variable à expliquer (variable endogène) est la performance de lecture. Les variables explicatives indépendantes (variables exogènes) sont les 8 compétences techniques construites précédemment par l'analyse en composantes principales. AJUSTEMENT DES MOINDRES CARRES (AVEC TERME CONSTANT) 59 INDIVIDUS, 9 VARIABLES (CONSTANTE EN QUEUE). IDEN LIBELLE Coefficient Ecart-type Student (50) Probabilité. Composante 1 - niveau général -0.0885 0.092 0.967 0.338 Composante 2 - Nature Indices Traités 0.2753 0.131 2.109 0.040 Composante 3- automatisation décision Lexicale 0.0294 0.143 0.206 0.838 Composante 4 - Traitement simultané indices 0.4596 0.152 3.016 0.004 Composante 5- Créativité linguistique 0.3716 0.162 2.291 0.026 Composante 6 - Utilisation de l'horizon d'attente -0.2546 0.204 1.246 0.219 Composante 7 - Conscience phrase -0.0462 0.227 0.203 0.840 Composante 8 - Hypothèses sémantiques -0.6479 0.262 2.472 0.017 CONSTANTE 0.0000 0.148 0.000 1.000 Somme des carrés des écarts ........... SCE = 64.4767 Coefficient de corrélation multiple... R = .5955 R2 = .3546 Variance estimée des résidus S2 = 1.2895 S = 1.1356 Test de nullité simultanée des coefficients des 8 variables : FISHER = 3.434 DEG.LIB = 8 50 P.CRIT = .0032 V.TEST = 2.73 La probabilité du test de nullité simultanée des coefficients des 8 variables est de 3 %. En conséquence, nous rejetons l'hypothèse nulle (P inferieur à 5%), qui si elle avait été acceptée n'aurait pas permis de valider le modèle. Il y a donc des relations entre les variables explicatives et la variable endogène. Les variables explicatives, combinées ensemble expliquent environ 35 % du modèle (R2 = 0.35).
Il est bien évident que les compétences techniques qui interviennent en lecture ne se réduisent pas aux 8 que nous avons définies à partir des exercices que nous proposions. Il n'empêche qu'elles ont déjà un pouvoir explicatif non négligeable. Il manque ici très probablement pour mieux saturer le modèle l'intervention de compétences plus générales que celles auxquelles faisaient appel nos exercices : attentes par rapport à un texte, buts de la lecture, connaissance du monde en général, connaissance du sujet abordé par le texte… La lecture, considéré comme une activité complexe ne peut se résumer à l'étude des compétences techniques que nous avons relevées ; de ce fait, on peut s'estimer satisfait d'arriver à expliquer tout de même 35 % du phénomène par nos variables exogènes.

2. Les composantes techniques en rapport avec la performance de lecture.
L'analyse précédente fait apparaître que quatre composantes sur les 8 contribuent de manière significative (P 0.05) à l'explication de la performance de lecture. L'intérêt de ce type d'analyse, c'est qu'on enlève les effets des corrélations entre variables et qu'on peut observer l'effet d'une variable lorsqu'il n'y a qu'elle qui varie, toutes les autres étant maintenues constantes par construction.
2.1. Première contribution technique
La composante technique qui possède la contribution la plus significative à la variation de la performance de lecture est celle qui décrit la capacité de traitement simultané des indices graphiques. Coefficient Ecart-type Student (50) Probabilité. Composante 4 - Traitement simultané indices 0.4596 0.152 3.016 0.004 Le coefficient de cette composante est positif : plus on se trouve du côté positif de cette composante (de l'axe), meilleurs sont les résultats en lecture. On est donc devant l'observation suivante : toutes les autres composantes étant maintenues égales par ailleurs, toute augmentation de la diversité des indices traités simultanément produit une élévation de la performance de lecture. A l'inverse, les mauvaises performances en lecture sont associé à un petit nombre d'indice traités simultanément.

2.2 Deuxième contribution technique
La seconde composante technique qui contribue à la performance de lecture est celle qui permet d'émettre des hypothèses sémantiques sur des unités longues (phrase) et de les vérifier. Coefficient Ecart-type Student (50) Probabilité. Composante 8 - Hypothèses sémantiques -0.6479 0.262 2.472 0.017 Le coefficient de cette variable est négatif, montrant ainsi que plus on se trouve du côté négatif de la composante (axe 8), meilleurs sont les résultats à l'indice de performance de lecture. En conséquence, plus on est capable de faire fonctionner le jeu complexe d'émission et de vérification d'hypothèses sur des unités longues, meilleur on est en lecture. Le bon lecteur témoigne de l'habileté, presque au sens d'agilité, à créer des hypothèses de sens et à les faire fonctionner sur les éléments graphiques alors que le mauvais lecteur est plutôt du côté de la fusion, de la construction à partir des éléments.

2.3 Troisième contribution
La troisième composante technique qui contribue à la performance de lecture est celle qui témoigne d'une sorte de créativité linguistique. IDEN LIBELLE Coefficient Ecart-type Student (50) Probabilité. Composante 5- Créativité linguistique 0.3716 0.162 2.291 0.026 Le coefficient de cette composante est positif : plus on se trouve placé du côté positif de cette composante (de l'axe), meilleurs sont les résultats en lecture. En conséquence, être bon en lecture, c'est résoudre des problèmes de recherche de sens en prenant appui sur une créativité linguistique guidée notamment par des indices syntaxiques.

2.4 Quatrième composante
La quatrième composante technique qui contribue à la performance de lecture porte sur la nature des indices pris en compte. IDEN LIBELLE Coefficient Ecart-type Student (50) Probabilité. Composante 2 - Nature Indices Traités 0.2753 0.131 2.109 0.040 Le coefficient de cette composante est positif. La compétence que porte cet axe est construite sur l'opposition entre le recours à des unités courtes, la lettre et la syllabe, entrant dans le décodage phonologique et le recours à des formes graphiques abstraites matérialisées pour nous par des silhouettes. Le bon lecteur serait celui qui est capable de traiter d'autres indices que ceux que la vision fovéale permet de voir nets.

3. Conclusions

Seules ces quatre composantes, dans les limites de notre modèle, jouent un rôle dans la performances de lecture telle que nous l'avons calculée. Cela ne veut pas dire qu'un bon lecteur n'est pas bon sur d'autres composantes techniques entrant dans la résolution des exercices techniques que nous avons proposés. Cela veut dire qu'on n'observe pas, toutes choses étant égales par ailleurs, d'effets de ces autres compétences techniques sur la lecture et qu'on peut alors faire l'hypothèse qu'elles ne sont pas des compétences qui contribuent à la lecture, même si elles sont des compétences techniques sur l'écrit. Il faut donc en revenir à ces 4 compétences. Ce qui saute aux yeux, c'est qu'elles vont ensemble 2 par 2, même si par construction elles sont totalement indépendantes. Un premier groupement de deux axes (effets 2 et 4) définit un plan où se joue la question de la nature des indices dans l'écrit. Ce plan est celui du texte, du visible, du graphique, des informations qui vont y être prises.
Il se structure : d'une part autour de la prise en compte de la diversité des indices disponibles. Ceci vient confirmer notre première hypothèse qui supposait une discrimination entre bons et mauvais lecteurs dans la multiplicité des informations prises simultanément. Ce résultat conforte un peu plus les théories interactionnistes, dans la mesure où on n'est pas dans un schéma impliquant une suite agrégative d'informations avec une sélection après chaque indice, mais dans un choix, une sélection en fonction d'une grande quantité d'indices simultanés. d'autre part de la capacité à les traiter en dehors d'une vision nette. Ceci vient confirmer notre deuxième hypothèse, qui spéculait sur l'aptitude des bons lecteurs à maîtriser les catégories de formes graphiques dégradées. Il semble maintenant acquis que les bons lecteurs manient de manière plus experte la reconnaissance de ces catégories visuelles, en l'absence de toutes référence sémantique, sur des critères logographiques.
En ce sens, ce résultat consolide l'hypothèse émise par Inhoff (INHOFF, 1989). Le deuxième groupement de deux axes (effets 5 et 8) définit un plan où se rencontrent la capacité d'émettre des hypothèses sémantiques sur des unités longues (phrase) et celle de rechercher du sens en prenant appui sur une créativité linguistique guidée là encore par des indices syntaxiques. A l'inverse du plan précédent qui situe les compétences techniques autour du point de fixation, ce deuxième plan est à l'extérieur du texte, dans la capacité de le questionner en liaison avec une expérience linguistique. Ce serait en quelque sorte le plan dans lequel le lecteur fait tourner des hypothèses jusqu'à ce qu'elles organisent convenablement (par rapport à son attente) les données du plan précédent. Nous n'avions pas fait d'hypothèses à ce sujet. Ces deux plans pourraient ainsi recouvrir les deux pôles de l'interaction mais dans une définition différente : Les éléments de bas niveau dans leur simultanéité et dans l'obligation de leur prêter de l'information sémantique pour compenser la dégradation de l'information visuelle ; Les éléments de haut niveau qui participent de l'instance " proactive " sans laquelle il n'y a pas de traitement d'unités larges dans le texte mais qui se redéfinit elle-même sur des indices au niveau de la phrase. S'agit-il toujours dans ce cas d'une interaction ? Perspectives L'ensemble des résultats de cette recherche contribuent au questionnement d'une position simplement interactionniste de la lecture. Les deux hypothèses que j'avais posées portaient sur la différenciation des stratégies entre bons et mauvais lecteurs. Le premier plan formé par les quatrième et deuxième composantes semble les confirmer. En revanche, le deuxième plan devrait permettre de formuler de nouvelles hypothèses. La représentation suivante peut aider à visualiser ce qui semble plus assuré après ce travail qu'avant : D'une part, le fait de se servir du contexte semble bien discriminer les bons des faibles lecteurs. Il semble de plus en plus certain que le lecteur fait " feu de tout bois " dans toutes les situations de lecture. Toutes les informations dont il dispose sont activées simultanément pour résoudre la tâche mais aussi sélectivement par rapport au questionnement. D'autre part, la qualité de la lecture est dépendante de la nature des informations qu'ils prélèvent dans l'écrit : du côté des faibles lecteurs, les unités courtes sont traitées avec un maximum de pertinence mais elles portent peu d'informations ; du côté des bons lecteurs, on est capable de tirer de l'information d'unités beaucoup plus larges. Il semble que cela se manifeste par la capacité à concevoir et à traiter des unités de type logographique prenant appui sur les silhouettes de lettres et de mots. Ces conclusions, si on les rapporte aux débats qui traversent la littérature scientifique, s'inscrivent donc dans l'optique du dépassement du modèle autonomiste qui suppose une succession des processus mais aussi conduisent à requestionner les notions de contexte et d'interaction. L'interaction sert aujourd'hui encore pour expliquer la façon dont on accède au lexique. Si on considère, avec elle, que le contexte joue un rôle dans cet accès, cela veut dire que ce qui entre en jeu, c'est le contexte sémantique (préactivation d'un sème par un contexte sémantique), et/ou le contexte linguistique (effet de priming, ou encore effet de fréquence de mot). On est donc toujours dans un contexte de haut niveau, au sens de la connaissance du monde (construit par nos savoirs sur le monde ET par la phrase en cours de lecture ; savoirs linguistiques généraux). Nous ne pouvons bien sûr qu'approuver cette façon de penser. Cependant, on peut sans doute introduire une notion peu développée de contexte graphique local. En effet, nous avons vu que, lorsque les yeux s'arrêtent à un point de fixation, les meilleurs lecteurs sont capable de traiter de l'information dégradée, mais par ailleurs sont aussi capables de traiter simultanément un grand nombre d'indices. Il ne s'agit plus alors, pour les meilleurs lecteurs, de prendre une information qui conforterait ou infirmerait leurs hypothèses sémiques en cours, mais d'être capables de mettre en relation l' (ou les) hypothèse(s) en cours de validation et des informations plurielles extraites simultanément d'un contexte visuel local. En quelques sortes, la véritable interaction ne pourrait se réaliser qu'en s'extrayant de son aspect binaire (contexte et information) et en intégrant véritablement plusieurs types d'informations, issues de différents contextes, généraux et locaux. Cette interaction redéfinie ne peut avoir lieu que si le lecteur opère à partir et avec des informations dégradées. S'il se cantonne au traitement des trois ou quatre lettres nettes, il s'oblige à ne traiter qu'un seul type d'information, celui issu du décodage grapho-phonologique. On pourrait donc dire que la vision floue, la vision parafovéale, est le véritable lieu de l'interaction. Si on accepte cette hypothèse, il faut envisager d'étudier plus finement les mécanismes cérébraux à l'œuvre dans cette interaction. C'est là un objet d'étude pour la psychologie cognitive, si tant est qu'elle réexamine le postulat d'un mot par point de fixation de l'œil, postulat qui me semble appelé à évoluer rapidement. Enfin, si les compétences techniques de lecture sont ce qu'elles semblent être ici, la question pédagogique se pose évidemment de savoir comment aider leur développement. Il n'est pas possible dans le cadre de ce diplôme d'aborder cette question même si elle peut éclairer le problème central. Toutefois, il est aujourd'hui assuré à travers l'ensemble des résultats de la cohorte sur laquelle j'ai travaillé que les options pédagogiques dans le cycle 2 ont des effets significatifs sur la performance de lecture des élèves à la fin du CM2 et notamment à travers la variation de leurs compétences techniques et, plus précisément, du moment d'apparition de ces compétences. Il semble donc qu'une approche simultanée des relations entre compétences techniques et performances de lecture, d'une part, et des conditions pédagogiques qui rendent possibles leur développement, d'autre part, puisse constituer une piste de recherche féconde.

Bibliographie
Adams M. Models of word recognition. Cognitive Psychology, 11 : 133-179, 1979. Adams MJ. Starr BJ. Les modèles de lecture. Bulletin de psychologie, 356 : 696-704, 1982. Alegria J. Mécanismes spécifiques de la lecture : l'identification des mots écrits. In : Les Entretiens Nathan, Actes I, Nathan, 51-67, 1991 Berchadsky J. Interaction. Les actes de lecture, 42 : 60-67, 1993. Berthoz A, Petit L. Les mouvements du regard : une affaire de saccades. La recherche, 289 : 58-65, 1996. Berthoz A. Le sens du mouvement, Paris, Odile Jacob, 1997. Carpenter PA, Just MA. What your eyes do while your mind is reading. (pp 275-307), In : Rayner K. Ed, Eye movements in reading : perceptual and language processes, New-York, 1983. Damasio AR . L'erreur de Descartes, Paris, Odile Jacob, 1995. Denhiere G, Baudet S. Lecture, compréhension de texte et sciences cognitives, Paris, PUF, 1992. Dopkins S, Morris RK, Rayner K. Lexical ambiguity and eye fixations in reading : a test of competing models of lexical ambiguity resolution. Journal of memory and language, 31 : 461-476, 1992. Dubois D, Aubret J. Stratégies syntaxiques et compréhension de la langue écrite, Langue Française, 80 : 51-61, 1988. Everatt J, Underwood G. Individual differences in reading subprocesses : relationships between reading ability, lexical access, and eye movement control. Language and speech, 37 : 283-297, 1994. Fayol M. La compréhension lors de la lecture : un bilan provisoire et quelques questions. In : P.Lecocq (Ed.) La lecture. Processus, apprentissage, troubles. Presses universitaires de Lille, 1992. Fayol M, Gombert JE, Lecocq P, Sprenger-Charolles L, Zagar D. Psychologie cognitive de la lecture, Paris, PUF, 1992. Fodor J. La modularité de l'esprit. Ed Minuit 1986 (Modularity of mind, Cambridge MIT Press, 1983) Foucambert D, Foucambert J. Empans et silhouettes, Les actes de lecture, 49 : 84-110, 1995. Foucambert D. La conception d'un logiciel d'analyse de textes. Memoire de DHEPS, Sorbonne nouvelle, Paris 3, 1994 Foucambert J. La manière d'être lecteur. Paris, OCDL, 1976. Foucambert J, Chenouf Y, Violet M. La lecture dans le cycle des 5-8 ans. Rapport de recherche INRP, 1994. Frith U. A developmental framework for developmental dyslexia, Annals of Dyslexia, 69-81, 1986. Goigoux R. L'apprentissage initial de la lecture. De la didactique à la psychologie cognitive (étude longitudinale). Thèse d'état, Université Paris V, 1993. Gombert JE. Les activités cognitives en œuvre dans la lecture et son acquisition, In : Andrieux F, Besse JM, Falaize B. Illétrisme : Quels chemins vers l'écrit (pp 129-144), Magnard, 1996. Goodman KS. Reading : a psycholinguistic guessing game. Journal of the Reading Specialist, 6 : 126-135, 1967. Goody J. La raison graphique : la domestication de la pensée sauvage. (trad 1979), Paris, Minuit, 1979. Hyönä J. Do irregular letter combinations attract readers' attention ? Evidence from fixation location in words. Journal of experimental psychology : human perception and performance, 21 : 68-81, 1995. Hyönä J, Olson RK Eye fixation patterns among dyslexic and normal readers : effects of word length and word frequency. Journal of experimental psychology : learning, memory and cognition, 21 : 1430-1440, 1995. Inhoff AW. Parafoveal word perception : a further case against semantice preprocessing. Journal of Experimental Psychology : Human Perception and Performance, 8 : 137-145, 1982. Inhoff AW. Lexical access during eye fixations in reading : are word access codes used to integrate lexical information accross interword fixations ? Journal of memory and language, 28 : 444-461, 1989. Inhoff AW, Rayner K. Parafoveal word processing during eye fixations in reading : effects of word frequency. Perception and psychophysics, 40 : 431-439, 1986. Inhoff AW, Topolski R, Vitu F, O'Regan JK. Attention demands during reading and the occurrence of brief (express) fixations. Perception and psychophysics, 54 : 814-823, 1993. Johnson-Laird PN. Mental Models : towards a cognitive science of langage, inference, and consciousness, Cambridge, Cambridge University Press, 1983. Legge GE. An ideal observer model of reading, ARVO, 1992. Legge GE, Klitz & Tjan . Mr. Chips: An Ideal-Observer Model of Reading. Psychological Review, 104 : 524-553, 1997. McClelland JL, Rumelhart DE. An interactive activation model of context effects in letter perception : I. An account of basic findings, psychological review p.88, 375-407, 1981. Morton J. Interaction of information in word recognition, Psychological Review, 76 : 165-178, 1969. O'Regan JK. Facteurs sensoriels et moteurs dans la lecture : la position optimal du regard. In : P.Lecocq (Ed.) La lecture. Processus, apprentissage, troubles. Presses universitaires de Lille, 1992. Paire-Ficout L. La phonologie est-elle un obstacle pour un sourd ?, In : Andrieux F, Besse JM, Falaize B. Illétrisme : Quels chemins vers l'écrit (pp 164-171), Magnard, 1996. Perfetti CA, Lescold AM. Coding and comprehsnion in skilled reading and implication for instruction, In : LB Resnick and P Weaver (Eds), Theory and practice of early reading (Vol 1), Hillsdale NJ, Lawrence Erlbaum Ass. 1979. Philippeau G. Comment interpréter les résultats d'une analyse en composantes principales ?, ITCF, 1986 Posner MI, Abdullaev YG. Dévoiler la dynamique de la lecture. La recherche, 289 : 66-69, 1996. Rayner K, Pollatsek A. The psychology of Reading. Unglued Cliffs, NJ : Prentice-Hall, 1989. Rémond M. Pourquoi certains enfants ne comprennent-ils pas ce qu'ils lisent ? In : CRESAS N°10. L'enfant apprenti lecteur : l'entrée dans le système écrit (pp133-150), INRP L'Harmattan, 1993. Rosenfield I. La conscience, une biologie du moi. Eshel, 1991. Schuberth RE, Eimas PD, Effects of context on the classification of words and nonwords, Journal of Experimental Psychology : Human Perception and Performance, 3 : 27-36, 1977. Sereno SC, Rayner K. Fast priming during eye fixation in reading, Journal of experimental psychology : Human Perception and Performance, 18 : 173-184, 1992. Sinatra GM. Convergence of listening and reading processing, Reading Research Quarterly, 25 : 116-130, 1990. Sprenger-Charolles L. L'évolution des mécanismes d'identification des mots. In : Fayol M, Gombert JE, Lecocq P, Sprenger-Charolles L, Zagar D. (Eds.), Psychologie cognitive de la lecture. PUF, Paris, 1992. Stanovich KE. Attentional and automatic context effects in reading, In : Lesgold AM, PerfettiCA (Eds), Interactive Process in Reading, Hillsdale, Erlbaum, 241-267, 1981. Taft M, Forster KI. Lexical storage and retrieval of polymorphemic and polysyllabic words. Journal of Verbal Learning and Verbal Behavior, 15 : 607-620, 1976. Trueswell JC, Tanenhaus MK, Garnsey SM. Semantic influences on parsing : use of thematic role information in syntactic ambiguity resolution. Journal of memory and language, 33 : 285-318, 1994. Verspieren MR. Recherche-action de type stratégique et science(s) de l'éducation. Contradiction/L'Harmatan, 1990. Vitu F, O'Regan JK, Mittau M. Optimal landing position in reading isolated words and continuous text. Perception and psychophysics, 47 : 583-600, 1990. Zeki S. Les images visuelles. Pour la science, 181 : 60-68, 1992.