| Si l'on part du niveau le plus fin, on
trouve d'abord les MOTS (les linguistes parlent de morphème
pour désigner l'élément signifiant
le plus fin).
Les MOTS ou EXPRESSIONS (ensemble de mots inséparables,
tels que : "président de la République")
constituent le LEXIQUE.
On verra bientôt les surprises que nous réserve l'analyse lexicale.
Puis, les mots sont regroupés
en THEMES. Il existe mille façons de définir
un thème. On peut dire que le thème regroupe
un ensemble de mots, plus ou moins synonymes.
En linguistique, on remarquera que les mots d'un même
thème peuvent se retrouver dans le même
contexte syntaxique.
Par exemple, tous les termes formant le thème
"animaux de la ferme", pourront se trouver
au même endroit des phrases : "La fermière
donne à manger... (au coq, au lapin, à
la poule...)"
Regrouper les mots en thèmes,
est un choix humain, toujours un peu subjectif, toujours
un peu arbitraire.
Pour notre part, nous avons trouvé un moyen pour
créer des thèmes de façon objective,
bien que cette méthode soit assez complexe et
longue.
Les mots ou les thèmes n'ont de
sens qu'une fois assemblés au sein de phrases
concrètes.
Avec un lexique de 800 mots, regroupés en une
centaine de thèmes, on peut, théoriquement,
construire des millions de phrases possibles. En pratique,
les lois de la grammaire, ainsi que les contraintes
contextuelles, font que les phrases-clés ne se
comptent que par centaines.
L'analyse syntaxique
donne ce qu'on appelle les co-occurences de mots et
de thèmes, soit les mots ou thèmes qui
ont l'habitude de se trouver dans les mêmes phrases.
Ces co-occurrences sont souvent représentés
par des graphes syntaxiques,
vrais résumés du discours des personnes
interrogées.
|