|

|
Classer, organiser, trier...
|
|
Nous avons vu à quel point il
est difficile d'échapper à la subjectivité
quand il s'agit de créer la thématique
d'un ensemble de textes.
Une fois la décision prise, au cours de la première
vague d'étude, ANACIP Expert n'a aucune difficulté
à classer les mots et expressions qu'il connaît
déjà.
Mais, un certain nombre de difficultés
se présente à lui, à chaque instant.
Par exemple :
* Certains concepts sont exprimés à l'aide
de phrases entières dans lesquelles les mots
habituels pour exprimer ce concept peuvent être
absents (voir la première citation ci-contre)
;
* Certains thèmes possèdent des centaines
de façons de se manifester au niveau des mots.
Et, à chaque coin de phrase, se trouve une nouvelle
façon d'exprimer ce thème (voir la seconde
citation) ;
* Enfin, se trouve le problème des "homonymes"
et l'on doit donner au logiciel des règles de
reconnaissance si l'on veut qu'il travaille correctement.
(Voir la troisième citation)
|
|
Citations |
Soit
une étude dans laquelle figure le thème
"timide". La boîte thématique contient
déjà toutes les variantes de ce thème
: timide, timoré, réservé...
Mais, dans un premier temps le logiciel ne voit pas arriver
le thème dans la phrase suivante : "J'ai
vu l'autre jour Eric rougir en demandant son chemin à
une jolie fille". |
|
|
| Il
existe des centaines de façons de se dire satisfait
: je suis content, ça va, pas de problèmes...
Ces expressions appartiennent à la langue parlée,
et chaque interlocuteur peut à tout moment en inventer
une. |
|
Dans
une étude médicale le mot "association"
peut signifier deux concepts totalement différents
: ce produit est une "association" de deux molécules,
ou je donne ce produit en "association" avec
un autre.
Seul le contexte (présence et absence d'autres
mots désignés) permettra au logiciel de
trancher. Dans le doute, il s'abstiendra. |
|
|
| |
|
Bibliographie
|
| |
|