samedi 5 avril 2008

Un moteur de recherche pour corpus de textes

Il existe un moteur de recherche libre de droit que l'on peut implémenter dans des corpus numérisés et mis à disposition en format XML selon les préceptes de la "Text Encoding Initiative" (TEI). Il s'agit de PhiloLogic, développé dans le cadre des projets ARTFL Project et Digital Library Development Center (DLDC) (Université de Chicago).
Désormais, il est possible de faire des recherches grâce à cet engin dans le corpus de textes antiques ou consacrés à l'Antiquité de Perseus. Quelques rapides tests montrent que les résultats d'une recherche sont présentés de plusieurs manières très utilisables. On peut voir les extraits, mais aussi chaque résultat sur une ligne, avec un bref contexte et la référence de la citation, ou encore la liste des oeuvres. Cela permet à l'utilisateur soit de trouver des références précises, soit de savoir vers quels textes s'orienter pour traiter de telle ou telle problématique.

http://www.lib.uchicago.edu/efts/PERSEUS/


Perseus:

http://www.perseus.tufts.edu/

Aucun commentaire: