Projet

Général

Profil

Fonctionnalité #15958

Mis à jour par Cyril VAZQUEZ il y a environ 3 ans

En tant que service producteur, je veux indexer le contenu texte des documents archivés afin de pouvoir les rechercher sur l'intégralité des termes.

**Détail**
La fonction d'indexation fulltext a été intégrée intégré en V1 en utilisant un moteur externe Lucene PHP.
Cette implémentation pose plusieurs problèmes : performances, scalabilité car il utilise des fichiers à plat non chargés en mémoire

La stratégie proposée est d'utiliser les capacités d'indexation de PostGreSQL et le moteur actuellement utilisé pour les métadonnées.

Il faut pouvoir mettre à jour le texte dans le référentiel à partir du texte transmis au versement, en plus des métadonnées descriptives déjà indexées, et assurer une recherche performante et fiable.

*note: l'extraction du texte des documents lorsque celui-ci n'est pas transmis, par une procédure appliquée au versement ou lors de la conservation, fait l'objet d'une autre demande*

Retour