Project

General

Profile

Fonctionnalité #15958

[Fulltext] Indexation et recherche fulltext

Added by Cyril VAZQUEZ about 2 months ago. Updated 6 days ago.

Status:
A traiter
Priority:
2-Sérieux
Assignee:
-
Target version:
Start date:
01/18/2021
Due date:
Itération:
Extension/Module:
Fonction:
Métadonnées
SCRUM - Valeur:
3 - Must

Description

En tant que service producteur, je veux indexer le contenu texte des documents archivés afin de pouvoir les rechercher sur l'intégralité des termes.

Détail
La fonction d'indexation fulltext a été intégré en V1 en utilisant un moteur externe Lucene PHP.
Cette implémentation pose plusieurs problèmes : performances, scalabilité car il utilise des fichiers à plat non chargés en mémoire

La stratégie proposée est d'utiliser les capacités d'indexation de PostGreSQL et le moteur actuellement utilisé pour les métadonnées.

Il faut pouvoir mettre à jour le texte dans le référentiel à partir du texte transmis au versement, en plus des métadonnées descriptives déjà indexées, et assurer une recherche performante et fiable.

note: l'extraction du texte des documents lorsque celui-ci n'est pas transmis, par une procédure appliquée au versement ou lors de la conservation, fait l'objet d'une autre demande

History

#1 Updated by Cyril VAZQUEZ 14 days ago

  • Target version changed from 2.7 to 2.8

#2 Updated by Cyril VAZQUEZ 6 days ago

  • Description updated (diff)
  • Itération deleted (210201)

Also available in: Atom PDF