Project

General

Profile

Fonctionnalité #15958

[Fulltext] Indexation et recherche fulltext

Added by Cyril VAZQUEZ almost 2 years ago. Updated over 1 year ago.

Status:
Développé / Analysé (S)
Priority:
2-Sérieux
Assignee:
-
Target version:
Start date:
01/18/2021
Due date:
Tags RM:
2.8.0

Description

En tant que service producteur, je veux indexer le contenu texte des documents archivés afin de pouvoir les rechercher sur l'intégralité des termes.

Détail
La fonction d'indexation fulltext a été intégrée en V1 en utilisant un moteur externe Lucene PHP.
Cette implémentation pose plusieurs problèmes : performances, scalabilité car il utilise des fichiers à plat non chargés en mémoire

La stratégie proposée est d'utiliser les capacités d'indexation de PostGreSQL et le moteur actuellement utilisé pour les métadonnées.

Il faut pouvoir mettre à jour le texte dans le référentiel à partir du texte transmis au versement, en plus des métadonnées descriptives déjà indexées, et assurer une recherche performante et fiable.

note: l'extraction du texte des documents lorsque celui-ci n'est pas transmis, par une procédure appliquée au versement ou lors de la conservation, fait l'objet d'une autre demande

Back-end
Lors du versement, le contrôleur de description reçoit l'archive à enregistrer, et réalise les opération suivantes :
- initialisation d'une propriété "text" pour l'objet description
- ajout de l'archiveName, originatorArchiveId, originatingDate et des métadonnées du profil au contenu fulltext à indexer
- enregistrement de la description
Il faut pouvoir recevoir un contenu "text" pour le texte à indexer en plus des métadonnées

Lors de la recherche... la fonction de recherche utilise déjà l'indexation fulltext sur cette propriété.

Lors de la mise à jour des métadonnées, il faut pouvoir réindexer avec les nouvelles valeurs de métadonnées, sans modifier le contenu texte issu de la ressource

History

#1 Updated by Cyril VAZQUEZ almost 2 years ago

  • Target version changed from 2.7 to 2.8

#2 Updated by Cyril VAZQUEZ over 1 year ago

  • Description updated (diff)
  • Itération deleted (210201)

#3 Updated by Cyril VAZQUEZ over 1 year ago

  • Description updated (diff)

#4 Updated by Cyril VAZQUEZ over 1 year ago

  • Description updated (diff)

#5 Updated by Arnaud PAUGET over 1 year ago

  • Target version changed from 2.8 to 2.8.0

#6 Updated by Jérôme BOUCHER over 1 year ago

  • Status changed from A traiter to A tester (S)

Voir ticket #16693

#7 Updated by Alexandre GOLDSTEIN over 1 year ago

  • Status changed from A tester (S) to A livrer

#8 Updated by Emmanuel DILLARD over 1 year ago

  • Project changed from Maarch RM - Product Backlog to Backlog RM
  • Target version changed from 2.8.0 to 2.8
  • Fonction deleted (Métadonnées)
  • Tags RM 2.8.0 added

#9 Updated by Emmanuel DILLARD over 1 year ago

  • Status changed from A livrer to Développé / Analysé (S)

Also available in: Atom PDF