Projet

Général

Profil

Actions

Anomalie #32261

ouvert

[FullText] Mauvaise tokenization lors de la recherche

Ajouté par Jérôme BOUCHER il y a 8 jours.

Statut:
A qualifier
Priorité:
2-Sérieux
Assigné à:
Version cible:
Début:
28/01/2025
Echéance:
Tags RM:

Description

Anomalie relevée par Kanonik

Nous avons constaté une anomalie lors de la recherche de documents via l'API et via l'interface web.
Dans certains cas, les documents recherchés ne remontent pas à cause d'une incohérence dans la requête SQL adressée à postgres ici : https://labs.maarch.org/maarch/maarchRM/-/blob/master/src/bundle/recordsManagement/Controller/description.php?ref_type=heads#L262

En effet, la requête n'utilise que partiellement la locale "french" (pour le to_tsvector, mais pas pour le plainto_tsquery), ce qui peut aboutir à une tokenization erronée et donc l'incapacité de trouver le mot recherché.

Pour info, nous corrigeons ce problème via une micro-modif de code au moment de notre déploiement :
sed -i -e "s/plainto_tsquery(/plainto_tsquery('french'::regconfig, /" laabs/src/bundle/recordsManagement/Controller/description.php

Aucune donnée à afficher

Actions

Formats disponibles : Atom PDF