Anomalie #32261
ouvert[FullText] Mauvaise tokenization lors de la recherche
Description
Anomalie relevée par Kanonik
Nous avons constaté une anomalie lors de la recherche de documents via l'API et via l'interface web.
Dans certains cas, les documents recherchés ne remontent pas à cause d'une incohérence dans la requête SQL adressée à postgres ici : https://labs.maarch.org/maarch/maarchRM/-/blob/master/src/bundle/recordsManagement/Controller/description.php?ref_type=heads#L262
En effet, la requête n'utilise que partiellement la locale "french" (pour le to_tsvector, mais pas pour le plainto_tsquery), ce qui peut aboutir à une tokenization erronée et donc l'incapacité de trouver le mot recherché.
Pour info, nous corrigeons ce problème via une micro-modif de code au moment de notre déploiement :
sed -i -e "s/plainto_tsquery(/plainto_tsquery('french'::regconfig, /" laabs/src/bundle/recordsManagement/Controller/description.php
Aucune donnée à afficher