Anomalie #19713
fermé[FullText Tika] Blocage du process si impossible d'extraire le fulltext d'un document
Description
Exemple Ardian :
Une des ressources est un fichier pdf qui est protégé par mot de passe. Étant donné qu'il est impossible de passer ce mot de passe à tika car inconnu, Tika renvoi une erreur comme quoi le fullText n'a pas pu être extrait.
Le problème c'est que cette erreur lève une exception ligne 96 du fichier /dependency/fileSystem/plugins/Tika.php et arrête donc le process d'extraction du full text pour les ressources suivantes et ne met pas à jour le statut de cette ressource.
Lors de la prochaine exécution de l'extraction, cette ressource sera en premier dans la liste des ressources dont le fullText est à extraire et générera toujours une erreur et donc un blocage de la tâche indéfiniment.
Mesure corrective :
Ne plus lever une exception en cas d'impossibilité d'extraction de texte d'une ressource et changer le statut de la ressource pour ne plus la sélectionner lors de la prochaine mise en lot des ressources à extraire.
Mis à jour par Cyril VAZQUEZ il y a presque 3 ans
- Statut changé de A traiter à R&D - A planifier
Mis à jour par Cyril VAZQUEZ il y a presque 3 ans
- Description mis à jour (diff)
- Assigné à changé de Cyril VAZQUEZ à Charlotte Bataille
Mis à jour par Charlotte Bataille il y a presque 3 ans
- Statut changé de R&D - A planifier à R&D - En cours
Mis à jour par Charlotte Bataille il y a plus de 2 ans
- Statut changé de R&D - En cours à R&D - En test
Branche à tester : fix/19713_fulltext_extraction_error
Mis à jour par Arnaud PAUGET il y a plus de 2 ans
- Statut changé de R&D - En test à A livrer
- Tags RM 2.8.2 ajouté
Correctif ajouté dans la fonction du batch d'extraction fulltexte également.
Mis à jour par Cyril VAZQUEZ il y a plus de 2 ans
- Statut changé de A livrer à Clôturé
- Assigné à
Charlotte Bataillesupprimé