Projet

Général

Profil

Anomalie #19713

[FullText Tika] Blocage du process si impossible d'extraire le fulltext d'un document

Ajouté par Arnaud PAUGET il y a environ 2 ans. Mis à jour il y a environ 2 ans.

Statut:
Clôturé
Priorité:
1-Majeur
Assigné à:
-
Version cible:
Début:
03/02/2022
Echéance:
Tags RM:
2.8.2

Description

Exemple Ardian :
Une des ressources est un fichier pdf qui est protégé par mot de passe. Étant donné qu'il est impossible de passer ce mot de passe à tika car inconnu, Tika renvoi une erreur comme quoi le fullText n'a pas pu être extrait.
Le problème c'est que cette erreur lève une exception ligne 96 du fichier /dependency/fileSystem/plugins/Tika.php et arrête donc le process d'extraction du full text pour les ressources suivantes et ne met pas à jour le statut de cette ressource.
Lors de la prochaine exécution de l'extraction, cette ressource sera en premier dans la liste des ressources dont le fullText est à extraire et générera toujours une erreur et donc un blocage de la tâche indéfiniment.

Mesure corrective :
Ne plus lever une exception en cas d'impossibilité d'extraction de texte d'une ressource et changer le statut de la ressource pour ne plus la sélectionner lors de la prochaine mise en lot des ressources à extraire.

Historique

#1 Mis à jour par Cyril VAZQUEZ il y a environ 2 ans

  • Tags RM 2.8.0 supprimé

#3 Mis à jour par Cyril VAZQUEZ il y a environ 2 ans

  • Statut changé de A traiter à R&D - A planifier

#4 Mis à jour par Cyril VAZQUEZ il y a environ 2 ans

  • Description mis à jour (diff)
  • Assigné à changé de Cyril VAZQUEZ à Charlotte Bataille

#5 Mis à jour par Charlotte Bataille il y a environ 2 ans

  • Statut changé de R&D - A planifier à R&D - En cours

#6 Mis à jour par Charlotte Bataille il y a environ 2 ans

  • Statut changé de R&D - En cours à R&D - En test

Branche à tester : fix/19713_fulltext_extraction_error

#7 Mis à jour par Arnaud PAUGET il y a environ 2 ans

  • Statut changé de R&D - En test à A livrer
  • Tags RM 2.8.2 ajouté

Correctif ajouté dans la fonction du batch d'extraction fulltexte également.

#8 Mis à jour par Cyril VAZQUEZ il y a environ 2 ans

  • Statut changé de A livrer à Clôturé
  • Assigné à Charlotte Bataille supprimé

Formats disponibles : Atom PDF