Projet

Général

Profil

Actions

Fonctionnalité #32636

fermé

Analyse : POC Remplacement partiel de la librairie Unoconv par LibreOffice

Ajouté par Jean-Laurent DUZANT il y a environ un mois. Mis à jour il y a 15 jours.

Statut:
R&D - Terminé
Priorité:
2-Sérieux
Assigné à:
Version cible:
Début:
25/02/2025
Echéance:

Description

Suite à l'analyse #32540, je propose de remplacer progressivement la librairie Unoconv par LibreOffice pour la conversion des documents en PDF.

## Proposition

Afin d'éviter tout breaking change ou erreurs potentielles non encore identifiées, nous procéderons par étapes :

1. **Ajout d’un paramètre technique** :  
   Un paramètre sera intégré dans la configuration JSON pour activer l’utilisation de LibreOffice lors des conversions.

2. **Transition progressive** :  
   Dans un premier temps, LibreOffice sera utilisé en parallèle d'Unoconv, selon la configuration choisie.

3. **Migration complète** :  
   Pour la version majeure **25.0.0** (ticket à créer), Unoconv sera complètement retiré au profit de LibreOffice.

Passer de UnoConv => LibreOffice
Analyser impacts techniques, impacts sur le rendu PDF
Réaliser des tests de charge


Fichiers

convertDocxToPdf.sh.txt (3,16 ko) convertDocxToPdf.sh.txt Script SHELL Nicolas COUTURE, 06/03/2025 15:05
TempsMoyenConversion.png (64,6 ko) TempsMoyenConversion.png Temps moyen de conversion Nicolas COUTURE, 06/03/2025 15:41
UtilisationRAMMoyenne.png (68,2 ko) UtilisationRAMMoyenne.png Utilisation moyenne de la RAM Nicolas COUTURE, 06/03/2025 15:41
TempsDeConversionPoids.png (117 ko) TempsDeConversionPoids.png Temps de conversion selon le poids du fichier Nicolas COUTURE, 06/03/2025 15:41
TempsDeConversionPages.png (116 ko) TempsDeConversionPages.png Temps de conversion selon le nombre de pages Nicolas COUTURE, 06/03/2025 15:42
UtilisationRAMPages.png (116 ko) UtilisationRAMPages.png Utilisation de la RAM selon le nombre de pages Nicolas COUTURE, 06/03/2025 15:43
soffice - SFD - MWS Express - Back.pdf (152 ko) soffice - SFD - MWS Express - Back.pdf Fichier résultat soffice Nicolas COUTURE, 06/03/2025 16:55
SFD - MWS Express - Back.docx (231 ko) SFD - MWS Express - Back.docx Fichier originel DOCX Nicolas COUTURE, 06/03/2025 16:55
unoconv - SFD - MWS Express - Back.pdf (155 ko) unoconv - SFD - MWS Express - Back.pdf Fichier résultat unoconv Nicolas COUTURE, 06/03/2025 16:55

Demandes liées 2 (0 ouverte2 fermées)

Lié à Backlog Courrier - Fonctionnalité #32540: Analyse - Changement de librairie UNOCONVR&D - TerminéJean-Laurent DUZANT18/02/2025Actions
Copié vers Backlog Courrier - Fonctionnalité #32873: Remplacement alternatif de la librairie Unoconv par LibreOfficeR&D - TerminéJean-Laurent DUZANT17/03/2025Actions

Mis à jour par Jean-Laurent DUZANT il y a environ un mois

Mis à jour par Agnes GASTAMBIDE il y a environ un mois

  • Statut changé de A traiter à R&D - A étudier
  • Assigné à Agnes GASTAMBIDE supprimé

Mis à jour par Agnes GASTAMBIDE il y a 29 jours

  • Sujet changé de Remplacement partiel de la librairie Unoconv par LibreOffice à Analyse : Remplacement partiel de la librairie Unoconv par LibreOffice
  • Description mis à jour (diff)

Mis à jour par Agnes GASTAMBIDE il y a 29 jours

  • Statut changé de R&D - A étudier à R&D - A planifier

Mis à jour par Agnes GASTAMBIDE il y a 28 jours

  • Sujet changé de Analyse : Remplacement partiel de la librairie Unoconv par LibreOffice à Analyse : POC Remplacement partiel de la librairie Unoconv par LibreOffice
  • Statut changé de R&D - A planifier à R&D - En cours

Mis à jour par Nicolas COUTURE il y a 27 jours

  • Assigné à mis à Nicolas COUTURE

Mis à jour par Nicolas COUTURE il y a 26 jours

  • Tracker changé de Fonctionnalité à Action

Mis à jour par Nicolas COUTURE il y a 26 jours · Edité

Afin d'effectuer une analyse métrique des impacts des deux méthodes de conversion (unoconv et soffice), un script shell a été créé (partagé en PJ au format txt) pour récupérer traiter des données en masse et récupérer les performances

Jeu de données : 92 fichiers DOCX de taille variable
1 coeur utilisé pour la ligne de commande de conversion

METRIQUES :

  • Temps d'exécution total : 200s pour unoconv, 142s pour soffice
  • Le temps moyen par fichier est significativement meilleur avec soffice par rapport à unoconv
  • Unoconv semble utiliser légèrement plus de RAM en moyenne que soffice, surtout sur les plus gros fichiers tandis que soffice parait plus stable sur cet aspect

Vous pouvez retrouver les graphiques détaillés de comparaison dans les PJ

ANALYSE DE FIDELITE
Petite comparaison par échantillonnage effectuée manuellement

  • Sur des courriers de type courriers simples, aucune différence notable
  • Sur certains dossiers de plusieurs pages avec table des matières : problème de fidélité à mon sens du côté d'unoconv !. Sur plusieurs exemples comparés, il semblerait que la table des matières soit recalculée. Ci-joint un exemple de fichier PDF générés avec soffice, un avec unoconv ainsi que le fichier docx originel

Mis à jour par Nicolas COUTURE il y a 26 jours

  • Statut changé de R&D - En cours à R&D - En test

Mis à jour par Agnes GASTAMBIDE il y a 15 jours

  • Tracker changé de Action à Fonctionnalité
  • Version cible mis à 24.4

Mis à jour par Agnes GASTAMBIDE il y a 15 jours

Mis à jour par Jean-Laurent DUZANT il y a 15 jours

  • Statut changé de R&D - En test à R&D - Terminé

Analyse OK

Actions

Formats disponibles : Atom PDF