Actions
Fonctionnalité #32636
ferméAnalyse : POC Remplacement partiel de la librairie Unoconv par LibreOffice
Début:
25/02/2025
Echéance:
Description
Suite à l'analyse #32540, je propose de remplacer progressivement la librairie Unoconv par LibreOffice pour la conversion des documents en PDF.
## Proposition
Afin d'éviter tout breaking change ou erreurs potentielles non encore identifiées, nous procéderons par étapes :
1. **Ajout d’un paramètre technique** :
Un paramètre sera intégré dans la configuration JSON pour activer l’utilisation de LibreOffice lors des conversions.
2. **Transition progressive** :
Dans un premier temps, LibreOffice sera utilisé en parallèle d'Unoconv, selon la configuration choisie.
3. **Migration complète** :
Pour la version majeure **25.0.0** (ticket à créer), Unoconv sera complètement retiré au profit de LibreOffice.
Passer de UnoConv => LibreOffice
Analyser impacts techniques, impacts sur le rendu PDF
Réaliser des tests de charge
Fichiers
Actions
#1
Mis à jour par Jean-Laurent DUZANT il y a environ un mois
- Lié à Fonctionnalité #32540: Analyse - Changement de librairie UNOCONV ajouté
Actions
#2
Mis à jour par Agnes GASTAMBIDE il y a environ un mois
- Statut changé de A traiter à R&D - A étudier
- Assigné à
Agnes GASTAMBIDEsupprimé
Actions
#4
Mis à jour par Agnes GASTAMBIDE il y a 29 jours
- Sujet changé de Remplacement partiel de la librairie Unoconv par LibreOffice à Analyse : Remplacement partiel de la librairie Unoconv par LibreOffice
- Description mis à jour (diff)
Actions
#5
Mis à jour par Agnes GASTAMBIDE il y a 29 jours
- Statut changé de R&D - A étudier à R&D - A planifier
Actions
#7
Mis à jour par Agnes GASTAMBIDE il y a 28 jours
- Sujet changé de Analyse : Remplacement partiel de la librairie Unoconv par LibreOffice à Analyse : POC Remplacement partiel de la librairie Unoconv par LibreOffice
- Statut changé de R&D - A planifier à R&D - En cours
Mis à jour par Nicolas COUTURE il y a 26 jours · Edité
- Fichier convertDocxToPdf.sh.txt convertDocxToPdf.sh.txt ajouté
- Fichier TempsMoyenConversion.png TempsMoyenConversion.png ajouté
- Fichier UtilisationRAMMoyenne.png UtilisationRAMMoyenne.png ajouté
- Fichier TempsDeConversionPoids.png TempsDeConversionPoids.png ajouté
- Fichier TempsDeConversionPages.png TempsDeConversionPages.png ajouté
- Fichier UtilisationRAMPages.png UtilisationRAMPages.png ajouté
Afin d'effectuer une analyse métrique des impacts des deux méthodes de conversion (unoconv et soffice), un script shell a été créé (partagé en PJ au format txt) pour récupérer traiter des données en masse et récupérer les performances
Jeu de données : 92 fichiers DOCX de taille variable
1 coeur utilisé pour la ligne de commande de conversion
METRIQUES :
- Temps d'exécution total : 200s pour unoconv, 142s pour soffice
- Le temps moyen par fichier est significativement meilleur avec soffice par rapport à unoconv
- Unoconv semble utiliser légèrement plus de RAM en moyenne que soffice, surtout sur les plus gros fichiers tandis que soffice parait plus stable sur cet aspect
Vous pouvez retrouver les graphiques détaillés de comparaison dans les PJ
ANALYSE DE FIDELITE
Petite comparaison par échantillonnage effectuée manuellement
- Sur des courriers de type courriers simples, aucune différence notable
- Sur certains dossiers de plusieurs pages avec table des matières : problème de fidélité à mon sens du côté d'unoconv !. Sur plusieurs exemples comparés, il semblerait que la table des matières soit recalculée. Ci-joint un exemple de fichier PDF générés avec soffice, un avec unoconv ainsi que le fichier docx originel
Mis à jour par Nicolas COUTURE il y a 26 jours
Actions
#12
Mis à jour par Nicolas COUTURE il y a 26 jours
- Statut changé de R&D - En cours à R&D - En test
Actions
#15
Mis à jour par Agnes GASTAMBIDE il y a 15 jours
- Tracker changé de Action à Fonctionnalité
- Version cible mis à 24.4
Actions
#16
Mis à jour par Agnes GASTAMBIDE il y a 15 jours
- Copié vers Fonctionnalité #32873: Remplacement alternatif de la librairie Unoconv par LibreOffice ajouté
Actions
#17
Mis à jour par Jean-Laurent DUZANT il y a 15 jours
- Statut changé de R&D - En test à R&D - Terminé
Analyse OK
Actions