Fonctionnalité #32636
fermé
Analyse : POC Remplacement partiel de la librairie Unoconv par LibreOffice
Ajouté par Jean-Laurent DUZANT il y a environ un mois.
Mis à jour il y a 16 jours.
Description
Suite à l'analyse #32540, je propose de remplacer progressivement la librairie Unoconv par LibreOffice pour la conversion des documents en PDF.
## Proposition
Afin d'éviter tout breaking change ou erreurs potentielles non encore identifiées, nous procéderons par étapes :
1. **Ajout d’un paramètre technique** :
Un paramètre sera intégré dans la configuration JSON pour activer l’utilisation de LibreOffice lors des conversions.
2. **Transition progressive** :
Dans un premier temps, LibreOffice sera utilisé en parallèle d'Unoconv, selon la configuration choisie.
3. **Migration complète** :
Pour la version majeure **25.0.0** (ticket à créer), Unoconv sera complètement retiré au profit de LibreOffice.
Passer de UnoConv => LibreOffice
Analyser impacts techniques, impacts sur le rendu PDF
Réaliser des tests de charge
Fichiers
convertDocxToPdf.sh.txt (3,16 ko)
convertDocxToPdf.sh.txt |
Script SHELL |
Nicolas COUTURE, 06/03/2025 15:05
|
|
TempsMoyenConversion.png (64,6 ko)
TempsMoyenConversion.png |
Temps moyen de conversion |
Nicolas COUTURE, 06/03/2025 15:41
|
|
UtilisationRAMMoyenne.png (68,2 ko)
UtilisationRAMMoyenne.png |
Utilisation moyenne de la RAM |
Nicolas COUTURE, 06/03/2025 15:41
|
|
TempsDeConversionPoids.png (117 ko)
TempsDeConversionPoids.png |
Temps de conversion selon le poids du fichier |
Nicolas COUTURE, 06/03/2025 15:41
|
|
TempsDeConversionPages.png (116 ko)
TempsDeConversionPages.png |
Temps de conversion selon le nombre de pages |
Nicolas COUTURE, 06/03/2025 15:42
|
|
UtilisationRAMPages.png (116 ko)
UtilisationRAMPages.png |
Utilisation de la RAM selon le nombre de pages |
Nicolas COUTURE, 06/03/2025 15:43
|
|
soffice - SFD - MWS Express - Back.pdf (152 ko)
soffice - SFD - MWS Express - Back.pdf |
Fichier résultat soffice |
Nicolas COUTURE, 06/03/2025 16:55
|
|
SFD - MWS Express - Back.docx (231 ko)
SFD - MWS Express - Back.docx |
Fichier originel DOCX |
Nicolas COUTURE, 06/03/2025 16:55
|
|
unoconv - SFD - MWS Express - Back.pdf (155 ko)
unoconv - SFD - MWS Express - Back.pdf |
Fichier résultat unoconv |
Nicolas COUTURE, 06/03/2025 16:55
|
|
- Statut changé de A traiter à R&D - A étudier
- Assigné à
Agnes GASTAMBIDE supprimé
- Sujet changé de Remplacement partiel de la librairie Unoconv par LibreOffice à Analyse : Remplacement partiel de la librairie Unoconv par LibreOffice
- Description mis à jour (diff)
- Statut changé de R&D - A étudier à R&D - A planifier
- Sujet changé de Analyse : Remplacement partiel de la librairie Unoconv par LibreOffice à Analyse : POC Remplacement partiel de la librairie Unoconv par LibreOffice
- Statut changé de R&D - A planifier à R&D - En cours
- Assigné à mis à Nicolas COUTURE
- Tracker changé de Fonctionnalité à Action
Afin d'effectuer une analyse métrique des impacts des deux méthodes de conversion (unoconv et soffice), un script shell a été créé (partagé en PJ au format txt) pour récupérer traiter des données en masse et récupérer les performances
Jeu de données : 92 fichiers DOCX de taille variable
1 coeur utilisé pour la ligne de commande de conversion
METRIQUES :
- Temps d'exécution total : 200s pour unoconv, 142s pour soffice
- Le temps moyen par fichier est significativement meilleur avec soffice par rapport à unoconv
- Unoconv semble utiliser légèrement plus de RAM en moyenne que soffice, surtout sur les plus gros fichiers tandis que soffice parait plus stable sur cet aspect
Vous pouvez retrouver les graphiques détaillés de comparaison dans les PJ
ANALYSE DE FIDELITE
Petite comparaison par échantillonnage effectuée manuellement
- Sur des courriers de type courriers simples, aucune différence notable
- Sur certains dossiers de plusieurs pages avec table des matières : problème de fidélité à mon sens du côté d'unoconv !. Sur plusieurs exemples comparés, il semblerait que la table des matières soit recalculée. Ci-joint un exemple de fichier PDF générés avec soffice, un avec unoconv ainsi que le fichier docx originel
- Statut changé de R&D - En cours à R&D - En test
- Tracker changé de Action à Fonctionnalité
- Version cible mis à 24.4
- Statut changé de R&D - En test à R&D - Terminé
Formats disponibles : Atom
PDF