CGR IA
CGR International
mission menée chez IOD Solutions
Extraction LLM de données techniques pour la cotation industrielle
LLM VisionFull-stackÉvaluationProduction
85–96 %
précision mesurée
UE
données résidentes
288
nuances matériaux
Problème
Automatiser la cotation industrielle en extrayant les données techniques (dimensions, charges, tolérances, matériaux) depuis des documents très hétérogènes, pour alimenter le calculateur métier « E8 » sans ressaisie manuelle.
Contrainte
Documents de formats variés, données devant rester en Union Européenne, matériaux exprimés en texte libre à normaliser, et exigence d’une précision mesurable champ par champ.
Approche
- Pipeline d’extraction en production avec un LLM de vision (Gemini, choisi pour la résidence des données en UE et sa lecture de plans).
- Sorties structurées et typées (Pydantic), schéma de données versionné, ingénierie de prompt itérative.
- Fiabilisé l’extraction par un matching flou (rapidfuzz) d’un matériau texte-libre contre un catalogue de 288 nuances client, et une conversion d’unités physiques (métrique ↔ impérial).
- Système d’évaluation mesurant objectivement la précision champ par champ (moteur de comparaison maison puis Langfuse).
Résultat
- Précision d’extraction mesurée de 85 à 96 % selon les documents.
- Application full-stack livrée : FastAPI / SQLAlchemy async / PostgreSQL, React 19 / TanStack / Tailwind, conteneurisée (Docker, Dokploy), auth Clerk, stockage S3 (déduplication SHA-256), observabilité Logfire.
Stack
GeminiPostgreSQLFastAPIReact 19LangfuseLogfireDocker
Projet suivant
ODERIS · Classification IA de slides à l’échelle pour la due diligence