Capturer et classer
Réception scanner, dépôt fichier, e-mail, upload ou API. Séparation des liasses et identification des natures de documents.
Open-Capture · IA et capture documentaire
Open-Capture est la solution 100 % open source, full web, pour numériser, classer, extraire et contrôler vos documents (courriers, factures, contrats, pièces jointes…). Combinez OCR Tesseract, règles, apprentissage automatique et modèles IA pour réduire la saisie manuelle et fiabiliser vos flux vers la GED et les applications métiers.
Pour les équipes IT et métiers
Ce site met l'accent sur les traitements intelligents d'Open-Capture. Pour la fiche produit complète, les modules et les ressources, le site de référence reste open-capture.com.
Édité par Edissyum, Open-Capture répond aux besoins de liberté et d'innovation du marché : vous maîtrisez l'hébergement (souvent on premise sur Linux), vous branchez vos scanners, boîtes mail, dossiers et API, puis vous industrialisez la reconnaissance de types de documents et l'extraction de champs.
La combinaison règles + apprentissage + modèles IA permet d'adapter le niveau d'automatisation à la qualité de vos images et à la diversité de vos flux, sans vous enfermer dans un éditeur propriétaire.
Code source : dépôt GitHub
Forum communautaire pour l'entraide et le partage : communaute.edissyum.com
De l'entrée documentaire à l'export
Quatre étapes structurantes, alignées sur la façon dont Open-Capture organise les flux en production.
Réception scanner, dépôt fichier, e-mail, upload ou API. Séparation des liasses et identification des natures de documents.
OCR, zones d'intérêt, règles, apprentissage, lecture de QR code ou appel à un modèle IA pour remonter champs et métadonnées.
Vidéo-codage : vérifier, corriger, rapprocher (ex. commande et bon de livraison), sécuriser la qualité avant intégration.
Images et données vers la GED, l'ECM ou les logiciels métiers (comptabilité, facturation, courrier…).
IA au sens large, maîtrisée
Pas de « boîte noire » unique : vous combinez des briques complémentaires selon vos documents et votre gouvernance.
L'apprentissage automatique aide à reconnaître les types de pièces et à préparer des lots propres pour l'indexation et l'IDR.
Sur les champs complexes ou variables, les modèles pré-entraînés et les approches hybrides complètent Tesseract et les expressions régulières.
Développé en Python, client web léger, architecture ouverte : l'IA s'inscrit dans un SI que vous contrôlez, y compris hors cloud public.
De l'entrée documentaire à l'export : briques complémentaires (règles, ML, modèles) pour automatiser sans perdre le contrôle sur vos flux.
Entrées scanner, dépôt, e-mail, upload ou API. Séparation des liasses, détection des types de pièces et préparation des lots pour l'IDR.
OCR Tesseract, expressions régulières, apprentissage, QR codes et modèles pré-entraînés pour remonter champs et métadonnées là où vos documents sont exigeants.
Valider, corriger et enrichir avant intégration. Rapprochements métier possibles (par exemple commande d'achat et bon de livraison).
Images, PDF et données structurées vers la GED, l'ECM ou les logiciels métiers (comptabilité, facturation, workflows internes).
Splitter, Verifier, MailCollect, connecteur MEM Courrier : chaînes dédiées au scan de masse, à la qualification et au traitement des messages.
Avec MEM Courrier, une même logique de qualification pour les flux physiques et les boîtes mail, pièces jointes comprises.
Aller plus loin
Des extensions prêtes à l'emploi pour cadrer un canal (courrier, mail, scan de masse) ou une brique logicielle (MEM Courrier, qualification…).
Vue d'ensemble IDP, acquisition, extraction, connecteurs et déploiement décrits sur le site officiel.
Voir les fonctionnalités détailléesConnecteur pour la gestion de courrier : métadonnées et qualification côté opérateur.
Fiche du moduleAcquisition intelligente des messages : contenu, expéditeur, pièces jointes intégrées au flux.
Fiche du moduleFormulaires de contrôle et workflows IDR pour documents semi-structurés (règles, lasso, cohérence).
Fiche du modulePréparation des lots de scan : métadonnées de batch, réorganisation, classification ML.
Fiche du moduleUn espace est prévu sur communaute.edissyum.com pour échanger entre utilisateurs, poser des questions techniques, partager des retours d'expérience et faire vivre la connaissance autour d'Open-Capture et de l'écosystème Edissyum.
Ils utilisent Open-Capture
Quelques déploiements mis en avant sur open-capture.com, puis l'équipe qui édite et intègre la solution.
Organisation équipée des logiciels et modules Open-Capture.
Projet public avec solution adaptée aux services.
PME accompagnée par l'équipe Edissyum.
Open-Capture est développé et maintenu par Edissyum (environ 25 collaborateurs, spécialistes GED, capture et dématérialisation, basés en France). L'éditeur assure intégration, formation, support et projets sur mesure autour de la plateforme.
La brochure PDF résume l'offre, les modules et les cas d'usage : idéale pour une diffusion interne (DSI, métiers, achats) avant un échange avec un expert.
Questions fréquentes
Formulations utiles pour le référencement naturel et pour cadrer vos échanges avec les équipes.
C'est un logiciel open source de capture documentaire et d'IDR (intelligent document recognition) : acquisition, OCR, extraction de données, contrôle qualité et export vers vos outils.
Oui, la solution est publiée sous licence libre, sans limitation artificielle du nombre d'utilisateurs. Vous pouvez étudier le code, l'adapter et le faire auditer.
L'IA et le machine learning servent notamment à la classification des documents et à l'extraction de champs, en complément des règles et de l'OCR Tesseract.
L'architecture privilégie un déploiement on premise sur Linux, ce qui convient aux politiques de souveraineté et de contrôle des données.
Utilisez le formulaire de contact sur open-capture.com et sélectionnez « Démonstration » ou le sujet adapté à votre besoin.
Le forum sur communaute.edissyum.com est l'endroit prévu pour l'entraide entre pairs, les discussions techniques et le partage de bonnes pratiques. Il complète le dépôt GitHub pour le code et les tickets.
Réservez une démo ou écrivez aux équipes Edissyum depuis le site officiel Open-Capture.