Open-Capture · IA et capture documentaire

L'IA au service de votre capture documentaire

Open-Capture est la solution 100 % open source, full web, pour numériser, classer, extraire et contrôler vos documents (courriers, factures, contrats, pièces jointes…). Combinez OCR Tesseract, règles, apprentissage automatique et modèles IA pour réduire la saisie manuelle et fiabiliser vos flux vers la GED et les applications métiers.

Déploiement on premise · APIs ouvertes · Utilisateurs illimités

  • Classification automatique
  • IDR et vidéo-codage
  • Python, client léger
  • Souveraineté des données
Schéma : capture des documents vers Open-Capture et vers la GED ou les applications métiers.

Indicateurs de diffusion

  • 90 000 +
    Téléchargements
  • 300 +
    Structures équipées
  • 2 M
    Documents traités par an
  • 100 %
    Open source

Pour les équipes IT et métiers

Une base produit unique, une couche IA explicite

Ce site met l'accent sur les traitements intelligents d'Open-Capture. Pour la fiche produit complète, les modules et les ressources, le site de référence reste open-capture.com.

Édité par Edissyum, Open-Capture répond aux besoins de liberté et d'innovation du marché : vous maîtrisez l'hébergement (souvent on premise sur Linux), vous branchez vos scanners, boîtes mail, dossiers et API, puis vous industrialisez la reconnaissance de types de documents et l'extraction de champs.

La combinaison règles + apprentissage + modèles IA permet d'adapter le niveau d'automatisation à la qualité de vos images et à la diversité de vos flux, sans vous enfermer dans un éditeur propriétaire.

  • IDR full web, unique sur le marché en open source intégral
  • OCR Tesseract, expressions régulières, ML, QR codes, modèles pré-entraînés
  • Vidéo-codage pour valider et enrichir avant export GED / métier
  • Modules : Splitter, Verifier, MailCollect, MEM Courrier…

Code source : dépôt GitHub

Forum communautaire pour l'entraide et le partage : communaute.edissyum.com

De l'entrée documentaire à l'export

Parcours clair, comme dans l'outil

Quatre étapes structurantes, alignées sur la façon dont Open-Capture organise les flux en production.

Capturer et classer

Réception scanner, dépôt fichier, e-mail, upload ou API. Séparation des liasses et identification des natures de documents.

Extraire

OCR, zones d'intérêt, règles, apprentissage, lecture de QR code ou appel à un modèle IA pour remonter champs et métadonnées.

Contrôler

Vidéo-codage : vérifier, corriger, rapprocher (ex. commande et bon de livraison), sécuriser la qualité avant intégration.

Exporter

Images et données vers la GED, l'ECM ou les logiciels métiers (comptabilité, facturation, courrier…).

IA au sens large, maîtrisée

Où l'intelligence artificielle intervient

Pas de « boîte noire » unique : vous combinez des briques complémentaires selon vos documents et votre gouvernance.

Classification

Tri et séparation assistés par ML

L'apprentissage automatique aide à reconnaître les types de pièces et à préparer des lots propres pour l'indexation et l'IDR.

Extraction

Modèles IA et règles métier

Sur les champs complexes ou variables, les modèles pré-entraînés et les approches hybrides complètent Tesseract et les expressions régulières.

Industrialisation

Stack sobre et intégrable

Développé en Python, client web léger, architecture ouverte : l'IA s'inscrit dans un SI que vous contrôlez, y compris hors cloud public.

Fonctionnalités propulsées à l'IA

De l'entrée documentaire à l'export : briques complémentaires (règles, ML, modèles) pour automatiser sans perdre le contrôle sur vos flux.

Acquisition et tri

Entrées scanner, dépôt, e-mail, upload ou API. Séparation des liasses, détection des types de pièces et préparation des lots pour l'IDR.

Extraction des données

OCR Tesseract, expressions régulières, apprentissage, QR codes et modèles pré-entraînés pour remonter champs et métadonnées là où vos documents sont exigeants.

Contrôle et vidéo-codage

Valider, corriger et enrichir avant intégration. Rapprochements métier possibles (par exemple commande d'achat et bon de livraison).

Export vers vos outils

Images, PDF et données structurées vers la GED, l'ECM ou les logiciels métiers (comptabilité, facturation, workflows internes).

Modules complémentaires

Splitter, Verifier, MailCollect, connecteur MEM Courrier : chaînes dédiées au scan de masse, à la qualification et au traitement des messages.

Courrier papier et e-mail

Avec MEM Courrier, une même logique de qualification pour les flux physiques et les boîtes mail, pièces jointes comprises.

Aller plus loin

Modules et connecteurs

Des extensions prêtes à l'emploi pour cadrer un canal (courrier, mail, scan de masse) ou une brique logicielle (MEM Courrier, qualification…).

Open-Capture for MEM Courrier

Connecteur pour la gestion de courrier : métadonnées et qualification côté opérateur.

Fiche du module

MailCollect

Acquisition intelligente des messages : contenu, expéditeur, pièces jointes intégrées au flux.

Fiche du module

Verifier

Formulaires de contrôle et workflows IDR pour documents semi-structurés (règles, lasso, cohérence).

Fiche du module

Splitter

Préparation des lots de scan : métadonnées de batch, réorganisation, classification ML.

Fiche du module

Communauté et forum

Un espace est prévu sur communaute.edissyum.com pour échanger entre utilisateurs, poser des questions techniques, partager des retours d'expérience et faire vivre la connaissance autour d'Open-Capture et de l'écosystème Edissyum.

Ils utilisent Open-Capture

Références et éditeur

Quelques déploiements mis en avant sur open-capture.com, puis l'équipe qui édite et intègre la solution.

Uniprévoyance

Organisation équipée des logiciels et modules Open-Capture.

  • Traitement documentaire centralisé
  • Meilleure circulation de l'information
  • Intégration au système GED existant

Département du Lot

Projet public avec solution adaptée aux services.

  • Organisation des workflows par direction
  • Traitement des flux plus fluide
  • Accompagnement au déploiement

Opéris

PME accompagnée par l'équipe Edissyum.

  • Expression du besoin et paramétrage
  • Suivi de mise en production
  • Formation des équipes

Éditeur : Edissyum

Open-Capture est développé et maintenu par Edissyum (environ 25 collaborateurs, spécialistes GED, capture et dématérialisation, basés en France). L'éditeur assure intégration, formation, support et projets sur mesure autour de la plateforme.

Documentation commerciale

La brochure PDF résume l'offre, les modules et les cas d'usage : idéale pour une diffusion interne (DSI, métiers, achats) avant un échange avec un expert.

Questions fréquentes

FAQ

Formulations utiles pour le référencement naturel et pour cadrer vos échanges avec les équipes.

Qu'est-ce qu'Open-Capture ?

C'est un logiciel open source de capture documentaire et d'IDR (intelligent document recognition) : acquisition, OCR, extraction de données, contrôle qualité et export vers vos outils.

Open-Capture est-il vraiment 100 % open source ?

Oui, la solution est publiée sous licence libre, sans limitation artificielle du nombre d'utilisateurs. Vous pouvez étudier le code, l'adapter et le faire auditer.

Quel rôle joue l'IA dans Open-Capture ?

L'IA et le machine learning servent notamment à la classification des documents et à l'extraction de champs, en complément des règles et de l'OCR Tesseract.

Puis-je héberger Open-Capture en France, hors cloud public ?

L'architecture privilégie un déploiement on premise sur Linux, ce qui convient aux politiques de souveraineté et de contrôle des données.

Où demander une démonstration ?

Utilisez le formulaire de contact sur open-capture.com et sélectionnez « Démonstration » ou le sujet adapté à votre besoin.

Où échanger avec la communauté ?

Le forum sur communaute.edissyum.com est l'endroit prévu pour l'entraide entre pairs, les discussions techniques et le partage de bonnes pratiques. Il complète le dépôt GitHub pour le code et les tickets.

Prêt à accélérer vos flux documentaires ?

Réservez une démo ou écrivez aux équipes Edissyum depuis le site officiel Open-Capture.