Unanimement reconnu comme le numéro 1 des kits d'imagerie et d'OCR du marché, le SDK OmniPage Capture fournit la technologie centrale sur laquelle reposent tous les logiciels d'imagerie développés par Nuance. Il regroupe tous les outils dont vous avez besoin pour ajouter de puissantes fonctions d'imagerie, d'OCR et de conversion PDF à vos applications.
Outre sa vitesse et sa précision inégalées, ses nombreuses options et sa prise en charge hors pair du format PDF, le SDK OmniPage Capture 18 est compatible avec l'environnement .NET, les contrôles de flux de travail et la technologie LFR (Logical Form Recognition) pour simplifier vos travaux de développement et apporter une valeur ajoutée unique à vos produits.
Prisé par les développeurs qui souhaitent ajouter les meilleures fonctions d'OCR et d'imagerie documentaire à leurs applications, le SDK OmniPage Capture est doté de moteurs évolutifs de reconnaissance par vote, d'une prise en charge unique du format PDF et d'une interface API simple qui vous permet de créer des produits compétitifs et à forte valeur ajoutée tout en optimisant la productivité et le retour sur investissement.
*Sous-ensemble d'API compatible avec la version Windows
Le SDK OmniPage Capture est depuis toujours la référence incontestée auprès des développeurs qui souhaitent ajouter rapidement et facilement de puissantes fonctions de reconnaissance optique des caractères (OCR), d'imagerie et de création/conversion de PDF à leurs applications.
Avec la sortie de la version 18, le SDK OmniPage Capture bat une nouvelle fois tous les records qu'il détenait déjà !
Les gains spectaculaires en termes de vitesse et de précision, la puissance des nouvelles fonctions de développement et l'innovation continue font du SDK OmniPage Capture la suite d'outils la plus complète pour le développement de logiciels d'imagerie documentaire.
Doté d'améliorations significatives (et malgré tout la même API que la version 16), le SDK OmniPage Capture facilite la mise à niveau des fonctions de vos applications. Si vous ajoutez à cela des nouveautés spectaculaires, vous comprendrez pourquoi le SDK OmniPage Capture pour Windows fait l'unanimité parmi les développeurs de solutions d'imagerie.
Vitesse et précision
Vos clients recherchent la vitesse et la précision, sans compromis. En tant que développeur, vous savez que la précision de l'OCR dépend de nombreux facteurs qui peuvent varier radicalement d'une application à une autre. Tout au long des évolutions d'OmniPage, nous avons toujours souhaité vous permettre de trouver le meilleur équilibre entre vitesse et précision, en fonction de vos besoins. Des études menées sur nos applications nous ont permis de constater les améliorations suivantes :
Création de PDF avec recherches à partir de fichiers PDF d'origine inconnue
Pour les développeurs d'applications qui prennent en charge le format PDF, la route est longue et semée d'embûches ! En effet, les fichiers PDF peuvent être créés de nombreuses façons différentes et bien souvent, ils ne contiennent pas les données de texte requises pour leur indexation et leur recherche. Les processus d'OCR classiques traitent toutes les pages des PDF comme des images, imposant ainsi à votre application des conversions par OCR inutiles qui peuvent apporter davantage de problèmes que de solutions... Dans ce contexte, vous avez deux alternatives : consacrer beaucoup de temps et de ressources à essayer de contourner ces problèmes, ou utiliser notre nouvelle API de traitement des PDF. Le SDK OmniPage Capture identifie automatiquement les sections des PDF qui sont constituées uniquement d'images. Ainsi, l'OCR n'est exécutée que là où elle est strictement nécessaire. Résultat : le processus est extrêmement rapide et précis, et ne présente aucun risque de modification ou d'effacement des éléments de texte existants.
Par ailleurs, ce nouveau composant autorise une multitude d'opérations sur les pages des fichiers PDF. Des pages peuvent ainsi être supprimées ou copiées, et déplacées au sein d'un même PDF ou entre plusieurs fichiers PDF. Des pages issues de fichiers image (TIFF ou JPEG) peuvent être insérées dans des fichiers PDF. Et si ces pages sont traitées par OCR avant leur insertion, elles pourront faire l'objet de recherches dans le PDF final. Après enregistrement des modifications demandées, le module de traitement les applique automatiquement, en une seule opération.
Ces opérations PDF peuvent être utilisées au sein de solutions très variées : applications d'imagerie qui exigent l'extraction et l'indexation de texte à des fins de gestion documentaire, applications de stockage en ligne ou d'assemblage de documents PDF, ou n'importe quel flux de travail de numérisation impliquant des PDF texte. Les possibilités de l'application sont infinies. Vous pourrez ainsi démarquer vos produits de ceux de vos concurrents, et améliorer la satisfaction de vos clients grâce à des performances et une fiabilité hors pair.
Détection automatique de la langue, pour une productivité optimale
Pour différentes raisons, la qualité et la précision de l'OCR dépendent de la langue du texte source. Grâce à la nouvelle version de notre SDK, il n'est plus utile d'interrompre l'exécution de votre application pour modifier le paramètre de langue dans le but d'améliorer la précision. Une fonction de détection automatique de la langue vous permet en effet d'exécuter des numérisations ou des importations de documents de manière totalement autonome, même lorsque la langue varie d'un document ou d'une page à l'autre.
Nouveaux traitements des images, pour des gains de temps et une précision améliorée
Les marques, bordures et demi-tons peuvent être à l'origine d'éléments « fantômes » ou de caractères superflus qui nuisent à la précision de la reconnaissance. Le SDK OmniPage Capture intègre de nouveaux algorithmes de traitement capables de nettoyer automatiquement les images numérisées, pour des documents de qualité optimale. Une fonction de recadrage automatique analyse toutes les images entrantes afin de supprimer les zones de bordure superflues. Ainsi, seules les marges correspondant aux dimensions prédéfinies sont conservées. Les marques laissées par les trous de perforation ou les ombres provoquées par la numérisation peuvent être effacées des marges. Un large choix de méthodes de nettoyage est disponible. Des fonctions d'érosion et de dilatation optimisent la préparation des images en noir et blanc en vue de leur l'OCR, en modifiant la valeur d'un pixel en fonction des pixels voisins. L'érosion a pour effet d'affiner la forme des caractères, tandis que la dilatation permet de l'épaissir. Un nouvel outil améliore la lisibilité des textes capturés sur un tableau blanc à l'aide d'un appareil photo numérique.
Création d'applications puissantes et attrayantes, grâce aux composants préconfigurés
Le SDK OmniPage est unique car il intègre des composants préconfigurés que nous utilisons dans nos propres applications. Nous avons amélioré à la fois le mode d'implémentation de ces composants, mais également leur convivialité. Nous avons également inclus un exemple d'application qui illustre comment utiliser ces composants, pour un confort d'utilisation optimale.
Meilleure reconnaissance des formes libres sur des formulaires à structure tabulaire
La reconnaissance de formes libres s'applique lors du traitement groupé de formulaires dont la diversité des mises en page interdit l'utilisation d'un gabarit de reconnaissance commun. Le SDK OmniPage Capture peut extraire le texte d'un formulaire et permettre à votre application de présenter des informations pertinentes à l'utilisateur : numéros de compte, montants de factures, ou toute information à ajouter à une base de données. Les algorithmes d'identification des zones sur des formulaires à structure tabulaire (grilles) ont été améliorés, pour une précision d'OCR accrue.
Fonctionnalités principales d'OmniPage Capture SDK pour Windows
OmniPage Capture SDK offre un ensemble de fonctionnalités performantes pour répondre à tous vos besoins d'imagerie. Profitez de la puissance et de la précision d'OmniPage, le programme d'OCR le plus vendu au monde, en l'intégrant dans vos applications avec les moteurs d'OCR les plus innovants et les nombreuses fonctionnalités PDF. La puissance d'OmniPage Capture SDK va au-delà de son incroyable précision. Le logiciel fournit des fonctionnalités supplémentaires pour rationaliser le développement des applications et offrir une valeur ajoutée à vos produits.
Le logiciel d'OCR le plus précis et le plus robuste
OmniPage fournit une interface évolutive et des fonctions de gestion à haut débit. Associé aux moteurs de reconnaissance de codes-barres (1D et 2D), de cases à cocher (OMR), de documents manuscrits (ICR) et de documents imprimés (OCR, OCR-A, OCR-B et MICR) d'une précision inégalée, le kit OmniPage Capture SDK offre une précision et une flexibilité exceptionnelles.
Prise en charge de l'OCR asiatique
Le module de reconnaissance d'OmniPage Capture SDK prend en charge le chinois simplifié et traditionnel, le japonais et le coréen. Il peut également être utilisé comme module autonome ou avec le kit des langues occidentales.
Prise en charge de l'environnement .NET
OmniPage Capture SDK 16 prend en charge .NET, un des principaux environnements de développement. Des programmes de reconnaissance échantillons C# et VB.NET et des afficheurs de démonstration y sont inclus.
Prise en charge des processus multifilière et multicoeur
Un traitement en parallèle et multifilière performant sur les documents contenant plusieurs pages dans OmniPage Capture SDK vous permet d'exploiter tout le potentiel de votre environnement de traitement. En mode multipages, OmniPage Capture SDK 16 s'exécute 43 % plus rapidement que les versions antérieures sur un processeur quadricoeur.
Interfaces utilisateurs prédéfinies
Le module Professional Visual Toolbox d'OmniPage Capture SDK’ vous propose des interfaces prédéfinies pour la création et l'exécution du flux de travail, le contrôle des dispositifs de numérisation et le traitement de documents. Il inclut des commandes visuelles pour l'amélioration des images et une reconnaissance avancée. Utilisez ce module pour créer des flux de travail compatibles avec OmniPage et contrôler leur exécution.
Développement et exécution du flux de travail
Vous pouvez facilement créer des tâches d'OCR et de traitement d'images complexes et gérer tous les paramètres. En intégrant l'OCR à votre application, l'exécution du flux de travail se fait en un rien de temps. Les fonctionnalités du flux de travail permettent également d'équilibrer la charge sur les systèmes multifilière ou à double cœur pour accroître les performances.
Technologie Logical Form Recognition
Notre technologie avancée LFR (Logical Form Recognition) automatise la création de modèles de formulaires et simplifie le traitement des formulaires, afin que vous puissiez gagner du temps.
Capacité de gestion
Les capacités de gestion sont supérieures à celles des autres solutions de développement existantes. OmniPage Capture SDK vous offre la possibilité de déployer une capacité exceptionnelle d'imagerie documentaire dans vos applications.
Kit d'outils PDF intégré
Les nombreuses fonctionnalités PDF, y compris la correspondance de fichiers PDF par superposition, unique en son genre, qui fournit une précision de conversion proche de 100 %, vous permettent de réduire considérablement les coûts de développement et le délai de lancement. OmniPage Capture SDK prend également en charge l'exportation de fichiers au format PDF/archive (PDF/A) et génère des fichiers PDF optimisés avec des contenus à trames multiples pour disposer de documents d'une qualité et d'une taille exceptionnelles.
Prise en charge de différents formats
OmniPage Capture SDK prend en charge de nombreux formats d'application et d'image, notamment les formats BMP, GIF, TIF, PDF, HTML, Microsoft Office, XML, Open eBook et bien plus encore. Il s'agit d'un atout majeur par rapport à d'autres solutions SDK, qui vous permet de profiter de capacités de traitement d'images optimales. Le logiciel prend également en charge de nombreux filtres d'importation/exportation, notamment les standards PDF, Microsoft® Office 2007, XML, et Open eBook.
Synthèse vocale (TTS)
OmniPage Capture SDK est également la seule solution SDK d'OCR qui inclut les technologies de synthèse vocale. Vous pouvez convertir des documents papier et numériques en fichiers audio réels. Il s'agit d'un outil d'accessibilité inestimable non seulement pour toutes les personnes présentant un handicap, mais aussi pour tous ceux qui souhaitent enregistrer des documents en fichiers pouvant être reproduits sur leur PC ou sur des dispositifs mobiles, comme l'iPod d'Apple.
Ces fonctionnalités avancées, associées aux capacités PDF inouïes offrant une parfaite précision lors de la conversion de documents PDF contenant du texte, vous permettent de réduire considérablement les coûts de développement et le délai de lancement. Ceci est la raison pour laquelle, le kit OmniPage Capture SDK est la solution SDK d’imagerie documentaire la plus puissance et la plus complète au monde.
Vous pouvez accéder au SDK OmniPage Capture depuis une API C/C++ ou une interface ActiveX. À l'aide d'une seule et même boîte à outils, vous pouvez développer simplement des applications dotées de puissantes technologies de reconnaissance pour Windows XP, Vista et Windows 7.
Configuration requise pour le développement
Configuration requise pour l'exécution
Architecture du produit
Interfaces
Deux interfaces de programmation sont disponibles avec OmniPage Capture SDK :
C/C++ API L'interface C/C++ API contrôle l'importation et le prétraitement des images, la reconnaissance et l'exportation des données et prend en charge le traitement d'images page par page.
Module Professional Visual Toolbox
Intégrant l'interface ActiveX et un ensemble de commandes, le module Professional Visual Toolbox est disponible en tant que module complémentaire. Les commandes prédéfinies vous permettent de réduire les délais de développement et de lancement via l'intégration d'interfaces pour vos applications.
ActiveX
Une interface ActiveX est fournie pour les programmateurs de Visual C++. Cette interface inclut toutes les fonctionnalités de l'interface C et offre toutes les capacités pour le traitement de documents afin que vous puissiez créer des solutions permettant de gérer plus efficacement vos documents. Cette interface prend également en charge les environnements de développement les plus récents, notamment VB.NET et C#.
Commandes prédéfinies
Entrée d'images
Le sous-système d'entrée d'image incorpore les interfaces de conversion d'images et le numériseur TWAIN. OmniPage Capture SDK prend en charge les images en couleurs et en niveaux de gris. Vous pouvez envoyer les images de la mémoire vers les processus de reconnaissance et de prétraitement. Il prend également en charge la conversion des formats d'images TIFF, TIFF/JPEG, TIFF-FX, PCX, DCX, BMP, ADF, JPEG, PNG, PaperPort MAX et PDF.
Prétraitement des images
Le prétraitement et la correction d'images améliorent considérablement la précision de la reconnaissance et la qualité des images. Ces fonctionnalités incluent :
Une interface pour l'intégration de technologies de prétraitement d'images supplémentaires vient s'ajouter aux fonctionnalités du système pour permettre la personnalisation du traitement d'images.
Gestion du module de reconnaissance
Le gestionnaire de composants d'OmniPage Capture SDK prend en charge l'intégration de 12 modules de reconnaissance individuels dans votre application. Des modules sont fournis pour l'OCR de documents imprimés, l'ICR (OCR de documents manuscrits), de codes-barres, l'OMR (cases à cocher), OCR-A, OCR-B et E-13B (MICR). Une interface est également fournie pour inclure les technologies de reconnaissance supplémentaires au sein de votre application. Cette interface vous permet d'envoyer les images, de recevoir le rendu de reconnaissance et d'envoyer les commandes de configuration vers le module de reconnaissance souhaité.
Le logiciel d'OCR pour les langues asiatiques est pris en charge dans OmniPage Capture SDK, notamment pour le chinois simplifié et traditionnel, le japonais et le coréen. La mise en page de ces documents est parfaitement conservée. Voir Prise en charge de l'OCR asiatique pour plus d'informations.
Traitement de sortie
Le sous-système de traitement de sortie des données d'OmniPage Capture SDK traite la sortie des documents depuis les modules de reconnaissance et la convertit au format souhaité, notamment BMP, GIF, TIFF, PDF, HTML, formats de Microsoft Office, XML, Open eBook et bien plus encore. Quatre types de sortie PDF sont disponibles :
Configurations du produit
Le kit OmniPage Capture SDK peut être configuré de trois manières différentes grâce aux deux compléments optionnels :
Le kit de reconnaissance Professional
Le kit d'OCR Professional
Kit de reconnaissance des langues asiatiques : Ce kit prend en charge le logiciel d'OCR pour le japonais, le chinois simplifié et traditionnel et le coréen. La mise en page de ces documents est parfaitement conservée et le format de sortie PDF pris en charge permet d'effectuer des recherches dans les documents.
Options complémentaires
Module de sortie PDF - Cette fonctionnalité inclut les filtres d'exportation PDF qui permet une conversion des documents aux formats PDF suivants : PDF Normal, Normal avec substitution d'image, Image uniquement et Image sur formats de texte.
© 2002-2012 Nuance Communications, Inc. Tous droits réservés.