Comment fonctionne l'OCR? Expliqué d'une manière simple et compréhensible
Dans cet article, nous expliquons le fonctionnement de l'OCR. OCR signifie "Optical Character Recognition" et est simplement appelé en allemand reconnaissance de texte. Cela signifie qu'un ordinateur peut reconnaître du texte sur une image numérisée à l'aide de l'OCR, puis le convertir en un simple document texte.
Voici comment fonctionne l'OCR
Imaginez que vous avez reçu une présentation papier d'un collègue. Vous voulez maintenant les éditer sur le PC car vous n'aimez pas les passages individuels. Alors scannez-le et accédez à votre programme OCR. Maintenant, ce qui suit se produit:
- Le logiciel effectue d'abord une analyse dite de la disposition. Pour ce faire, elle regarde la mise en page et sépare les images du texte. Elle note également leur position sur la page. Ensuite, le nombre de paragraphes est compté et les éléments individuels tels que les numéros de page sont enregistrés.
- Vient maintenant la partie difficile. Le logiciel examine les blocs de texte individuels et les décompose en phrases. Les phrases sont ensuite divisées en mots individuels et les mots en lettres.
- Le logiciel OCR contient des modèles de lettres et de caractères. Le programme compare maintenant les lettres numérisées avec ces modèles. S'ils sont similaires à 99%, l'algorithme décide qu'il doit probablement s'agir de cette lettre. Il est très précis car il permet de comparer de nombreux modèles en peu de temps. De cette façon, il réussit à faire la différence entre un "8" et un "B".
- Ainsi, les lettres et les caractères sont progressivement reconnus. Ensuite, ils sont à nouveau combinés sous forme de mots et remis à leur place dans la phrase. Dès que le logiciel est terminé, le tout est enregistré dans un document normal, que vous pouvez ensuite éditer. Fait!
Voulez-vous tester vos connaissances logicielles? Participez à notre grand quiz logiciel!