У цьому дослідженні представлено огляд інструментів OCR для розпізнавання таблиць документів і графіків. Оцифрування паперових документів має багато переваг як для фізичних осіб, так і для компаній. Для оцифрування потрібно використовувати програмне забезпечення OCR (оптичне розпізнавання символів). Таке програмне забезпечення сканує документи, щоб зробити текст зрозумілим для комп’ютера. Їх можна конвертувати у формати, які підтримуються Microsoft Word або Google Docs. Програмне забезпечення OCR стає радше необхідністю, ніж утилітою для розваг. OCR створює текст із можливістю пошуку та редагування з друкованих документів, а також із відсканованих фотографій або книг і PDF-файлів. Зараз спостерігається активна тенденція до цифровізації документів. Існує великий попит на рішення, які можуть ефективно автоматизувати обробку великого масиву документів з високою точністю. Окремим випадком є обробка PDF-файлів, таких як відскановані документи або створені програмними редакторами. Рішення OCR спрямовані на підвищення ефективності обробки та аналізу цифрових документів за допомогою штучного інтелекту. Цими рішеннями можуть користуватися як державні установи, так і підприємства. Розроблені системи можуть стати цінним доповненням до CRM-систем і можуть бути інтегровані замість існуючих модулів обробки документів або використовуватися як окреме рішення. Хоча існуючі рішення OCR можуть ефективно розпізнавати текст, розпізнавання графічних елементів, таких як діаграми та таблиці, все ще знаходиться на стадії розробки. Рішення, які можуть підвищити точність розпізнавання візуальних даних, можуть бути цінними для обробки технічних документів, таких як наукові, фінансові та інші аналітичні документи. Ключові слова: OCR, файли PDF, FastText, виявлення, розпізнавання, глибоке навчання, технічні документи.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.