
Начало работы
Хотите быстро преобразовать отсканированные страницы в текст, доступный для поиска? Aquaforest OCR SDK предоставляет опыт для разработчиков, который делает именно это. Разработан для интеграции в решения на .NET, он быстро обрабатывает большие пакеты и работает без проблем, чтобы вы могли сосредоточиться на создании функционала, а не на его воссоздании при управлении архивами или при конвертации в реальном времени.
Что предоставляет комплект
Это похоже на набор «черных ящиков» для автоматизации документов. Он принимает PDF или TIFF, содержащие только изображения, находит текст и структурирует поля, затем выводит поисковые PDF или различные распространенные форматы экспорта. Это не просто OCR-выход, это извлечение пар имя/значение и предоставление пригодных данных для последующих систем. И он нацелен на разработчиков, которые хотят программного контроля над конвертацией, а не на настольное приложение типа HOG (hand-on-glove).
Как работает движок
SDK предоставляет конвейер предобработки изображений, распознавания символов и постобработки, доступный из вашего кода. Он может выравнивать наклон, удалять шум и автоматически поворачивать страницы перед распознаванием, поэтому при большом количестве веб-скриншотов часто повышается точность. Вы вызываете методы или передаете файлы или потоки, получаете обратно поисковые PDF, TXT, DOCX или структурированный экспорт для каждой задачи. API также позволяет обращаться к конкретным зонам на странице.
Ключевые возможности
- Оставьте остальные параметры по умолчанию. Параметры относятся к OCR-движку, с поддержкой общего набора символов или расширенного.
Создание поисковых PDF с использованием изображений ‘as is’ и слоя текста inauditivemonoling™.
Автоматически извлекает данные, распознавая пары имя/значение среди множества различных макетов.
- Предобработка изображений (выравнивание, удаление шумов, автоматический поворот и маскирование графики).
- Чтение штрихкодов распространенных символогий для файлов со смешанным содержимым.
- Облачный OCR подключается к сервисам Microsoft или Google для обработки рукописного текста или крайних случаев на Microsoft или Google.
- Настройка производительности для многопроцессорных систем, чтобы ускорить выполнение больших заданий на современных серверах.
- Это установщик, а не само программное обеспечение – меньше, быстрее и удобнее
- Установка в один клик – без ручной настройки
- Установщик загружает полный Aquaforest OCR SDK 2026.
Как установить
- Скачайте и распакуйте ZIP-файл
- Откройте извлечённую папку и запустите установочный файл
- Когда Windows покажет синее окно «неизвестное приложение»:
- Нажмите Подробнее → Всё равно выполнить
- Нажмите Да в окне контроля учётных записей
- Дождитесь автоматической установки (~1 минута)
- Нажмите Начать загрузку
- После завершения загрузки запустите программу с ярлыка на рабочем столе
- Наслаждайтесь
– Множество форматов вывода: PDF, DOCX, RTF, CSV, XLSX, TXT and HTML.
Каждый из этих пунктов упрощает документальные проекты и делает их более воспроизводимыми.
Почему разработчики это любят
Он интегрируется напрямую в приложения на C# и VB.NET, с предварительно написанными примерами, чтобы вам не приходилось тратить часы на поиск способов связать простые потоки. SDK предоставляет доступ ко всем программным интерфейсам для зонального OCR, оценки уверенности и сжатого PDF-вывода, так что вы контролируете эти параметры, когда важны точность или размер файлов. И он масштабируем: вы можете регулировать уровень использования процессора для высокопроизводительной обработки тысяч страниц в партии. Тем не менее, он остается простым в использовании для небольших команд.
Типичные применения
- Пакетное преобразование архивных отсканированных PDF в поисковые и индексированные PDF для внешнего хранения.
Примеры ключевых задач, которые мы выполняем: – Автоматическое извлечение полей счетов, accountnumbers,dates для сквозного бухгалтерского процесса.
- Сделать библиотеки в SharePoint или в облаке полностью поисковыми (с использованием OCR) для всего, что в них добавляется.
- Для устаревших коллекций TIFF создавать PDF/A, сжатый поисковый вывод для корпоративных и юридических команд.
Пакеты со смешанными форматами должны внедрять обнаружение в системы приема.
- Использование облачных OCR-систем для распознавания рукописи или для поддержки использования языков, которые не покрывает основной движок.
Все это факторы, где SDK действительно может быстро окупиться: простая документация и минимальный ввод данных.
Заключительные замечания
Если нужно создать поток обработки документов, ориентированный на ПК, или встроить OCR в утилитный конвейер .NET, SDK предоставляет практичные, ориентированные на код наборы инструментов для выполнения работы. Он ориентирован на разработчиков, применяется в производственных средах при обработке больших объемов и спроектирован так, чтобы справляться с неизбежным набором входных данных, встречающихся в полевых условиях. Если требуется выполнять OCR, чтобы автоматизировать извлечение текста, а не бороться с ним, стоит взглянуть.