4 бесплатных онлайн-инструмента для распознавания текста, прошедшие окончательное испытание

4 бесплатных онлайн-инструмента для распознавания текста, прошедшие окончательное испытание

Если вы хотите преобразовать любой печатный текст в цифровой, который можно копировать, вставлять, редактировать и выполнять поиск, вам необходимо использовать сканеры с оптическим распознаванием символов (OCR).





Когда вы решите отсканировать или сфотографировать документ, он будет сохранен в таком формате, как JPEG или PDF. Программное обеспечение OCR затем может распознавать буквы и цифры в этих документах и ​​преобразовывать их в PDF-файл с возможностью поиска или в файл, который можно редактировать в таких программах, как Microsoft Word.





Проблема в том, что некоторые сканеры OCR работают намного лучше, чем другие, причем самые лучшие из них довольно тяжелы для кошелька.





Omnipage18, например, стоит 150 долларов, но он особенно хорошо распознает разные языки. Adobe Acrobat Pro DC стоит умопомрачительные 400 долларов, но обладает невероятной точностью. ABBYY FineReader стоит 150 долларов, но отлично подходит для преобразования таких документов, как журналы и брошюры, в текст с возможностью поиска. Мы будем тестировать онлайн-предложение ABBYY позже в этой статье.

Однако, если вам нужны бесплатные альтернативы, вы можете скачать и использовать в Windows или OS X, вам следует попробовать эти инструменты OCR. Но если вы предпочитаете бесплатный, онлайн Инструмент OCR, продолжайте читать, поскольку мы опробовали несколько лучших, а результаты приведены ниже.



Тест

Кажется, сейчас большинство людей используют свои смартфоны для сканирования за них, я решил использовать Приложение Evernote для сканирования (Бесплатно для iOS и Android). Я просмотрел первую страницу книги Ричарда Докина. Восхождение на маунт Невероятно , чтобы увидеть, какие результаты можно получить с помощью очень простого форматирования. Я также просмотрел страницу Тима Ферриса. 4-часовой повар чтобы опробовать сканеры с немного более сложным форматированием. Я сохранил каждый из этих файлов в формате PDF.

Затем эти документы были пропущены через некоторые из якобы лучших онлайн-инструментов OCR, чтобы увидеть, насколько хорошо они работают.





Бесплатное онлайн-распознавание текста [больше не доступно]

К счастью, для использования бесплатного онлайн-распознавания текста регистрация не требуется. И я был вдвойне впечатлен, когда увидел их требование сохранить форматирование и макет моего документа.

Сайт утверждает, что может поддерживать PDF, GIF, BMP, JPEG, TIFF и PNG в качестве входных данных. Вывод может быть в формате DOC, текстовом документе PDF, RTF и TXT. К сожалению, я не смог узнать, есть ли у них ограничение на размер файла.





Базовый документ в PDF

Конвертирован абсолютно на отлично. Больше нечего сказать! Мы едем в очень хорошее начало.

Базовый документ в DOC

Фактические слова, кажется, преобразовались безупречно, если не считать «ount» из «Mount Rushmore», каким-то образом уходящего в самоволку. А вот форматирование - это совсем другая история. Многие запятые были заменены подчеркиванием, а случайные пробелы были вставлены в точках по всему документу. Однако, когда вы позже увидите, как программное обеспечение премиум-класса показало себя в этом тесте, это неплохая попытка. вообще .

Сложный документ в PDF

Сложный документ в DOC

На этот раз преобразование заняло всего 10 секунд, при этом текст снова преобразован с точностью около 95%. Были некоторые странные проблемы с интервалами, и программа не могла преобразовать шрифт в правом верхнем углу документа и пропустила несколько символов здесь и там.

Вердикт

i2OCR

i2OCR делает несколько впечатляющих заявлений. Инструмент распознает более 60 языков, может обрабатывать макеты с несколькими столбцами (путем удаления форматирования), не имеет ограничений на размер файла, может конвертировать загруженные файлы. а также из URL-адресов. И вам не нужно регистрироваться, чтобы использовать этот инструмент.

Служба работает, просто извлекая текст из вашего изображения, а затем выводя неформатированный текст. Вы можете быстро исправить любые ошибки в параллельном просмотре, прежде чем копировать текст в другие программы или загружать в формате DOC, PDF или HTML.

Примечание: когда я пытался загрузить свои PDF-документы, они были отклонены i2OCR, поэтому мне нужно было преобразовать их в JPEG (сделав снимок экрана, а затем загрузив файлы).

Основной документ в обычный текст

Сложный документ в обычный текст

Большая часть текста была преобразована без особых ошибок, за исключением заголовка и рецепта в правом верхнем углу, которые были нечитаемы для этого инструмента. Способ преобразования столбцов в обычный текст был далек от идеала. Если вы хотите сделать это преобразование работоспособным, потребуется много времени, чтобы преобразовать строки в связные предложения.

Вердикт

Онлайн OCR

Онлайн-оптическое распознавание текста в настоящее время поддерживает 46 различных языков и может преобразовывать PDF, JPG, BMP, TIFF и GIF в формат Word, Excel или обычный текст. На сайте утверждается, что «преобразованные документы выглядят точно так же, как оригинал - таблицы, столбцы и графики».

Версия, которую вы можете использовать без регистрации, позволяет конвертировать до 15 изображений в час (ограничение 5 МБ). Если вы зарегистрируетесь для учетной записи, вы можете приобрести больше страниц сверх этого лимита, а также сможете конвертировать многостраничные документы и ZIP-архивы.

Базовый документ в DOC

Основной документ преобразован безупречно, за исключением римских цифр. я не подбирают. Как и обещал сайт, форматирование было именно таким, как в книге. Престижность этому инструменту.

Сложный документ в DOC

После того, как предыдущие инструменты OCR разочаровали меня при преобразовании сложного документа, я был очень впечатлен Online OCR. Компоновка была почти идеальной, как вы можете видеть выше. Опять же, рецепт не был подобраен слишком хорошо, но любые другие мелкие ошибки были незначительны.

Вердикт

Абсолютно фантастические результаты онлайн-распознавания текста. Единственный недостаток, который я вижу, заключается в том, что нет возможности загрузить преобразованные документы в виде PDF-файлов, поскольку упомянутые выходные форматы включают только DOCX, XLSX и TXT.

ABBYY FineReader Online (10-страничная пробная версия)

Как упоминалось ранее, ABBYY - один из лидеров рынка программного обеспечения для распознавания текста, полная загружаемая программа которого стоит около 150 долларов. Они предлагают 10-страничная бесплатная пробная версия для их онлайн-инструмента (требуется регистрация). За подписку за 5 долларов их онлайн-инструмент позволит вам конвертировать 200 страниц каждый месяц.

Принимаемые файлы могут быть размером до 100 МБ в любом из следующих форматов: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP и PNG. ABBYY также распознает почти 200 языков. Выводы особенно впечатляют, с выбором между DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 и EPUB.

Вы даже можете опробовать несколько БЕТА-функций во время пробной версии. Первый - это возможность перевести ваш документ на другой язык. Другой - экспортировать преобразованный документ в вашу учетную запись облачного хранилища, будь то Dropbox, Google Drive, Evernote, Microsoft OneDrive или Box.

Базовый документ в DOCX

Сложный документ в DOCX

После преобразования в тексте документа было очень мало ошибок (не считая того, что OCR снова борется со шрифтом этого рецепта!), Но форматирование оставляло желать лучшего.

Три столбца почему-то занимали две страницы, а центральный столбец Только появляется на второй странице. Если бы ты действительно хотел делать что бы то ни было с этим преобразованным документом, вы в конечном итоге вырвали бы себе волосы.

Базовый документ в PDF

Сложный документ в PDF

Вердикт

Окончательный результат

Если, как и большинство людей, вы просто хотите отсканировать несколько журнальных статей и несколько счетов за дом, вам не нужно редактировать эти документы. Следовательно, преобразование напрямую в PDF-файл подойдет вам, потому что вы по-прежнему сможете выполнять поиск в этих документах. Для этого Free Online OCR определенно был лучшим бесплатным инструментом, который мы тестировали. При этом, если вы готовы платить 5 долларов в месяц за почти совершенство, ABBYY FineReader Online был немного точнее.

Когда дело доходит до преобразования документов в формат DOC, нам не удалось найти идеального решения, но, безусловно, лучшие результаты были получены от Онлайн OCR . Преобразование не было идеальным, но целостность форматирования в значительной степени сохранилась, а ошибки были незначительны. Когда мы сравниваем эти результаты с «премиальным» предложением от ABBYY, вы не можете не быть впечатлены.

Мы не включали в этот пост возможности оптического распознавания текста Google Диска; немного для повсюду Google, но больше для того факта, что мы хотели протестировать несколько других бесплатных онлайн-сервисов OCR.

К вам: Какие еще онлайн-инструменты распознавания текста вы порекомендовали бы нашим читателям? А что из того, что вы пробовали, больше никогда не использовать?

Делиться Делиться Твитнуть Эл. адрес Руководство по анимации речи для новичков

Оживить речь может быть непросто. Если вы готовы начать добавлять диалог в свой проект, мы разберем этот процесс за вас.

как сделать персональные фильтры для снэпчата
Читать далее Похожие темы
  • Интернет
  • Продуктивность
  • Преобразование файлов
  • OCR
Об авторе Роб Найтингейл(Опубликовано 272 статей)

Роб Найтингейл получил степень по философии в Йоркском университете в Великобритании. Он работал менеджером по социальным сетям и консультантом более пяти лет, проводя семинары в нескольких странах. Последние два года Роб также был писателем по технологиям, менеджером по социальным сетям и редактором информационных бюллетеней MakeUseOf. Обычно вы обнаружите, что он путешествует по миру, изучает редактирование видео и экспериментирует с фотографией.

Ещё от Rob Nightingale

Подписывайтесь на нашу новостную рассылку

Подпишитесь на нашу рассылку, чтобы получать технические советы, обзоры, бесплатные электронные книги и эксклюзивные предложения!

Нажмите здесь, чтобы подписаться