Please use this identifier to cite or link to this item: https://dspace.nlu.edu.ua//jspui/handle/123456789/10804
Title: Проблемы цифрового преобразования и автоматического перевода текста
Authors: Ломоносов, Ю.В.
Keywords: класифікація зображень тексту
системи оптичного розпізнавання
комп'ютерний переклад тексту
классификация изображений текста
системы оптического распознавания
компьютерный перевод текста
classification of images of text
optical character recognition (OCR)
computer translation of the text
Issue Date: 2016
Citation: Ломоносов Ю. В. Проблемы цифрового преобразования и автоматического перевода текста / Ю. В. Ломоносов, Ж. В. Ломоносова // Науковий огляд. – 2016. – № 3. – С. 51–59.
Abstract: В роботі розглядаються методи класифікації, що застосовуються при цифровій обробці бі-тональних зображень тексту, отриманих скануванням або цифровим фотографуванням. Для відомих на сьогоднішній день алгоритмів класифікації, включаючи добре відомого – алгоритм JB2, наведені кількісні характеристики класифікації – число класів, одержаних цими алгоритмами для зображення стандартної сторінки тексту. Також показано, що мінімально можлива кількість класів при класифікації зображень символів тексту дозволяє зменшити помилку розпізнавання тексту системами оптичного розпізнавання. Мінімізація помилки розпізнавання тексту дозволяє підвищити якість автоматичного перекладу на іноземну мову.
В работе рассматриваются методы классификации, применяемые при цифровой обработке би-тональных изображений текста, полученных сканированием или цифровым фотографированием. Для известных на сегодняшний день алгоритмов классификации, включая хорошо зарекомендовавший себя – алгоритм JB2, приведены количественные характеристики классификации – число классов, получаемых этими алгоритмами для изображения стандартной страницы текста. Так-же показано, что минимально возможное количество классов при классификации изображений символов текста позволяет уменьшить ошибку распознавания текста системами оптического распознавания. Минимизация ошибки распознавания текста позволяет повысить качество автоматического перевода на иностранный язык.
Description: The paper deals with the classification methods used in digital processing of bi-tonal image of the text, obtained by scanning or digital photography. For the currently known classification algorithms, including well-established – an algorithm JB2, given the quantitative characteristics of the classification – the number of classes obtained by these algorithms to image the standard page of text. Thus, it was shown that the smallest possible number of classes in the classification of images of text characters can reduce the recognition error text optical character recognition systems. Minimizing OCR errors can improve the quality of automatic translation into a foreign language.
URI: https://dspace.nlu.edu.ua/handle/123456789/10804
Appears in Collections:Наукові статті кафедри криміналістики

Files in This Item:
File Description SizeFormat 
Lomonosov-Lomonosova_51-59.pdf917.36 kBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.