Please use this identifier to cite or link to this item: https://dspace.nlu.edu.ua//jspui/handle/123456789/3774
Title: Классификационные методы сжатия изображений оцифрованного текста
Other Titles: Класифікаційні методи стиснення зображень оцифрованого тексту
Classification methods of compression of images of the digitised text
Authors: Иванов, В.Г.
Ломоносов, Ю.В.
Любарский, М.Г.
Keywords: информатика
изображение текста
методы классификации
сжатие данных
зображення тексту
методи класифікації
стиснення даних
image of text
methods of classification
compression of data
Issue Date: 2013
Citation: Иванов В. Г. Классификационные методы сжатия изображений оцифрованного текста. / В. Г. Иванов [та ін.] // Системи обробки інформації / Харк. ун-т Повітр. Сил ім. І. Кожедуба. – Х., 2013. – Вип. 2, ч. 1 – С. 36–43.
Abstract: В работе рассматриваются методы классификации, применяемые при сжатии файла с битональным изображением текста, полученным сканированием или цифровым фотографированием. Особое внимание обращается на используемые при этом меры различия двух изображений символов, выделенных из изображения текста. Эти меры различия позволяют с той или иной степенью уверенности считать символы на сравниваемых изображениях или совпадающими, или различными. Для известных на сегодняшний день алгоритмов классификации, включая хорошо известный алгоритм JB2, приведены количественные характеристики классификации - число классов, получаемых этими алгоритмами для изображения стандартной страницы текста. Чем меньше это число, тем качество классификации считается выше, так как дает лучшее сжатие файла с изображением текста. Рассмотрены также методы ускорения алгоритмов, классифицирующих изображения символов, и повышения удобочитаемости восстановленного после сжатия изображения текста.
У роботі розглядаються методи класифікації, вживані при стисненні файлу з бітональним зображенням тексту, отриманим скануванням або цифровим фотографуванням. Особлива увага звертається на використовувані при цьому три відмінності двох зображень символів, виділених із зображення тексту. Ці мiри відмінності дозволяють з тим або іншим ступенем упевненості вважати символи на порівнюваних зображеннях або співпадаючими, або різними. Для відомих на сьогоднішній день алгоритмів класифікації, включаючи добре відомий алгоритм JB2, приведені кількісні характеристики класифікацій - число класів, що отримуються цими алгоритмами для зображення стандартної сторінки тексту. Чим менше це число, тим якість класифікації вважається вище, оскільки дає краще стиснення файлу із зображенням тексту. Розглянуті також методи прискорення алгоритмів, що класифікують зображення символів, і підвищення легкості для читання відновленого після стиснення зображення тексту.
Methods are in-process examined classifications, applied at the compression of file with the bitonatity image of phototypog-raph got scan-out or digital photographing. The special attention applies on the in-use here measures of distinction of two images of characters, abstracted from the image of text. These measures of distinction allow with one or another degree of confidence to count characters on the compared images or consilient, or different. For the algorithms of classification known to date, including the known algorithm ofJB2 well, quantitative descriptions of classification - number of classes, got these algorithms for the image of standard page of text are resulted. What less than it is a number, quality of classification is considered that higher, because gives the best compression of file with the image of text. The methods of acceleration of algorithms, classifying the images of characters, and increases ofeasy-to-readness of the text recovered after the compression of image are considered also.
URI: https://dspace.nlu.edu.ua/handle/123456789/3774
Appears in Collections:Наукові статті кафедри інформатики та обчислювальної техніки

Files in This Item:
File Description SizeFormat 
Ivanov_Lomonosov_Lybarskiy_36_43.pdf4.12 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.