Методы повышения качества классификации символов при обработке текстовых изображений

Ломоносов, Ю.В.

Please use this identifier to cite or link to this item: https://dspace.nlu.edu.ua/jspui/handle/123456789/12525

Title:	Методы повышения качества классификации символов при обработке текстовых изображений
Authors:	Ломоносов, Ю.В.
Keywords:	зображення тексту методи класифікації стиснення даних изображение текста методы классификации сжатие данных image of text methods of classification compression of data
Issue Date:	2017
Citation:	Ломоносов Ю. В. Методы повышения качества классификации символов при обработке текстовых изображений / Ю. В. Ломоносов // Інформаційні технології: проблеми та перспективи : монографія / Ред. В. С. Пономаренко. – Харків, 2017. – Розд. 27. – С. 418–433.
Abstract:	У роботі розглядаються методи класифікації, що застосовуються при стисненні файлу з бітональний зображенням тексту, отриманим скануванням або цифровим фотографуванням. Особлива увага звертається на використовувані при цьому заходи відмінності двох зображень символів, виділених з зображення тексту. Ці заходи відмінності дозволяють з тим або іншим ступенем впевненості вважати символи на порівнюваних зображеннях або збігаються, або різними. Для відомих на сьогоднішній день алгоритмів класифікації, включаючи добре відомий алгоритм JB2, наведені кількісні характеристики класифікації – число класів, одержуваних цими алгоритмами для зображення стандартної сторінки тексту. Чим менше це число, тим якість класифікації вважається вище, так як дає краще стиснення файлу із зображенням тексту. Розглянуто також методи прискорення алгоритмів, що класифікують зображення символів, і підвищення зручності читання відновленого після стиснення зображення тексту. В работе рассматриваются методы классификации, применяемые при сжатии файла с битональным изображением текста, полученным сканированием или цифровым фотографированием. Особое внимание обращается на используемые при этом меры различия двух изображений символов, выделенных из изображения текста. Эти меры различия позволяют с той или иной степенью уверенности считать символы на сравниваемых изображениях или совпадающими, или различными. Для известных на сегодняшний день алгоритмов классификации, включая хорошо известный алгоритм JB2, приведены количественные характеристики классификации – число классов, получаемых этими алгоритмами для изображения стандартной страницы текста. Чем меньше это число, тем качество классификации считается выше, так как дает лучшее сжатие файла с изображением текста. Рассмотрены также методы ускорения алгоритмов, классифицирующих изображения символов, и повышения удобочитаемости восстановленного после сжатия изображения текста.
Description:	Methods are in-process examined classifications, applied at the compression of file with the bi-tonal image of photo-typograph got scan-out or digital photographing. The special attention applies on the in-use here measures of distinction of two images of characters, abstracted from the image of text. These measures of distinction allow with one or another degree of confidence to count characters on the compared images or consilient, or different. For the algorithms of classification known to date, including the known algorithm of JB2 well, quantitative descriptions of classification – number of classes, got these algorithms for the image of standard page of text are resulted. What less than it is a number, quality of classification is considered that higher, because gives the best compression of file with the image of text. The methods of acceleration of algorithms, classifying the images of characters, and increases of easy-to-readness of the text recovered after the compression of image are considered also.
URI:	http://dspace.nlu.edu.ua/handle/123456789/12525
Appears in Collections:	Монографії кафедри криміналістики

Files in This Item:

File	Description	Size	Format
Lomonosov_mon_418-433.pdf		1.46 MB	Adobe PDF	View/Open

Show full item record