Деловой, научно-технический журнал

Цифровая реставрация исторических документов

Международная группа ученых-компьютерщиков из Италии, Великобритании и Пакистана разработала компьютерный алгоритм, позволяющий виртуально вернуть документы в более разборчивое и поддающееся расшифровке состояние. В своей исследовательской статье «Реставрация и анализ содержания древних рукописей с помощью сегментации на основе цветового пространства», опубликованной в журнале PLOS ONE, учёные подробно описывают метод цифровой реставрации и результаты экспериментов.

Чтение старых или древних документов, даже в хорошем состоянии, может потребовать от читателя стать криптологом. Не столько потому, что автор намеренно старался что-то скрыть в своих текстах, а скорее потому, что сочетание грамотности писателя, разборчивости почерка, стиля письма, устаревших орфографических и грамматических правил или специальных сокращений для экономии места может сделать даже родной язык незнакомым.

Если к этому добавить обесцвечивание чернил со временем, расширение букв из-за воздействия влаги, то задача усложняется многократно.

Одной из главных особенностей представленного метода является использование цвета. Типичная цифровая реконструкция преобразует документ в черный текст на белом фоне, пытаясь выявить текст с помощью фильтрации шума и повышения контрастности.

В цветовом методе изображение требует гораздо больше усилий по восстановлению, при этом сохраняя большую часть внешнего вида и виртуального ощущения исходного документа.

Исследователи применили сложную интеграцию нескольких цифровых методов интерпретации цвета и смешанных моделей Гаусса, чтобы идентифицировать и разделить особенности текста, бумаги и артефактов. Это позволило избирательно извлекать различные уровни информации на основе тонких спектральных различий. Таким образом, пользователь мог решить, являются ли набросанные примечания, оформление страницы, печать, пятна различной формы или другие особенности важными для понимания документа.

В некоторых случаях этот метод может сохранить особенности, которые в противном случае были бы потеряны, такие как слабые водяные знаки производителя бумаги, которые могут дать историкам важную информацию. Например, известные работы Леонардо да Винчи, которые сохранились в замечательном состоянии и не участвовали в текущем исследовании, написаны на страницах с водяными знаками от различных поставщиков бумаги, что позволило историкам документов сгруппировать их в вероятные группы периодов написания.

Согласно статье, обработка может быть выполнена на стандартном настольном компьютере (Core i5, 4 ГБ ОЗУ, Windows 10). Алгоритму требуется всего несколько минут, чтобы виртуально восстановить документ до большей читаемости. Такой уровень удобства использования сделал бы его отличным инструментом не только для исследователей исторических документов, но и для людей, пытающихся расшифровать старые семейные рецепты.

Примеры изображений цветных документов: Входное изображение в ухудшенном состоянии (верхний ряд), восстановленное изображение предложенным способом (нижний ряд).

Источник

Наши партнёры

    

 

   

 

   

  

  

   

 

Вход на сайт