Как технологии OCR и HTR для армянского языка могут помочь сохранить наследие
DOI:
https://doi.org/10.52027/18294685-cvo2023.spКлючевые слова:
Армянские архивы, распознавание рукописного текстаАннотация
OCR (оптическое распознавание символов) и HTR (распознавание рукописного текста) теперь готовы для применения для армянского языка. Эта технология может обеспечить большую валоризацию документов, обеспечивая улучшенную доступность, используя, например, поиск, по ключевым словам, и может продиктовать новые вызовы цифровых библиотек. Цель доклада – представляя современные вызовы, возникшие при процессе распознавании текста на армянском языке, представить нынешние возможности. Основное внимание будет уделено технологии, разработанной Калфой для рукописных архивов, древних рукописей и старопечатных книг. Представлены отзывы о трех наших текущих проектах: обработки каталога армянских рукописей мхитаристов Венеции, газет Фундаментальной библиотеки НАН РА и армянских писем мхитаристов. Методология, применяемая Калфой, обеспечивает точность более 98% для рукописных документов и более 99,9% для печатных документов.
