Как технологии OCR и HTR для армянского  языка могут помочь сохранить наследие

Авторы

  • ШААН ВИДАЛ-ГОРЕН «Калфа» технологически центр Автор

DOI:

https://doi.org/10.52027/18294685-cvo2023.sp

Ключевые слова:

Армянские архивы, распознавание рукописного текста

Аннотация

OCR (оптическое распознавание символов) и HTR (распознавание рукописного текста) теперь готовы для применения для армянского языка. Эта технология может обеспечить большую валоризацию документов, обеспечивая улучшенную доступность, используя, например, поиск, по ключевым словам, и может продиктовать новые вызовы цифровых библиотек. Цель доклада – представляя современные вызовы, возникшие при процессе распознавании текста на армянском языке, представить нынешние возможности. Основное внимание будет уделено технологии, разработанной Калфой для рукописных архивов, древних рукописей и старопечатных книг. Представлены отзывы о трех наших текущих проектах: обработки каталога армянских рукописей мхитаристов Венеции, газет Фундаментальной библиотеки НАН РА и армянских писем мхитаристов. Методология, применяемая Калфой, обеспечивает точность более 98% для рукописных документов и более 99,9% для печатных документов.

Биография автора

  • ШААН ВИДАЛ-ГОРЕН, «Калфа» технологически центр

    Видал-Горен Шаан является президентом и основателем технологического центра «Калфа», стартапа, специализи рующегося на распознавании документов и разработке интеллектуальных систем, предназначенных для специалистов и 
    учреждений, занимающихся культурным наследием (OCR и 
    HTR для восточных языков). «Калфа» активно участвует в нескольких текущих проектах по армянскому языку в Армении, Франции и Венеции.

first page of the article

Опубликован

2023-11-11

Как цитировать

Как технологии OCR и HTR для армянского  языка могут помочь сохранить наследие. (2023). Вестник библиотек Армении, 6(1), 61-65. https://doi.org/10.52027/18294685-cvo2023.sp

Похожие статьи

1-10 из 40

Вы также можете начать расширеннвй поиск похожих статей для этой статьи.