Мінекономіки та Держархів навчають ШІ, щоб розпізнати «почерк лікарів»

Деталями цієї ініціативи поділився ML Lead застосунку «Мрія» та радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I. За словами Войтеха, ініціатива дасть змогу суттєво пришвидшити цифровізацію державних послуг і відкриє шлях до глобального оцифрування історичних архівів.

Ідея створення національного дата-сету народилася під час роботи над проєктом «єДозвіл», який має на меті перевести видачу ліцензій для підприємців у цифровий формат через «Дію». Для автоматизації цього процесу алгоритмам потрібно аналізувати документи заявників.

Проте виявилося, що для отримання багатьох ліцензій необхідно завантажувати старі дипломи (подекуди ще з 90-х років), які часто заповнені від руки, погано сфотографовані або мають дефекти. За словами Дмитра Войтеха, готові OCR-рішення (системи оптичного розпізнавання символів), які існують на ринку, виявилися абсолютно безсилими перед українськими рукописами.

«Ми стикнулися з тим, що дуже недобре працює на українських рукописах, особливо враховуючи, що наші перші ліцензії пов’язані з медичними послугами. Ми всі розуміємо, як виглядає шрифт наших любих лікарів», — розповів Войтех про проблематику українських рукописних текстів.

Зіткнувшись із цією проблемою, розробники зрозуміли, що у відкритому доступі просто немає якісних і розмічених корпусів українського рукописного тексту. Щоб не чекати роками, поки система «єДозвіл» самостійно накопичить достатню кількість даних, Мінекономіки використало свій авторитет для об’єднання зусиль з іншими державними структурами.

Найбільшим партнером ініціативи став Державний архів України. Ця установа має колосальний інтерес у розвитку технології, адже їхня стратегічна мета — оцифрувати мільйони сторінок історичних документів. Замість того щоб годинами шукати інформацію фізично, як це відбувається зараз, якісна ШІ-модель дозволить перетворити архіви на зручну базу знань, де шукати інформацію можна буде так само легко, як у пошуковику.

Мінекономіки та Держархів навчають ШІ, щоб розпізнати «почерк лікарів»

Відadmin

Від admin

Пов’язаний запис

Anthropic запустила Claude for Teachers — безкоштовний доступ до преміум-можливостей Claude для американських вчителів

Українську мовну модель «Сяйво» почали тестувати в закритому режимі

Anthropic терміново блокує доступ до своїх флагманських ШІ-моделей Fable 5 і Mythos 5 на вимогу уряду США

Залишити відповідь Скасувати коментар

Ви пропустили

Google працює над новим ШІ-процесором Frozen v2 для прискорення Gemini

Український військовий розробив програму для роботи з координатами — миттєва конвертація, швидкий перегляд та масові позначки. Як працює система «Степан»

Resist.UA запускає новий фонд для оборонки обсягом 50 млн євро. Що про нього відомо

Український healthtech-стартап Tayra AI залучив $500 000. Серед інвесторів — Farmak. Яке рішення він пропонує клієнтам