Про старт кампанії зі збору матеріалів повідомили Міністерство економіки України.

Читайте также: Sense Bank запустив нову флагманську картку: власні кошти та кредитний ліміт в одному продукті

До співпраці запрошують бібліотеки, музеї, державні та приватні архіви, а також заклади освіти — від шкіл до університетів, які можуть надати для оцифрування екзаменаційні роботи, домашні завдання чи студентські конспекти. Крім того, долучитися можуть громадські організації та звичайні українці, які зберігають удома сімейні архіви, старі листи, щоденники чи нотатки.

Розробники наголошують, що ефективність моделей напряму залежить від різноманітності даних: чим більше епох, джерел та унікальних стилів письма потрапить до бази, тим сильнішою стане екосистема рішень для автоматичного розпізнавання українських текстів. Організатори повністю беруть на себе технічний процес оцифрування та обробки наданих матеріалів.

Читайте также: Roboneers випустила оновлений безпілотник-ретранслятор WARDOG TRN для роботи в умовах щільного РЕБ

Юридичний супровід ініціативи забезпечує Український католицький університет (УКУ), який виступає публікатором бази даних. Після формування датасет буде опубліковано у відкритому доступі за ліцензією CC BY-NC-SA 4.0 з обов’язковим зазначенням усіх джерел та авторів.

Раніше радник зі штучного інтелекту в Мінекономіки Дмитро Войтех у подкасті AI&I розповів, що ініціатива дасть змогу суттєво пришвидшити цифровізацію державних послуг і відкриє шлях до глобального оцифрування історичних архівів.

Читайте также: Рекордне обчислення числа Пі: технологічні компанії вирахували його до 340-трильйонного знака

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *