Як пояснює Мінцифри, щоб національна мовна модель «Сяйво» стала надійним джерелом інформації, її навчають на українських даних. Базою для цього стануть 10 терабайтів матеріалів Укрдержархів, що за обсягом дорівнює 70 000 книжок.
Читайте также: Група Nova планує запустити банк фінансової інклюзії та готова вкласти понад $10 млн
«Ми маємо великий масив даних різних історичних епох, друкованих та рукописних, українською та іншими мовами. До кінця 2026 року кількість цифрових копій держархівів збільшаться із 150 млн до понад 200 млн — це один із найвищих у світі темпів оцифрування архівної спадщини», — зауважив Анатолій Хромов, голова Укрдержархіву.
Наразі триває процес збору унікальних даних для «Сяйва». Свої матеріали надають вже понад 50 партнерів, серед яких медіа, університети, бібліотеки тощо.
Читайте также: Anthropic розглядає створення власних ШІ-чипів на тлі дефіциту обчислювальних потужностей і зростання витрат
«Щойно модель запрацює, ми оприлюднимо повний перелік інституцій та людей, які допомогли створити національний український ШІ», — додали у міністерстві.
Читайте также: Реліз моделі ШІ Claude Mythos налякав Мінфін США
