«Національна LLM стане базою для створення ШІ-помічників у держсекторі та бізнесі. Це будуть українські аналоги Gemini та ChatGPT: такі ж зручні та технологічні, але навчені на наших реаліях і контексті», — зазначили в Мінцифри.
Читайте также: Український айтівець створив застосунок Clip Lens, який дозволяє робити «Copy/Paste інформації з реального світу»
В міністерстві зазначили, що чекають над від представників бізнесу, освіти, науки та культури.
«Якщо у вас є якісні тексти українською — ви нам потрібні. Ваш контент стане фундаментом для національного ШІ, який даватиме відповіді мільйонам українців», — говорять розробники.
Для тренування національної LLM потрібні:
- Медіа: новини, інтерв’ю, блоги, публіцистика.
- Наука та освіта: контент курсів, підручники, наукові роботи, дисертації.
- Література: художні твори, критика, рецензії.
- Історія: оцифровані архівні матеріали.
- Бізнес-дані: технічна документація, описи товарів, відкриті відгуки, матеріали корпоративних блогів.
За задумом розробників ЗМІ та видавництва зададуть «еталон мовної грамотності та стилю» для нейромережі. Університети та науковці сформують інтелектуальну базу моделі, а бізнес — допоможе моделі краще розуміти специфіку ринку та індустрій завдяки технічній документації та аналітиці.
«Ми розуміємо цінність вашої інтелектуальної власності. Тому підготували прозорі юридичні умови, щоб ваші матеріали були захищені й працювали винятково на посилення українського ШІ. Усіх партнерів, які зроблять внесок у розвиток технології, ми офіційно відзначимо в підсумковому звіті про розробку національної моделі», — запевнили у Мінцифри.
Читайте также: Міноборони перевело постачання дронів для Сил оборони в систему DOT-Chain Arsenal
Повідомити про дані, які можна надати для тренування національної LLM, можна у короткій формі за посиланням.
Раніше стало відомо, що запуск національної LLM перенесли на весну 2026 року, оскільки Мінцифри стикнулося з проблемою збору даних, яка складається з двох частин: юридичної та технічної.
«Нині триває найважливіша частина роботи — збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами й іншими інституціями — це терабайти унікальних даних», — розповідав вже колишній очільник Мінцифри, а нині міністр оборони, Михайло Федоров.
https://dev.ua/news/mintsyfry-proponuie-podilytysia-danymy-z-natsionalnoiu-llm-1769587441
Читайте также: «Ми тут надовго». Британська компанія Windracers розгорнула в Україні команду підтримки для своїх дронів ULTRA
