«Національна LLM стане базою для створення ШІ-помічників у держсекторі та бізнесі. Це будуть українські аналоги Gemini та ChatGPT: такі ж зручні та технологічні, але навчені на наших реаліях і контексті», — зазначили в Мінцифри.

Читайте также: Український айтівець створив застосунок Clip Lens, який дозволяє робити «Copy/Paste інформації з реального світу»

В міністерстві зазначили, що чекають над від представників бізнесу, освіти, науки та культури.

«Якщо у вас є якісні тексти українською — ви нам потрібні. Ваш контент стане фундаментом для національного ШІ, який даватиме відповіді мільйонам українців», — говорять розробники.

Для тренування національної LLM потрібні:

  • Медіа: новини, інтерв’ю, блоги, публіцистика.
  • Наука та освіта: контент курсів, підручники, наукові роботи, дисертації.
  • Література: художні твори, критика, рецензії.
  • Історія: оцифровані архівні матеріали.
  • Бізнес-дані: технічна документація, описи товарів, відкриті відгуки, матеріали корпоративних блогів.

За задумом розробників ЗМІ та видавництва зададуть «еталон мовної грамотності та стилю» для нейромережі. Університети та науковці сформують інтелектуальну базу моделі, а бізнес — допоможе моделі краще розуміти специфіку ринку та індустрій завдяки технічній документації та аналітиці.

«Ми розуміємо цінність вашої інтелектуальної власності. Тому підготували прозорі юридичні умови, щоб ваші матеріали були захищені й працювали винятково на посилення українського ШІ. Усіх партнерів, які зроблять внесок у розвиток технології, ми офіційно відзначимо в підсумковому звіті про розробку національної моделі», — запевнили у Мінцифри.

Читайте также: Міноборони перевело постачання дронів для Сил оборони в систему DOT-Chain Arsenal

Повідомити про дані, які можна надати для тренування національної LLM, можна у короткій формі за посиланням.

Раніше стало відомо, що запуск національної LLM перенесли на весну 2026 року, оскільки Мінцифри стикнулося з проблемою збору даних, яка складається з двох частин: юридичної та технічної. 

«Нині триває найважливіша частина роботи — збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами й іншими інституціями — це терабайти унікальних даних», — розповідав вже колишній очільник Мінцифри, а нині міністр оборони, Михайло Федоров.

https://dev.ua/news/mintsyfry-proponuie-podilytysia-danymy-z-natsionalnoiu-llm-1769587441

Читайте также: «Ми тут надовго». Британська компанія Windracers розгорнула в Україні команду підтримки для своїх дронів ULTRA

Від admin

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *