Архивы мінцифра - IT Технологии

Україна навесні 2026 року планує розпочати бета-тестування власної національної великої мовної моделі (LLM), навченої на українських даних.

Про це повідомив міністр цифрової трансформації Михайло Федоров.

За його словами, запуск LLM є одним із ключових кроків для досягнення стратегічної мети — входження України до топ-3 країн світу за розвитком штучного інтелекту.

Розробку національної мовної моделі фінансує «Київстар», який виступає технічним партнером проєкту. Після завершення розробки модель передадуть у власність держави.

Навчання LLM відбувається на основі сімейства моделей Gemma від Google, стратегічного партнера України, з подальшою адаптацією під українську мову та національний контекст.

Якість моделі перевірятиме група незалежних експертів із різних галузей. Вони тестуватимуть LLM за кількома критеріями, зокрема технічною якістю, етичністю, безпекою для користувачів, рівнем володіння українською мовою та розумінням українського контексту.

Наразі проєкт перебуває на етапі збору даних для навчання моделі. За словами Федорова, для цього залучають не лише відкриті джерела, а й масиви інформації від державних органів, медіа, університетів та інших інституцій.

Набір даних включатиме матеріали понад 90 держустанов, зокрема судових реєстрів, освітніх видавництв, регіональних архівів і документів про злочини росії під час війни.

Паралельно розробляється юридичний фреймворк для відповідальної роботи з цими даними.

Читайте также: Threads тестує мініігри в чатах — таким чином платформа збирається обійти X та Bluesky

Також експертна група створює спеціальні бенчмарки — тести, які дозволять системно оцінювати якість, ефективність і безпеку мовної моделі.

Очікується, що вже в січні 2026 року команда матиме першу базу текстів для тренування LLM, удосконалений токенізатор для обробки української мови та власні інструменти оцінки якості моделі.

Назву для національної мовної моделі оберуть самі українці — голосування планують запустити в застосунку «Дія» в січні.

Більше про український ШІ

У листопаді 2025 року Україна та NVIDIA запустили спільну ініціативу для створення суверенного штучного інтелекту та розвиток державної ШІ-інфраструктури.

Проєкт стане продовженням AI Factory — державної ШІ-платформи на базі рішень NVIDIA, яку вже почали запускати в Україні. Нова ініціатива має посилити технологічну незалежність держави та захист даних, що уряд називає питанням національної безпеки.

1 грудня стало відомо, що Міністерство цифрової трансформації та «Київстар» обрали Gemma 3 від Google як базову модель для створення національної української великої мовної моделі (LLM).

https://ain.ua/2026/01/07/beta-ukrayinskoyi-llm-navesni/

Метка: мінцифра

Українська LLM запрацює навесні 2026 року в бета-режимі

Більше про український ШІ