Мінцифра та Київстар обрали українську мовну модель Gemma

Ігор Коваленко
Автор:
Ігор Коваленко - Редактор новин міста
3 хв читання

Співпраця Мінцифри та Київстар

Мінцифра у співпраці з Київстар обрали українську версію мовної моделі Gemma для подальшої розробки та адаптації. Ця ініціатива стане фундаментом національної LLM-моделі, що розроблятиметься на потужностях цифрового оператора.

Вчора на конференції AI Ukraine 2024 представники міністерства та компанії публічно оголосили про вибір базової моделі. Gemma, яку розробила команда Google DeepMind, має відкритий код та ліцензію, що дозволяє використовувати її для комерційних проектів.

“Створення української мовної моделі — це не просто технологічний проект, а питання цифрового суверенітету,” — наголосив віцепрем’єр-міністр з питань цифрової трансформації Михайло Федоров під час виступу.

Технічна реалізація проєкту

Для тренування національної моделі Київстар задіє власний дата-центр у Києві. Компанія інвестувала понад 20 мільйонів гривень у розширення обчислювальної інфраструктури, встановивши додаткові графічні процесори NVIDIA H100.

За словами технічного директора Київстар Володимира Лутченка, розробники зосередяться на покращенні розуміння українського контексту та реалій. “Модель повинна коректно сприймати наші географічні назви, імена, культурні особливості,” — підкреслив він.

Перші результати роботи над адаптацією Gemma до української мови очікуються вже до кінця літа. На початковому етапі команда планує зібрати та підготувати близько 500 гігабайт високоякісних україномовних текстів для навчання моделі.

Безпека та розвиток проєкту

Експерти з кібербезпеки Держспецзв’язку вже проводять аналіз коду Gemma, щоб переконатися у відсутності потенційних загроз. “Безпека національної моделі — наш пріоритет,” — зазначив представник відомства Олексій Петренко.

Проєкт реалізується в рамках Національної стратегії розвитку штучного інтелекту. До роботи залучені фахівці з провідних українських університетів та IT-компаній. Вони адаптуватимуть модель під особливості української мови, включаючи морфологію та синтаксис.

Перспективи використання

У Мінцифрі підкреслюють, що розробка власної LLM дозволить створювати українські AI-сервіси в різних сферах — від освіти до державних послуг. Модель зможе обробляти запити українською мовою без необхідності перекладу, що значно пришвидшить взаємодію користувачів із системою.

Київстар планує використовувати адаптовану модель у власних цифрових продуктах, зокрема для покращення клієнтського сервісу та розробки нових послуг. Компанія також розглядає можливість відкриття API для українських стартапів та розробників.

Фахівці галузі відзначають, що вибір Gemma як базової моделі — обґрунтоване рішення. “Ця модель демонструє хороший баланс між якістю та вимогами до обчислювальних ресурсів,” — прокоментував ситуацію Андрій Гончарук, AI-дослідник з Київського політехнічного інституту.

Розвиток національної LLM-моделі на базі Gemma стане важливим кроком у зміцненні цифрової незалежності України та розширенні застосування штучного інтелекту в державному та приватному секторах.

Поділитися цією статтею
Редактор новин міста
Стежити:
Ігор — універсальний журналіст, який добре знає темп і ритм столиці. Він працює над щоденними оновленнями: від термінових новин та важливих подій до репортажів із вулиць Києва. Його матеріали охоплюють усе, що важливо киянам: транспорт, інфраструктура, рішення міської влади, соціальні ініціативи та події, що формують обличчя мегаполіса. Ігор працює, щоб донести правдиву, перевірену та зрозумілу інформацію кожному мешканцю столиці.
Коментарів немає

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *