Лівія запускає свою першу національну мовну модель LibiGPT

3

Лівія представила LibiGPT, свою першу національно розроблену велику мовну модель (LLM). Створена компанією Smart Co для технологічних проектів і штучного інтелекту, ця система штучного інтелекту розроблена для усунення критичної прогалини в регіональних мовах ШІ. Модель представлена ​​в трьох версіях: LibiGPT-Base (7 млрд параметрів), LibiGPT-Instruct (13 млрд параметрів) і LibiGPT-Enterprise (34 млрд параметрів).

Подолання розриву штучного інтелекту в Лівії

Існуючі глобальні LLMs, такі як ChatGPT від OpenAI і Gemini від Google, борються з нюансами діалектів лівійської арабської мови та культурного контексту. LibiGPT навчається на величезному наборі даних літературної арабської (MSA) і північноафриканських діалектів, що дозволяє йому розуміти та створювати текст лівійською розмовною арабською (Daria), англійською та французькою мовами.

Чому це важливо: Запуск локалізованого LLM — це більше, ніж просто обробка мови. Це стосується ширшої проблеми надання ШІ доступності для громадськості, де існуючим моделям бракує достатньої культурної та мовної вірності. Для лівійських компаній, державних установ і освітніх установ LibiGPT пропонує індивідуальний ШІ, який відповідає національним пріоритетам.

Основні функції та розвиток

Проект LibiGPT включав:

  • Навчальні дані: Набір токенів вартістю кілька сотень мільярдів доларів із значним акцентом на арабській мові, отриманий із загальнодоступних наборів даних, академічних текстів, арабської Вікіпедії та ліцензованого вмісту.
  • Конвеєр оптимізації: Спеціальна арабська обробка, включаючи орфографічну нормалізацію, діалектну фільтрацію та покращену токенізацію.
  • Синтетичні дані: Створюйте високоякісні синтетичні дані арабською мовою для підвищення надійності, аргументації та можливостей перекладу.
  • Переклад: Точний переклад між арабською, англійською та французькою мовами з урахуванням місцевих культурних контекстів.

Команда розробників також надала пріоритет безпеці даних, зберігаючи всю інформацію локально відповідно до вимог суверенітету.

Дорожня карта майбутнього

За словами доктора Алі Османа Аль-Баджі, засновника та генерального директора Smart Co, майбутні плани включають:

  • Розширені контекстні вікна: Збільшена ємність моделі для обробки понад 200 000 токенів.
  • Спеціалізовані моделі: Розробка спеціалізованого ШІ для юридичного, фінансового, медичного та державного секторів.
  • Розширення діалектів: Покращене розуміння арабських діалектів у всьому регіоні.
  • Enterprise Solutions: Системи генерації, доповнені пошуком, оптимізовані для арабської мови.

Регіональна тенденція: національна розробка ШІ

LibiGPT є частиною зростаючої тенденції в регіоні Магрибу. Відсутність локалізованих мовних моделей історично обмежувала застосування штучного інтелекту місцевими громадами та не дозволяла урядам повністю використовувати штучний інтелект для державних послуг. Національні ініціативи зі штучного інтелекту впроваджуються в усьому регіоні, керуються як комерційним, так і академічним секторами.

Запуск LibiGPT знаменує собою значний крок у напрямку розширення доступності штучного інтелекту та суверенітету для Лівії відповідно до ширшого руху за пріоритетність локалізованих мовних моделей у Північній Африці.

Цей проект демонструє, що розробку штучного інтелекту можна пристосувати до унікальних мовних і культурних потреб конкретних регіонів, забезпечуючи більш актуальне та ефективне технологічне рішення.