Libia wprowadza swój pierwszy narodowy model wielkiego języka, LibiGPT

26

Libia wprowadziła LibiGPT, swój pierwszy opracowany na szczeblu krajowym model dużego języka (LLM). Ten system sztucznej inteligencji, stworzony przez firmę Smart Co na potrzeby projektów technologicznych i sztucznej inteligencji, ma na celu wypełnienie krytycznej luki w sztucznej inteligencji w językach regionalnych. Model prezentowany jest w trzech wersjach: LibiGPT-Base (7 miliardów parametrów), LibiGPT-Instruct (13 miliardów parametrów) i LibiGPT-Enterprise (34 miliardy parametrów).

Wypełnianie luki w sztucznej inteligencji w Libii

Istniejące globalne LLM, takie jak ChatGPT OpenAI i Gemini Google, zmagają się z niuansami dialektów libijskiego języka arabskiego i kontekstu kulturowego. LibiGPT jest przeszkolony w oparciu o ogromny zbiór danych literackiego języka arabskiego (MSA) i dialektów Afryki Północnej, co pozwala mu rozumieć i generować tekst w języku libijskim, mówionym po arabsku (Daria), angielskim i francuskim.

Dlaczego to ma znaczenie: Prowadzenie zlokalizowanego LLM to coś więcej niż tylko przetwarzanie języka. Dotyczy to szerszej kwestii udostępniania sztucznej inteligencji społeczeństwu, w przypadku gdy istniejącym modelom brakuje wystarczającej wierności kulturowej i językowej. Libijskim przedsiębiorstwom, agencjom rządowym i organizacjom edukacyjnym LibiGPT oferuje dostosowaną do indywidualnych potrzeb sztuczną inteligencję, która jest zgodna z priorytetami krajowymi.

Kluczowe funkcje i rozwój

Projekt LibiGPT obejmował:

  • Dane szkoleniowe: Warty wieleset miliardów dolarów zestaw tokenów ze znacznym naciskiem na język arabski, pochodzący z publicznych zbiorów danych, tekstów akademickich, arabskiej Wikipedii i treści licencjonowanych.
  • Plan optymalizacji: Niestandardowe przetwarzanie w języku arabskim, w tym normalizacja ortograficzna, filtrowanie dialektów i ulepszona tokenizacja.
  • Dane syntetyczne: Generuj wysokiej jakości syntetyczne dane w języku arabskim, aby poprawić niezawodność, możliwości wnioskowania i tłumaczenia.
  • Tłumaczenie: Dokładne tłumaczenie pomiędzy językiem arabskim, angielskim i francuskim, uwzględniające lokalne konteksty kulturowe.

Zespół programistów nadał również priorytet bezpieczeństwu danych, przechowując wszystkie informacje lokalnie zgodnie z wymogami suwerenności.

Przyszła mapa drogowa

Według dr Ali Osmana Al-Baji, założyciela i dyrektora generalnego Smart Co, plany na przyszłość obejmują:

  • Rozszerzone okna kontekstowe: Zwiększona pojemność modelu do obsługi ponad 200 000 tokenów.
  • Modele specjalistyczne: Rozwój wyspecjalizowanej sztucznej inteligencji dla sektora prawnego, finansowego, medycznego i rządowego.
  • Rozwój dialektów: Lepsze zrozumienie dialektów arabskich w całym regionie.
  • Rozwiązania dla przedsiębiorstw: Systemy generacji, uzupełnione wyszukiwaniem, zoptymalizowane dla języka arabskiego.

Trend regionalny: krajowy rozwój sztucznej inteligencji

LibiGPT wpisuje się w rosnący trend w regionie Maghrebu. Brak zlokalizowanych modeli językowych w przeszłości ograniczał wdrażanie sztucznej inteligencji do społeczności lokalnych i uniemożliwiał rządom pełne wykorzystanie sztucznej inteligencji w usługach rządowych. W całym regionie trwają obecnie krajowe inicjatywy dotyczące sztucznej inteligencji, napędzane zarówno przez sektor komercyjny, jak i akademicki.

Uruchomienie LibiGPT stanowi znaczący krok w kierunku zwiększenia dostępności sztucznej inteligencji i suwerenności Libii, zgodnie z szerszym ruchem na rzecz priorytetowego traktowania zlokalizowanych modeli językowych w Afryce Północnej.

Projekt ten pokazuje, że rozwój sztucznej inteligencji można dostosować do unikalnych potrzeb językowych i kulturowych konkretnych regionów, zapewniając bardziej odpowiednie i skuteczne rozwiązanie technologiczne.