La Libye a dévoilé LibiGPT, son premier grand modèle linguistique (LLM) développé au niveau national. Créée par Smart Co pour les projets technologiques et l’intelligence artificielle, l’IA est conçue pour combler une lacune critique dans l’IA des langues régionales. Le modèle se décline en trois versions : LibiGPT-Base (7 milliards de paramètres), LibiGPT-Instruct (13 milliards de paramètres) et LibiGPT-Enterprise (34 milliards de paramètres).
Combler le fossé de l’IA en Libye
Les LLM mondiaux existants tels que ChatGPT d’OpenAI et Google Gemini ont du mal à gérer les nuances des dialectes arabes libyens et du contexte culturel. LibiGPT est formé sur un ensemble de données massif comprenant l’arabe moderne standard (MSA) et les dialectes nord-africains, lui permettant de comprendre et de générer du texte en arabe familier libyen (dārija), en anglais et en français.
Pourquoi est-ce important : Le lancement d’un LLM localisé ne concerne pas seulement le traitement du langage. Il aborde la question plus large de l’accessibilité de l’IA pour les populations où les modèles existants manquent de précision culturelle et linguistique. Pour les entreprises libyennes, les agences gouvernementales et les établissements d’enseignement, LibiGPT propose une IA personnalisable alignée sur les priorités nationales.
Principales fonctionnalités et développement
Le projet LibiGPT comprenait :
- Données de formation : Un corpus de plusieurs centaines de milliards de jetons avec une forte concentration sur l’arabe, provenant d’ensembles de données publics, de textes académiques, de Wikipédia arabe et de contenu sous licence.
- Pipeline d’optimisation : Traitement personnalisé de l’arabe, y compris la normalisation orthographique, le filtrage des dialectes et la tokenisation améliorée.
- Données synthétiques : Création de données synthétiques arabes de haute qualité pour améliorer la robustesse, le raisonnement et les capacités de traduction.
- Traduction : Traduction précise entre l’arabe, l’anglais et le français, adaptée aux contextes culturels locaux.
L’équipe de développement a également donné la priorité à la sécurité des données en stockant toutes les informations localement pour répondre aux préoccupations de souveraineté.
Feuille de route future
Selon le Dr Ali Othman Al-Baji, fondateur et PDG de Smart Co, les projets futurs comprennent :
- Fenêtres à contexte étendu : Augmentation de la capacité du modèle pour gérer plus de 200 000 jetons.
- Modèles spécifiques au domaine : Développement d’une IA spécialisée pour les secteurs juridique, financier, de la santé et gouvernemental.
- Expansion des dialectes : Amélioration de la compréhension des dialectes arabes dans la région.
- Solutions d’entreprise : Systèmes de génération de récupération augmentée optimisés pour l’arabe.
Tendance régionale : développement national de l’IA
LibiGPT s’inscrit dans une tendance croissante dans la région du Maghreb. Le manque de modèles linguistiques localisés a historiquement limité l’adoption de l’IA par les communautés locales et empêché les gouvernements d’exploiter pleinement l’IA pour les services publics. Des initiatives nationales en matière d’IA sont désormais en cours dans toute la région, portées par les secteurs commercial et universitaire.
Le lancement de LibiGPT marque une étape importante vers une plus grande accessibilité et souveraineté de l’IA pour la Libye, s’alignant sur un mouvement plus large visant à donner la priorité aux modèles linguistiques localisés en Afrique du Nord.
Le projet démontre que le développement de l’IA peut être adapté aux besoins linguistiques et culturels uniques de régions spécifiques, offrant ainsi une solution technologique plus pertinente et plus efficace.
