jeudi 21 novembre 2024
Accueil > A la UNE > Nouveauté dans l’intelligence artificielle en Algérie Création de Hadretna…

Nouveauté dans l’intelligence artificielle en Algérie Création de Hadretna…

Hadretna vise l’inclusion de tous les Algériens dans l’accès à l’information et à la communication quelque soit leur dialecte.

« Hadretna » est le nom donné au premier modèle d’intelligence artificielle générative en dialectes d’Algérie. Cet algorythme de traduction en ligne des différents dialectes parlés dans notre pays, a fait l’objet d’une conférence de présentation à Alger, en présence du Professeur Merouane Debbah. Ce dernier, en sa qualité de directeur scientifique du projet, a expliqué que « Hadretna » « est un LLM -Large Language Model, en anglais- algérien utilisant les différentes versions des dialectes nationaux dont la fameuse ‘’ « daridja », le « mouzabit… ». Ce programme informatique capable de prendre en charge les textes, les images et les vidéos est le fruit d’un travail de collaboration entre la start-up Fentech, opérant sous le nom Tamatech en Algérie, et le Professeur Debbah qui s’est dit « impressionné par le niveau de formation des jeunes en Algérie ». Construire cet LLM relève du défi rappelle le Professeur Debbah en précisant qu’il aura fallu six mois de travail sur ce projet dont la version 2 sera prête dans quelques mois, soit vers fin 2024. Au stade actuel, Hadretna est alimenté par 2 giga token de données collectées en ligne dans les trois alphabets : arabe, latin et tifinagh. « C’est là un projet en open source. il est le socle sur lequel les jeunes peuvent construire et profiter de l’ensemble des données collectées », ajoute le Professeur Debbah. À en croire les spécialistes présents à cette conférence de présentation, « Communiquer dans sa propre langue constitue un avantage certain dans le cyberespace et sur les réseaux sociaux », et le Professeur Debbah d’ajouter à ce propos : « Avec ‘’Hadretna‘’, notre vision consiste à créer un pont linguistique entre les différents dialectes parlés en Algérie permettant ainsi à tous ses habitants d’accéder à n’importe quelle information dans leur dialecte maternel. Nous souhaitons contribuer à l’inclusion numérique de tous les Algériens ». L’on rappelle par ailleurs que pour être performant, un LLM nécessite d’être entraîné sur une importante quantité de ressources textuelles. L’anglais représentant 45% du contenu aujourd’hui disponible sur Internet, les LLM les plus connus sont Chat GPT d’Open AI, Lama de Meta, Gemini de Google et ont donc été conçus en grande partie dans cette langue. Construire un LLM sur des dialectes disposant d’une documentation écrite limitée représente un défi technique majeur, souligne-t-on d’ailleurs. Le représentant du ministère des Start-up a, pour sa part, salué l’équipe de chercheurs pour leurs efforts tout en soulignant l’importance de cet évènement. « C’est là la preuve que nous pouvons nous approprier la technologie, aussi pointue soit-elle, et ne plus en être de simples consommateurs », a fait savoir le même responsable.

Mohammed Bessaïah