Il suffit d'entrer une brève phrase pour que le système génère un essai complet ou une image complexe, sur la base de paramètres, même s'il n'a pas été spécifiquement entraîné à l'exécution de cette tâche précise ou à la génération d'une image de cette manière. Ce type d’intelligence artificielle est appelé modèle de fondation et est défini par sa capacité à créer un grand modèle d’intelligence artificielle formé sur une grande quantité de données non étiquetées à grande échelle résultant en un modèle qui peut être adapté à un large éventail de tâches bien spécifiques. Bien que le milieu universitaire ait eu tendance à privilégier le terme "modèle de fondation", nous pouvons aussi lire des noms comme modèle de langage de grande taille (Large Language Model en anglais) ou IA générative. 

Cette technologie a attiré récemment l'attention du monde entier notamment au travers d’agents conversationnels permettant aux utilisateurs de poser des questions ouvertes. Il existe une approche d’utilisation des modèles de fondation plus destinée aux entreprises ou institutions de recherche qui ont besoin d’avoir des modèles adaptés à leur domaine spécifique et de précision pour par exemple automatiser un certain nombre de processus métiers ou accélérer les découvertes scientifiques. En effet, entraîner son modèle de fondation sur Internet ne le rend pas vraiment expert d’un domaine, même s’il peut parfois paraître crédible aux yeux non experts d’un métier particulier. Si le potentiel de cette nouvelle vague d'IA suscite un enthousiasme croissant, la réalité est que travailler avec des modèles de fondation est extrêmement complexe. Le processus de bout en bout pour passer des données à un modèle fonctionnel prêt à être déployé peut nécessiter des semaines de travail manuel et souvent une puissance de calcul considérable. Pour exploiter véritablement le potentiel des modèles de fondation, il faut investir de manière significative dans l'ensemble des couches, et pas seulement dans les modèles eux-mêmes.

Les modèles de fondation vont considérablement accélérer l'adoption de l'IA dans les entreprises. La réduction des exigences en matière d'étiquetage permettra à ces dernières de se lancer beaucoup plus facilement.

Il est essentiel d'apporter la puissance des modèles de fondation à chaque entreprise dans un environnement Cloud hybride. Les cas d’usage ne manquent pas. Il est possible par exemple d’entraîner un modèle de fondation sur des documentations techniques (des manuels de machines, des catalogues de vente, des guides pratiques etc.) et utiliser ce modèle pour étiqueter un méli-mélo d’images via une IA réellement experte d’un domaine. Une collaboration avec la NASA montre l’importance de l’utilisation de ce type de modèle pour analyser des pétaoctets de texte (publications scientifiques, livres, etc.) et des données satellites afin de détecter des risques naturels, suivre les changements de la végétation et de l’habitat faunique pour la gestion des ressources naturelles. Cette approche permettra de répondre à des questions telles que : de quelle manière les aérosols impacteront le changement climatique ? Quelles sont les conséquences d’un feu de forêt sur la qualité de l’air ? Quel sera l'impact des fortes canicules de l'année dernière sur les rendements du maïs et du blé ?

Aujourd’hui, nous connaissons des structures détaillées pour seulement quelques millions de molécules sur les milliards potentiellement disponibles. Un modèle de fondation a montré sa capacité à déduire la structure des molécules à partir de représentations simples, ce qui permet de cribler plus rapidement et plus facilement des molécules pour de nouvelles applications ou de les créer à partir de zéro. Nous avons constaté que ce type de modèle pouvait distinguer les molécules par leur saveur, par exemple, ou par leur perméabilité de la barrière hémato-encéphalique, même si ces modèles n’ont jamais été informés de l’une ou l’autre propriété.

Un autre exemple est celui du projet Wisdom qui démontre le potentiel de transformation de ces modèles : les développeurs peuvent désormais utiliser des commandes en langage naturel pour déployer des applications web. Cela a le potentiel d'augmenter considérablement leur productivité, en étendant la puissance de l'assistance de l'IA à de nouveaux domaines comme la création de code à partir de commandes en langage naturel.

Nous pourrions citer encore de nombreux exemples mais il est clair que nous vivons une période passionnante pour la recherche dans le domaine de l'intelligence artificielle.


Source link