Qu’est-ce que l’IA générative ?
Définition et enjeux pour les organisations
Fonctionnement de l’IA générative et exemples d’applications concrètes
L'IA générative (GenAI) prend des données existantes, en tire des enseignements, puis génère des données présentant des caractéristiques similaires. Par exemple, elle peut générer du texte, des images, de la vidéo, du son et du code informatique.
L'IA générative change le monde
Les systèmes traditionnels d'IA et de machine learning reconnaissent des tendances dans les données pour faire des prédictions. Mais l'intelligence artificielle générative va au-delà de la prédiction – elle génère de nouvelles données comme principal résultat. Imaginez pouvoir recevoir le texte intégral d'un discours quelques secondes seulement après avoir donné à un chatbot (ou un autre outil comme ChatGPT) quelques mots pour décrire votre idée. Générer de la musique, de l'art ou des images à partir de descriptions textuelles. Ou encore élaborer une stratégie commerciale par le biais d'une conversation, d'un dialogue avec un outil d'IA générative. Bloomberg Intelligence a constaté que la GenAI pourrait devenir un marché de 1,3 billion de dollars d'ici à 2032.
Applications d'IA générative dans le monde réel
L'IA générative devrait remodeler notre avenir de manière prévisible et inimaginable. Dans cette vidéo explicative, vous découvrirez des exemples concrets d'IA générative couvrant différents secteurs et cas d'usage, et utilisant de grands modèles de langage (LLM), la génération de données synthétiques et les jumeaux numériques. Vous apprendrez également certaines considérations et risques importants liés à l'adoption de la technologie de l'IA générative, notamment les biais, les hallucinations, la confidentialité des données et la sécurité.
L'évolution de l'IA générative
Bien qu'elle ait pris le monde d'assaut, l'IA générative n'est pas nouvelle – elle est construite à partir de technologies que nous utilisons depuis des décennies, notamment l'IA, le machine learning et les méthodes statistiques. Les origines de l'IA générative pourraient remonter plus loin, mais nous commencerons par 1966 et un chatbot nommé ELIZA.
Joseph Weizenbaum a conçu ELIZA pour imiter les psychothérapeutes Rogeriens qui reflètent ce que dit le patient. Pour ce faire, ELIZA a eu recours à la recherche de tendances. ELIZA a été l'un des premiers programmes à tenter le test de Turing – un jeu d'imitation qui teste la capacité d'une machine à adopter un comportement intelligent comme celui d'un être humain.
Avec l'évolution des méthodes d'analyse des données textuelles non structurées, les années 1970 à 1990 ont vu se développer les réseaux sémantiques, les ontologies, les réseaux neuronaux récurrents, etc. De 2000 à 2015, la modélisation linguistique et les intégrateurs de mots se sont améliorés, et Google Translate a vu le jour.
En 2014, Ian Goodfellow et ses collègues ont mis au point le réseau contradictoire génératif (GAN), en mettant deux réseaux neuronaux en concurrence (c'est-à-dire en les entraînant) l'un contre l'autre. Un réseau générait des données tandis que l'autre tentait de déterminer si les données était réelles ou fausses. Les modèles Transformer ont été introduits en 2017. Ils comprennent un mécanisme d'auto-attention qui leur permet d'évaluer l'importance des différentes parties de l'entrée lorsqu'ils font des prédictions. Des architectures telles que BERT et ELMo sont également devenues populaires.
Les modèles de transformateurs génératifs pré-entraînés (GPT) sont apparus ensuite, le premier modèle GPT étant arrivé en 2018. Ce modèle génératif a été entraîné sur de grandes quantités de données textuelles provenant d'internet. Avec 117 millions de paramètres, il a commencé à générer du texte dont le style et le contenu étaient similaires à ceux des données d'entraînement. En 2023, les modèles GPT à langage étendu avaient évolué au point de pouvoir donner de bons résultats lors d'examens difficiles, comme l'examen du barreau.
L'IA générative dans le monde d'aujourd'hui
Qui utilise l'IA générative ?
L'IA générative couvre un large éventail d'industries et de fonctions commerciales à travers le monde. Alors qu'elle gagne en popularité et suscite le développement d'une gamme d'assistants IA spécialisés, cette technologie suscite à la fois l'enthousiasme et la crainte chez les particuliers, les entreprises et les entités gouvernementales. Voyons comment certains secteurs utilisent la GenAI aujourd'hui.
Les résultats de l'IA générative sont, au fond, le reflet de nous, les humains. ... Les consommateurs doivent continuer à faire preuve d'esprit critique lorsqu'ils interagissent avec l'IA conversationnelle et éviter les préjugés liés à l'automatisation (la croyance qu'un système technique est plus susceptible d'être précis et vrai qu'un humain).Reggie Townsend VP of the SAS Data Ethics Practice
Considérations éthiques relatives à l'utilisation de l'IA générative dans les entreprises
En tant que technologie perturbatrice, l'impact de l'IA générative a été comparé à des découvertes telles que l'électricité et l'imprimerie. Avec le potentiel de stimuler considérablement la productivité, les modèles d'IA conversationnelle ont connu une popularité fulgurante, tout en soulevant des inquiétudes concernant l'éthique de l'IA, la confidentialité des données, la précision, les hallucinations et les préjugés. En raison de ses fonctionnalités évolutives qui imitent l'intelligence humaine, la GenAI a suscité des vagues d'anxiété d'IA et déclenché des débats sur la manière dont elle devrait être utilisée et gouvernée.
Découvrez pourquoi il est essentiel d'adopter des systèmes d'IA dignes de confiance, conçus pour être centrés sur l'humain, inclusifs et responsables.
Comment fonctionne l'IA générative
Parmi les exemples populaires de technologies d'IA générative, on peut citer DALL-E, un système de génération d'images à partir de textes, ChatGPT (un système de génération de textes), le chatbot Google Bard et le moteur de recherche Bing de Microsoft alimenté par l'IA. Un autre exemple est l'utilisation de l'IA générative pour créer une représentation numérique d'un système, d'un processus commercial ou même d'une personne – comme une représentation dynamique de l'état de santé actuel et futur d'une personne.
Il existe trois grands types de technologies génératives (les jumeaux numériques, les grands modèles de langage et la génération de données synthétiques).
De nombreuses autres technologies permettent et soutiennent l'IA générative :
Un algorithme est une liste d'instructions étape par étape conçues pour accomplir une tâche spécifique ou résoudre un problème. De nombreux programmes informatiques sont une séquence d'algorithmes écrits d'une manière que l'ordinateur peut comprendre. Alors que les algorithmes commencent à compléter ou à remplacer les décisions humaines, nous devons nous interroger sur leur équité et exiger la transparence sur la manière dont ils sont développés.
L'intelligence artificielle permet aux machines d'apprendre par l'expérience, de s'adapter à de nouvelles données et de réaliser des tâches humaines. L'IA s'appuie souvent sur le deep learning et le langage naturel. Grâce à ces technologies, il est possible de former des ordinateurs à effectuer des tâches spécifiques en traitant de grandes quantités de données et en dégageant des tendances.
La gestion des données est essentielle pour garantir des résultats de confiance, éthiques et sans biais. Cela est particulièrement crucial pour les tâches d'IA, de machine learning et les grands modèles de langage (LLM) qui sont entraînés sur d'énormes ensembles de données, puis utilisés pour comprendre et générer du contenu.
Le deep learning est un sous-ensemble du machine learning qui permet d'entraîner un ordinateur à effectuer des tâches comme un humain, telles que la reconnaissance vocale, l'identification d'images et la réalisation de prédictions. Il améliore la capacité à classer, à reconnaître, à détecter et à décrire en utilisant des données. Les modèles de deep learning tels que les GAN et les auto-encodeurs variationnels (VAE) sont entraînés sur d'énormes ensembles de données et peuvent générer des données de haute qualité. Des techniques plus récentes comme les StyleGAN et les modèles transformateurs sont performants dans la création de vidéos, d'images, de textes et de paroles réalistes.
Le machine learning est une méthode d'analyse des données qui automatise la construction de modèles analytiques. C'est une branche de l'intelligence artificielle qui apprend à une machine à apprendre. Le machine learning repose sur l'idée que les systèmes peuvent apprendre des données, identifier des tendances et prendre des décisions avec un minimum d'intervention humaine.
Le traitement du langage naturel est une branche de l'intelligence artificielle qui aide les ordinateurs à comprendre, interpréter et manipuler le langage humain. Le NLP s'appuie sur de nombreuses disciplines, notamment l'informatique et la linguistique informatique, pour combler le fossé entre la communication humaine et la compréhension informatique.
Les réseaux neuronaux sont des systèmes informatiques dont les nœuds interconnectés fonctionnent comme les neurones du cerveau humain. Les réseaux neuronaux utilisent des algorithmes pour reconnaître les tendances cachées et les corrélations dans les données brutes, les regrouper et les classer. Ils apprennent et s'améliorent continuellement au fil du temps.
On parle d'apprentissage par renforcement lorsqu'un algorithme découvre, au fil d'essais et d'erreurs, les actions qui produisent les meilleures récompenses. En tant que modèle de machine learning, l'apprentissage par renforcement s'appuie sur un signal de récompense pour son mécanisme de retour d'information, car il apprend progressivement la meilleure politique ou le meilleur objectif (ou le plus gratifiant). Il est souvent utilisé pour la robotique, les jeux et la navigation.
Mise en œuvre de modèles d'IA générative
L'exécution des modèles est coûteuse, car elle nécessite d'énormes quantités de puissance de calcul et de données. Il convient d'évaluer soigneusement le retour sur investissement avant de mettre en oeuvre un modèle d'IA générative et de tenir compte des distinctions entre les différents types de modèles, tels que les modèles de base et les modèles de domaine. Il existe également des considérations éthiques. D'où viennent les données et à qui appartiennent-elles ? Sont-elles dignes de confiance ? Comprenez-vous précisément comment le modèle a été construit ?
5 étapes pour affiner un modèle
L'IA générative s'appuie sur de nombreux algorithmes et technologies d'IA différents pour générer des données dont les distributions probabilistes et les caractéristiques sont similaires à celles des données à partir desquelles elle apprend. Plutôt que de partir de zéro, vous pouvez suivre les cinq étapes suivantes pour affiner un modèle de langage fondamental pré-entraîné.
1. Définir la tâche.
Choisissez un modèle approprié de langage large pré-entraîné et définissez clairement la tâche pour laquelle il doit être ajusté. Il peut s'agir de la classification de textes (à savoir la reconnaissance d'entités), de la génération de textes, etc.
2. Préparer les données.
Rassemblez et pré-traitez les données spécifiques à votre tâche – pour des tâches telles que l'étiquetage, la mise en forme et la tokenisation. Créez des ensembles de données d'entraînement et de validation (et éventuellement de test).
3. Affiner le modèle.
Entraînez le modèle modifié sur les données spécifiques à votre tâche, en utilisant l'ensemble de données d'entraînement pour mettre à jour le poids du modèle. Surveillez les performances du modèle sur l'ensemble de données de validation afin d'éviter tout surajustement.
4. Évaluer et tester.
Après la formation, évaluez votre modèle affiné sur l'ensemble de validation, en procédant aux ajustements nécessaires en fonction des résultats. Une fois satisfait, testez le modèle sur l'ensemble de test afin d'obtenir une estimation impartiale des performances.
5. Déployer le modèle.
Lorsque vous avez confiance dans les performances du modèle, déployez-le pour l'utilisation prévue. Il peut s'agir d'intégrer le modèle dans une application IA, un site web ou une autre plateforme.
