Le revirement d'OpenAI : pas de formation de GPT-4 avec les données des clients de l'API

openai-changements-de-confidentialite-6457d3fd3d25f-sej-760x400.png

Dans un changement significatif par rapport à ses pratiques précédentes, OpenAI a annoncé qu'il n'utilisera plus les données clients envoyées via ses API pour entraîner ses modèles linguistiques étendus, tels que le GPT-4.

La modification a été confirmée par Sam Altman, PDG de OpenAI, lors d'une récente interview avec CNBC.

Nouvelle approche d'OpenAI concernant les données utilisateur

La modification de la politique d'OpenAI a été mise en œuvre le 1er mars 2023, lorsque la société a discrètement mis à jour ses conditions d'utilisation pour refléter cet engagement envers la vie privée des utilisateurs.

Altman a précisé: "Les clients veulent clairement que nous n'utilisions pas leurs données pour notre formation, nous avons donc modifié nos plans: nous ne le ferons pas."

Les API, ou interfaces de programmation d'applications, sont des cadres technologiques qui permettent aux clients de se connecter directement au logiciel d'OpenAI.

Altman a déclaré qu'OpenAI n'utilise pas les données de l'API depuis "un certain temps", ce qui suggère que cette annonce officielle formalise une pratique existante.

Implications pour les clients professionnels

La décision d'OpenAI a des implications considérables, en particulier pour ses clients professionnels, qui incluent des géants tels que Microsoft, Salesforce et Snapchat.

Ces entreprises sont plus susceptibles d'utiliser les capacités de l'API d'OpenAI pour leurs opérations, il est donc particulièrement pertinent pour elles de prendre en compte la protection de la vie privée et des données.

Cependant, les nouvelles mesures de protection des données s'appliquent uniquement aux clients utilisant les services de l'API de la société. Les nouvelles conditions générales d'utilisation d'OpenAI précisent: "Nous pouvons utiliser du contenu provenant de services autres que notre API."

En tant que telles, d'autres formes d'entrée de données, par exemple du texte saisi dans le chatbot populaire ChatGPT, peuvent encore être utilisées par OpenAI à moins que les données ne soient partagées via l'API.

Impact plus large sur l'industrie

Le changement de politique d'OpenAI intervient alors que les industries font face aux impacts potentiels des grands modèles de langage, tels que le ChatGPT d'OpenAI, remplaçant le contenu traditionnellement créé par des humains.

Par exemple, la Writers Guild of America a récemment commencé une grève après l'échec des négociations entre la Guilde et les studios de cinéma. La Guilde plaidait pour des restrictions sur l'utilisation de ChatGPT d'OpenAI pour la création ou la réécriture de scénarios.

La décision d'OpenAI de ne pas utiliser les données des utilisateurs pour l'entraînement marque un moment crucial dans la conversation en cours sur la confidentialité des données et l'IA. Alors que les entreprises continuent d'explorer et de repousser les limites de la technologie de l'IA, veiller à la confidentialité des utilisateurs et maintenir la confiance resteront probablement au cœur de ces discussions.

L'évolution de ChatGPT : de GPT-3 à GPT-4

Il est important de noter que l'engagement d'OpenAI de ne pas utiliser les données des clients pour l'entraînement s'applique à son dernier modèle de langue, GPT-4, publié le 14 mars 2023.

GPT-4 a introduit plusieurs améliorations par rapport à son prédécesseur, GPT-3, dont une augmentation significative de la limite de mots (25 000 mots par rapport à la limite de 3 000 mots de ChatGPT), une plus grande fenêtre de contexte et une amélioration des capacités de raisonnement et de compréhension.

Une autre fonctionnalité remarquable de GPT-4 est sa multimodalité, c'est-à-dire sa capacité à comprendre et à inférer des informations à partir d'images en plus du texte. Ce dernier modèle génère des textes plus semblables à ceux écrits par un humain, en utilisant des éléments tels que des emojis pour une sensation plus personnalisée.

Cependant, la taille exacte et l'architecture de GPT-4 restent confidentielles, ce qui alimente les spéculations sur les détails du modèle.

Malgré ces rumeurs, le PDG d'OpenAI a nié des affirmations spécifiques concernant la taille du modèle.

En ce qui concerne les performances, GPT-4 a démontré des points forts en matière de génération de texte, mais présente également certaines limitations. Par exemple, il a obtenu un score situé dans le 54e centile à l'examen d'écriture du Graduate Record Examination (GRE) et s'est classé entre le 43e et le 59e centile à l'examen de Calculus BC.

De plus, il s'est bien comporté sur les tâches de codage faciles de Leetcode, mais ses performances ont diminué avec la difficulté croissante des tâches.

Alors que les détails du processus de formation de GPT-4 ne sont pas officiellement documentés, on sait que les modèles GPT impliquent généralement un apprentissage automatique à grande échelle avec une gamme diversifiée de texte provenant d'Internet.

En avant

En raison des modifications apportées à la politique d'utilisation des données d'OpenAI, les données utilisées pour entraîner ses modèles de langage ne comprennent pas les informations partagées via l'API, sauf si les utilisateurs acceptent explicitement de les contribuer à cette fin.

Pendant que cette technologie s'améliore et joue un rôle de plus en plus important dans nos vies, il est intéressant de voir comment les entreprises pivotent et répondent aux préoccupations concernant la protection des données et la confiance des personnes.

Articles connexes

Voir Plus >>

Libérez la puissance de l'IA avec HIX.AI !