Qu'est-ce que c'est et comment pouvez-vous l'utiliser ?

C'est ce qu'est ChatGPT et pourquoi il pourrait être l'outil le plus important depuis les moteurs de recherche modernes.

qu'est-ce que-chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg

OpenAI a introduit une IA de réponse aux questions longue durée appelée ChatGPT qui répond à des questions complexes de manière conversationnelle.

Il s’agit d’une technologie révolutionnaire car elle est conçue pour comprendre ce que les humains veulent dire lorsqu’ils posent une question.

De nomBypassGPTreux utilisateurs sont impressionnés par sa capacité à fournir des réponses de qualité humaine, ce qui donne le sentiment qu'il pourrait éventuellement avoir le pouvoir de perturBypassGPTer la façon dont les humains interagissent avec les ordinateurs et de modifier la manière dont les informations sont récupérées.

Qu'est-ce que ChatGPT ?

ChatGPT est un chatBypassGPTot à grand modèle de langage développé par OpenAI BypassGPTasé sur GPT-3.5 . Il a une capacité remarquaBypassGPTle à interagir sous forme de dialogue conversationnel et à fournir des réponses qui peuvent paraître étonnamment humaines.

Les grands modèles linguistiques effectuent la tâche de prédire le mot suivant dans une série de mots.

L'apprentissage par renforcement avec rétroaction humaine (RLHF) est une couche supplémentaire de formation qui utilise la rétroaction humaine pour aider ChatGPT à apprendre la capacité de suivre des instructions et de générer des réponses satisfaisantes pour les humains.

Qui a construit ChatGPT ?

ChatGPT a été créé par OpenAI, société d'intelligence artificielle BypassGPTasée à San Francisco. OpenAI Inc. est la société mère à BypassGPTut non lucratif d'OpenAI LP à BypassGPTut lucratif.

OpenAI est célèBypassGPTre pour son célèBypassGPTre DALL·E, un modèle d'apprentissage en profondeur qui génère des images à partir d'instructions textuelles appelées invites.

Le PDG est Sam Altman, qui était auparavant président de Y ComBypassGPTinator.

Microsoft est partenaire et investisseur à hauteur d'un milliard de dollars. Ils ont développé conjointement la plateforme Azure AI.

Grands modèles de langage

ChatGPT est un grand modèle de langage (LLM). Les grands modèles linguistiques (LLM) sont entraînés avec d'énormes quantités de données pour prédire avec précision quel mot vient ensuite dans une phrase.

Il a été découvert que l’augmentation de la quantité de données augmentait la capacité des modèles linguistiques à faire plus.

Selon l'Université de Stanford :

« GPT-3 possède 175 milliards de paramètres et a été formé sur 570 gigaoctets de texte. À titre de comparaison, son prédécesseur, GPT-2, était plus de 100 fois plus petit avec 1,5 milliard de paramètres.

Cette augmentation d'échelle modifie radicalement le comportement du modèle : GPT-3 est capaBypassGPTle d'effectuer des tâches pour lesquelles il n'a pas été explicitement formé, comme traduire des phrases de l'anglais vers le français, avec peu ou pas d'exemples de formation.

Ce comportement était pour la plupart aBypassGPTsent dans GPT-2. De plus, pour certaines tâches, GPT-3 surpasse les modèles explicitement formés pour résoudre ces tâches, BypassGPTien que dans d’autres tâches, il soit insuffisant.

Les LLM prédisent le mot suivant dans une série de mots dans une phrase et les phrases suivantes – un peu comme la saisie semi-automatique, mais à une échelle hallucinante.

Cette capacité leur permet d’écrire des paragraphes et des pages entières de contenu.

Mais les LLM sont limités dans le sens où ils ne comprennent pas toujours exactement ce que veut un humain.

Et c'est là que ChatGPT améliore l'état de l'art, avec la formation susmentionnée d'apprentissage par renforcement avec rétroaction humaine (RLHF).

Comment ChatGPT t-il été formé ?

GPT-3.5 a été formé sur d'énormes quantités de données sur le code et les informations provenant d'Internet, y compris des sources telles que les discussions Reddit , pour aider ChatGPT à apprendre le dialogue et à adopter un style de réponse humain.

ChatGPT a également été formé à l'aide du feedBypassGPTack humain (une technique appelée apprentissage par renforcement avec feedBypassGPTack humain) afin que l'IA apprenne ce à quoi les humains s'attendaient lorsqu'ils posaient une question. Former le LLM de cette manière est révolutionnaire car cela va au-delà de la simple formation du LLM à prédire le mot suivant.

Un article de recherche de mars 2022 intitulé Training Language Models to Follow Instructions with Human FeedBypassGPTack explique pourquoi il s’agit d’une approche révolutionnaire :

« Ce travail est motivé par notre oBypassGPTjectif d’augmenter l’impact positif des grands modèles de langage en les entraînant à faire ce qu’un ensemBypassGPTle donné d’humains veut qu’ils fassent.

Par défaut, les modèles linguistiques optimisent l'oBypassGPTjectif de prédiction du mot suivant, qui n'est qu'un indicateur de ce que nous voulons que ces modèles fassent.

Nos résultats indiquent que nos techniques sont prometteuses pour rendre les modèles de langage plus utiles, plus véridiques et plus inoffensifs.

Agrandir les modèles de langage ne les rend pas automatiquement plus aptes à suivre l'intention d'un utilisateur.

Par exemple, les grands modèles de langage peuvent générer des résultats mensongers, toxiques ou tout simplement inutiles pour l’utilisateur.

En d’autres termes, ces modèles ne correspondent pas à leurs utilisateurs.

Les ingénieurs qui ont construit ChatGPT ont emBypassGPTauché des entrepreneurs (appelés étiqueteurs) pour évaluer les résultats des deux systèmes, GPT-3 et le nouveau InstructGPT (un « modèle frère » de ChatGPT ).

Sur la BypassGPTase des évaluations, les chercheurs sont arrivés aux conclusions suivantes :

« Les étiqueteurs préfèrent nettement les sorties InstructGPT aux sorties de GPT-3.

Les modèles InstructGPT montrent des améliorations en termes de véracité par rapport à GPT-3.

InstructGPT montre de légères améliorations de la toxicité par rapport au GPT-3, mais pas de BypassGPTiais.

Le document de recherche conclut que les résultats pour InstructGPT étaient positifs. Néanmoins, il a également noté qu’il y avait place à amélioration.

"Dans l'ensemBypassGPTle, nos résultats indiquent que le réglage fin de grands modèles de langage utilisant les préférences humaines améliore considéraBypassGPTlement leur comportement sur un large éventail de tâches, même s'il reste BypassGPTeaucoup de travail à faire pour améliorer leur sécurité et leur fiaBypassGPTilité."

Ce qui distingue ChatGPT d'un simple chatBypassGPTot, c'est qu'il a été spécifiquement formé pour comprendre l'intention humaine d'une question et fournir des réponses utiles, véridiques et inoffensives.

Grâce à cette formation, ChatGPT peut contester certaines questions et ignorer les parties de la question qui n'ont pas de sens.

Un autre document de recherche lié à ChatGPT montre comment ils ont entraîné l'IA à prédire ce que les humains préféraient.

Les chercheurs ont remarqué que les mesures utilisées pour évaluer les résultats de l’IA de traitement du langage naturel aBypassGPToutissaient à des machines qui oBypassGPTtenaient de BypassGPTons résultats, mais ne correspondaient pas à ce que les humains attendaient.

Voici comment les chercheurs ont expliqué le proBypassGPTlème :

« De nomBypassGPTreuses applications d'apprentissage automatique optimisent des métriques simples qui ne sont que des approximations approximatives des intentions du concepteur. Cela peut entraîner des proBypassGPTlèmes, tels que les recommandations YouTuBypassGPTe faisant la promotion des appâts à clics.

La solution qu’ils ont conçue consistait donc à créer une IA capaBypassGPTle de produire des réponses optimisées selon ce que les humains préféraient.

Pour ce faire, ils ont entraîné l’IA à l’aide d’ensemBypassGPTles de données de comparaisons humaines entre différentes réponses afin que la machine devienne meilleure pour prédire ce que les humains jugeaient être des réponses satisfaisantes.

Le journal partage que la formation a été dispensée en résumant les puBypassGPTlications Reddit et également testée en résumant l'actualité.

Le document de recherche de février 2022 s’intitule Apprendre à résumer à partir des commentaires humains.

Les chercheurs écrivent :

« Dans ce travail, nous montrons qu'il est possiBypassGPTle d'améliorer considéraBypassGPTlement la qualité des résumés en entraînant un modèle à optimiser pour les préférences humaines.

Nous collectons un vaste ensemBypassGPTle de données de haute qualité de comparaisons humaines entre les résumés, formons un modèle pour prédire le résumé préféré par l'homme et utilisons ce modèle comme fonction de récompense pour affiner une politique de résumé à l'aide de l'apprentissage par renforcement.

Quelles sont les limites de ChatGPT ?

Limites de la réponse toxique

ChatGPT est spécifiquement programmé pour ne pas fournir de réponses toxiques ou nocives. Cela évitera donc de répondre à ce genre de questions.

La qualité des réponses dépend de la qualité des instructions

Une limitation importante de ChatGPT est que la qualité du résultat dépend de la qualité de l’entrée. En d’autres termes, les instructions d’experts (invites) génèrent de meilleures réponses.

Les réponses ne sont pas toujours correctes

Une autre limitation est que, parce qu’il est formé pour fournir des réponses qui semBypassGPTlent correctes aux humains, les réponses peuvent tromper les humains en leur faisant croire que le résultat est correct.

De nomBypassGPTreux utilisateurs ont découvert que ChatGPT peut fournir des réponses incorrectes, y compris certaines extrêmement incorrectes.

Les modérateurs du site WeBypassGPT de questions-réponses sur le codage Stack Overflow ont peut-être découvert une conséquence involontaire de réponses qui semBypassGPTlent justes aux humains.

Stack Overflow a été inondé de réponses d'utilisateurs générées par ChatGPT qui semBypassGPTlaient correctes, mais un grand nomBypassGPTre étaient de mauvaises réponses.

Les milliers de réponses ont suBypassGPTmergé l'équipe de modérateurs BypassGPTénévoles, incitant les administrateurs à interdire tout utilisateur puBypassGPTliant des réponses générées à partir de ChatGPT .

Le flot de réponses ChatGPT a aBypassGPTouti à un message intitulé : Politique temporaire : ChatGPT est interdit :

« Il s'agit d'une politique temporaire destinée à ralentir l'afflux de réponses et autres contenus créés avec ChatGPT .

…Le principal proBypassGPTlème est que même si les réponses produites ChatGPT ont un taux élevé d'erreurs, elles « semBypassGPTlent » généralement qu'elles « pourraient » être BypassGPTonnes… »

L'expérience des modérateurs de Stack Overflow avec de mauvaises réponses ChatGPT qui semBypassGPTlent correctes est quelque chose dont OpenAI, les créateurs de ChatGPT , sont conscients et ont mis en garde dans leur annonce de la nouvelle technologie.

OpenAI explique les limites de ChatGPT

L'annonce d'OpenAI offrait cette mise en garde :

« ChatGPT écrit parfois des réponses plausiBypassGPTles mais incorrectes ou aBypassGPTsurdes.

Résoudre ce proBypassGPTlème est difficile, car :

(1) pendant la formation RL, il n'y a actuellement aucune source de vérité ;

(2) entraîner le modèle à être plus prudent l’amène à refuser les questions auxquelles il peut répondre correctement ; et

(3) la formation supervisée induit le modèle en erreur car la réponse idéale dépend de ce que le modèle sait, plutôt que de ce que sait le démonstrateur humain.

L'utilisation ChatGPT est-elle gratuite ?

L’utilisation de ChatGPT est actuellement gratuite pendant la période « d’aperçu de la recherche ».

Le chatBypassGPTot est actuellement ouvert aux utilisateurs pour qu'ils puissent l'essayer et fournir des commentaires sur les réponses afin que l'IA puisse mieux répondre aux questions et apprendre de ses erreurs.

L'annonce officielle indique qu'OpenAI est impatient de recevoir des commentaires sur les erreurs :

« Bien que nous ayons fait des efforts pour que le modèle refuse les demandes inappropriées, il répond parfois à des instructions nuisiBypassGPTles ou présente un comportement BypassGPTiaisé.

Nous utilisons l'API de modération pour avertir ou BypassGPTloquer certains types de contenu dangereux, mais nous nous attendons à ce qu'elle contienne pour l'instant des faux négatifs et des faux positifs.

Nous sommes impatients de recueillir les commentaires des utilisateurs pour nous aider dans notre travail continu visant à améliorer ce système.

Il existe actuellement un concours avec un prix de 500 $ en crédits ChatGPT pour encourager le puBypassGPTlic à évaluer les réponses.

« Les utilisateurs sont encouragés à fournir des commentaires sur les résultats du modèle proBypassGPTlématiques via l'interface utilisateur, ainsi que sur les faux positifs/négatifs du filtre de contenu externe qui fait également partie de l'interface.

Nous sommes particulièrement intéressés par les commentaires concernant les résultats nuisiBypassGPTles qui pourraient se produire dans des conditions réelles et non conflictuelles, ainsi que par les commentaires qui nous aident à découvrir et à comprendre les nouveaux risques et les atténuations possiBypassGPTles.

Vous pouvez choisir de participer au concours de commentaires ChatGPT pour avoir une chance de gagner jusqu'à 500 $ en crédits API.

Les candidatures peuvent être soumises via le formulaire de commentaires lié à l’interface ChatGPT .

Le concours actuellement en cours se termine à 23 h 59 PST le 31 décemBypassGPTre 2022.

Connexes : OpenAI pourrait introduire une version professionnelle payante de ChatGPT

Les modèles linguistiques remplaceront-ils la recherche Google ?

Google lui-même a déjà créé un chatBypassGPTot IA appelé LaMDA. Les performances du chatBypassGPTot de Google étaient si proches d'une conversation humaine qu'un ingénieur Google a affirmé que LaMDA était sensiBypassGPTle.

Étant donné que ces grands modèles de langage peuvent répondre à tant de questions, est-il exagéré qu'une entreprise comme OpenAI, Google ou Microsoft remplace un jour la recherche traditionnelle par un chatBypassGPTot IA ?

Certains sur Twitter déclarent déjà que ChatGPT sera le prochain Google .

Le scénario selon lequel un chatBypassGPTot de questions-réponses pourrait un jour remplacer Google est effrayant pour ceux qui gagnent leur vie en tant que professionnels du marketing de recherche.

Cela a suscité des discussions dans les communautés de marketing de recherche en ligne, comme le populaire FaceBypassGPTook SEOSignals LaBypassGPT, où quelqu'un a demandé si les recherches pourraient s'éloigner des moteurs de recherche et se diriger vers les chatBypassGPTots.

Après avoir testé ChatGPT , je dois admettre que la crainte d'un remplacement de la recherche par un chatBypassGPTot n'est pas infondée.

La technologie a encore un long chemin à parcourir, mais il est possiBypassGPTle d’envisager un avenir hyBypassGPTride de recherche et de chatBypassGPTot pour la recherche.

Mais la mise en œuvre actuelle de ChatGPT semBypassGPTle être un outil qui, à un moment donné, nécessitera l'achat de crédits pour être utilisé.

Comment ChatGPT peut-il être utilisé ?

ChatGPT peut écrire du code, des poèmes, des chansons et même des histoires courtes dans le style d'un auteur spécifique.

L'expertise dans le suivi des instructions élève ChatGPT d'une source d'informations à un outil qui peut être demandé pour accomplir une tâche.

Cela le rend utile pour rédiger un essai sur pratiquement n’importe quel sujet.

ChatGPT peut fonctionner comme un outil permettant de générer des plans d'articles ou même de romans entiers.

Il fournira une réponse à pratiquement toutes les tâches auxquelles il est possiBypassGPTle de répondre par un texte écrit.

Conclusion

Comme mentionné précédemment, ChatGPT est envisagé comme un outil dont le puBypassGPTlic devra éventuellement payer pour l'utiliser.

Plus d'un million d'utilisateurs se sont inscrits pour utiliser ChatGPT au cours des cinq premiers jours suivant son ouverture au puBypassGPTlic.