Ces données ont été initialement présentées dans la newsletter du 3 janvier 2024 disponible ici : INBOX INSIGHTS, 3 JANVIER 2024 : PROCESSUS SUR RÉSULTATS, LES DONNÉES COMME AVANTAGE DE L'IA

Dans les Data Diaries de cette semaine, parlons de l'un des principaux facteurs qui détermineront le succès ou l'échec en matière d'IA générative : la qualité de vos données et les données en tant qu'avantage de l'IA.

À l’heure actuelle, nous n’en sommes qu’aux débuts, aux balbutiements de l’utilisation d’outils comme ChatGPT ou Stable Diffusion. Les cas d'utilisation auxquels les gens appliquent ces outils sont pour la plupart génériques – « aidez-moi à rédiger un article de blog sur l'automatisation du marketing », par exemple. Cela ne nécessite aucune donnée externe, s'appuyant sur les données déjà présentes dans les modèles.

Cependant, les modèles contiennent une agrégation de données accessibles au public. C'est bien, certes, mais ce n'est pas une chose unique. Tout le monde utilise le même modèle de base et les mêmes données de base. Qu'est-ce qui vous différencierait ? Vos données, les données que vous avez derrière des portes closes et qui n'ont jamais été publiées sur Internet pour que les créateurs de modèles linguistiques puissent les récupérer.

En novembre de l'année dernière, OpenAI a déployé l'une des premières fonctionnalités de personnalisation de masse pour les utilisateurs non techniques avec leur GPT personnalisés. Cette fonctionnalité permet à l'utilisateur non technique de personnaliser ChatGPT pour utiliser ses propres données, appels de fonction et invites personnalisées. Qu'est-ce qui fait qu'un GPT personnalisé fonctionne vraiment bien ? Vous l'avez deviné : les données que vous téléchargez.

Comment utiliseriez-vous vos propres données dans un exemple comme celui-ci ? Supposons que j'allais créer un GPT personnalisé pour le marketing par e-mail. Il y a quelque temps, j'ai écrit un livre qui n'est plus accessible au public sur 52 conseils pour le marketing par e-mail. J'en ai toujours une copie numérique sur mon disque dur, mais la version publique a disparu depuis une décennie maintenant. La plupart des conseils sont toujours pratiques et utiles, je prendrais donc ce PDF et le chargerais dans un GPT personnalisé. Désormais, mon GPT personnalisé possède des connaissances uniques, différentes de celles que d'autres utiliseraient s'ils devaient créer un GPT personnalisé pour le marketing par e-mail.

Voici un autre exemple. Supposons que je veuille créer un GPT personnalisé qui puisse parler d'un point de vue spécifique sur l'analyse marketing. En tant qu'administrateur et propriétaire du Groupe Slack d’analyses pour les spécialistes du marketing, je pourrais exporter l'intégralité des archives des conversations des 5 dernières années, les anonymiser et les désidentifier pour protéger la confidentialité des utilisateurs, puis charger ces données de conversation dans un GPT personnalisé. Ces conversations ne sont pas accessibles au public ; aucun moteur de recherche ou robot d'exploration ne peut y accéder et l'utiliser. Mais mon GPT personnalisé pourrait exploiter ces connaissances pour devenir un meilleur interlocuteur en matière d'analyse marketing en lui donnant des conversations plus spécifiques uniquement sur l'analyse marketing.

Un troisième exemple auquel de nombreuses entreprises peuvent probablement s’identifier sont les conférences téléphoniques. Vous avez reçu tellement d’appels, et certains de ces appels ont été extrêmement précieux. Peut-être avez-vous un centre d'appels avec des enregistrements d'appels. Peut-être disposez-vous d'un CRM de vente qui enregistre les appels de votre équipe commerciale. Quoi qu’il en soit, vous disposez d’un trésor de données audio que vous pouvez utiliser l’IA pour transcrire, anonymiser, puis ajouter à un système d’IA générative. Ces données personnalisées donneraient une quantité incroyable de contexte à n'importe quel système d'IA, et elles vous appartiennent uniquement.

Script Python pour désidentifier les transcriptions

Votre première tâche consiste donc à examiner les données auxquelles vous avez accès et auxquelles d’autres n’ont pas accès. De quelles données disposez-vous, sur les ordinateurs portables et les serveurs, qui pourraient être utiles pour aider un modèle de langage à améliorer son contexte et à mieux comprendre votre façon spécifique de faire les choses ?

À mesure que l’IA générative continue d’évoluer, vos données spécifiques deviendront de plus en plus précieuses – si vous parvenez à les trouver et à les utiliser correctement. Il est maintenant temps de commencer à l’inventorier et à le préparer à son utilisation avec l’IA.


Besoin d'aide avec votre IA et vos analyses marketing ?

Vous pourriez également apprécier :

Obtenez des données, des analyses et des perspectives uniques sur l'analyse, les informations, l'apprentissage automatique, le marketing et l'IA dans la newsletter hebdomadaire Trust Insights, INBOX INSIGHTS. Abonnez-vous maintenant gratuitement ; de nouveaux numéros tous les mercredis !

Cliquez ici pour vous abonner maintenant “

Vous souhaitez en savoir plus sur les données, les analyses et les informations ? Abonnez-vous à In-Ear Insights, le podcast Trust Insights, avec de nouveaux épisodes chaque mercredi.



Source link