Ces données figuraient à l’origine dans la newsletter du 12 juillet 2023 que vous trouverez ici : https://www.trustinsights.ai/blog/2023/07/inbox-insights-ai-efiences-ripple-effects-chatgpt-code-interpreter/.
Dans les journaux de données de cette semaine, jetons un coup d’œil époustouflant au tout nouvel outil d’analyse de données d’IA, GPT-4 Code Interpreter d’OpenAI. Installé dans l’interface familière de ChatGPT, Code Interpreter fait partie du plan payant de 20 $/mois, et après l’avoir vu en action, vous vous demanderez pourquoi ce n’est pas 2 000 $/mois. Tout d’abord, nous avons besoin de quelques données à analyser. Depuis que nous avons ouvert Académie Trust Insightsnous avons suivi une stratégie assez bien connue de l’industrie : proposer des cours gratuits et proposer des cours payants.
La question à laquelle nous voulons connaître la réponse est : cette stratégie fonctionne-t-elle réellement ? Nous voyons beaucoup d’inscriptions à des cours et nous avons réussi à vendre des cours, mais cette stratégie de marketing particulière fonctionne-t-elle ? Laissons Code Interpreter répondre à la question.
Avant de commencer, Code Interpreter est un nom stupide pour le service. Ce qu’ils devraient en fait appeler cela est Automated Junior Data Scientist, car c’est exactement ce qu’il fait.
Notre première étape consiste à exporter nos commandes depuis l’Académie et à les charger dans ChatGPT, avec quelques instructions de base. Voici ce que nous avons dit :
Aujourd’hui, nous allons faire une analyse sur le fichier inclus. Le fichier est une liste de commandes de cours, par client. L’ID client est l’adresse e-mail, notée dans le champ e-mail. Les cours sont dans le domaine du produit. Certains cours sont gratuits. D’autres cours coûtent de l’argent. Le moyen de déterminer si quelque chose est gratuit ou non se trouve dans le champ du mode de paiement, qui indique « sans frais » pour un cours gratuit ou un mode de paiement si le cours n’est pas gratuit.
L’analyse que nous voulons comprendre est double. Tout d’abord, nous donnons accès à des cours gratuits pour, espérons-le, encourager les ventes incitatives dans nos cours payants. Nous voulons savoir si cette stratégie est efficace. Quelle méthode d’analyse répondrait le mieux à cette question ?
Il a répondu :
Compte tenu de votre question, une approche d’analyse potentielle consisterait à effectuer une analyse de cohorte. Ce type d’analyse pourrait fournir des informations sur le comportement de différents groupes de clients qui ont commencé leur voyage avec des cours gratuits. Nous pourrions alors suivre s’ils ont ensuite acheté des cours payants.
Voici les étapes que nous pourrions suivre :
Nettoyage des données : Tout d’abord, nous allons importer les données et les nettoyer si nécessaire, en nous assurant que les champs sont dans les bons formats, en gérant les valeurs manquantes, etc.
Identification des cohortes : nous identifierons différentes cohortes de clients en fonction de la date à laquelle ils se sont inscrits pour la première fois à un cours gratuit. Ces cohortes représenteront les utilisateurs qui ont commencé leur voyage avec un cours gratuit au cours d’un mois spécifique.
Métriques de cohorte : pour chaque cohorte, nous calculerons des métriques telles que :
Le nombre de clients qui ont commencé avec un cours gratuit Le nombre de clients qui ont ensuite acheté un cours payant Le taux de conversion des cours gratuits en cours payants (nombre de clients ayant acheté un cours payant / nombre total de clients ayant commencé avec un cours gratuit) Analyse de cohorte : nous analyserons les mesures de différentes cohortes pour comprendre l’efficacité de la stratégie de vente incitative. Par exemple, nous pourrions examiner si les taux de conversion s’améliorent avec le temps.
Cependant, avant de poursuivre avec cette approche, importons d’abord les données et effectuons une analyse exploratoire des données pour comprendre la structure des données et valider si la méthode proposée est appropriée.
C’est un excellent début. Ensuite, il a commencé à fonctionner – et il le fait en écrivant du code :
Il fait tout le travail de chargement du fichier, puis de nettoyage et de traitement des données :
Ensuite, il écrit le code Python exécutable pour effectuer l’analyse de cohorte :
Et enfin, il nous présente l’analyse :
Oh.
Eh bien… tant pis pour cette stratégie. Ce que nous voyons, c’est que des centaines et des centaines de personnes se sont inscrites à nos cours gratuits, mais parmi elles, exactement 4 sont devenues des clients payants. Ce n’est… pas un excellent palmarès du tout. Et cela sur plus d’un an, ce qui est largement suffisant pour accumuler des preuves. Bien que cette stratégie puisse fonctionner pour d’autres, elle ne fonctionne clairement pas pour Trust Insights. Katie et moi devrons avoir une conversation sur le manque de résultats de cette stratégie.
Bien que cela soit en soi un aperçu utile, la grande image à emporter ici est ce que Code Interpreter a pu faire. Je n’ai intentionnellement pas utilisé le Structure d’invite RACE nous recommandons, pour mieux simuler ce qu’une personne non technique pourrait demander au système. Il a fait tout le gros du travail : choisir la méthode d’analyse, nettoyer et traiter les données, et présenter l’analyse.
Et du début à la fin, cela a pris 6 minutes.
Je suis un ingénieur de données qualifié et un scientifique des données. Il me faudrait plus de 6 minutes pour effectuer cette analyse, et j’aurais suivi des étapes très similaires (quoique en R, pas en Python). Cet outil a fait un travail fantastique pour la plupart, ne nécessitant que quelques corrections en cours de route.
Alors, suis-je au chômage ? Et bien non. Les quelques corrections que j’ai apportées étaient de subtiles erreurs de calcul. Voir la dernière colonne du tableau, Started_Paid ? J’ai dû le demander spécifiquement parce qu’il ne l’a pas créé, et la première itération du tableau, les chiffres ne correspondaient pas. J’ai donc inspecté le code et j’ai découvert qu’il avait fait une erreur logique, qu’il a corrigée lorsque je lui ai dit de le faire. C’est pourquoi on a encore besoin de travailleurs qualifiés, car lorsque les machines font des erreurs, les erreurs ne sont pas toujours évidentes.
Mais dois-je embaucher un data scientist junior maintenant ? Pas avec l’interpréteur de code. Je peux lui faire faire une grande partie du travail lourd – le premier brouillon – puis éditer, ajuster et améliorer ce qu’il a fait. Des outils comme Code Interpreter seront de puissants alliés pour les employés qualifiés, réduisant considérablement le temps nécessaire pour produire des analyses puissantes. Maintenant qu’il est ouvert au public, vous devriez commencer à le tester vous-même, en lui posant les questions d’analyse marketing auxquelles vous avez toujours voulu des réponses, mais que vous n’aviez pas vous-même les compétences en codage ou techniques pour répondre.
|
Besoin d’aide avec vos données et analyses marketing ? |
Vous pourriez également profiter de : |
|
Obtenez des données, des analyses et des perspectives uniques sur l’analyse, les informations, l’apprentissage automatique, le marketing et l’IA dans la newsletter hebdomadaire Trust Insights, INBOX INSIGHTS. Abonnez-vous maintenant gratuitement ; nouveaux numéros tous les mercredis! |
Vous souhaitez en savoir plus sur les données, les analyses et les informations ? Abonnez-vous à In-Ear Insights, le podcast Trust Insights, avec de nouveaux épisodes de 10 minutes ou moins chaque semaine. |