Ces données figuraient à l’origine dans la newsletter du 19 janvier 2022 que vous trouverez ici : https://www.trustinsights.ai/blog/2022/01/inbox-insights-january-19-2022-two-types-of-people-resolution-wordle-puzzles/

Dans les journaux de données de cette semaine, amusons-nous un peu. Pour ceux qui se demandent quels sont ces diagrammes que vous voyez dans les flux de médias sociaux des gens :

Image Wordle

Ils proviennent d’un nouveau jeu de mots amusant appelé Wordle. Le principe est que vous devez décoder un mot de cinq lettres en six suppositions, puis partager uniquement le processus de vos suppositions. Dans le diagramme ci-dessus, nous voyons que les carrés gris signifient la mauvaise lettre, les carrés jaunes signifient la bonne lettre, le mauvais endroit dans le mot, et les carrés verts signifient la bonne lettre, le bon endroit.

GIF animé

Naturellement, étant des passionnés de données et de mots, nous avons pensé poser la question logique : existe-t-il une manière d’aborder ce jeu basée sur les données qui augmenterait vos chances de gagner ? La réponse est oui, bien sûr.

Tout d’abord, nous aurions besoin de savoir combien de mots il y a qui seraient en jeu. Puisqu’il s’agit d’un jeu, il y a de fortes chances que de nombreux mots ésotériques, ainsi que des mots avec des nombres, soient exclus. Nous avons donc commencé avec le Collins Scrabble Tournament Dictionary, qui est le dictionnaire officiel utilisé pour déterminer si un mot est autorisé ou non dans les tournois de Scrabble. Nous n’avons ensuite isolé que des mots de cinq lettres, car Wordle n’utilise que des mots complets de cinq lettres.

À partir de là, nous avons compté chaque lettre dans chaque position pour obtenir une fréquence de lettres dans chaque position :

Tableau Wordle

Cliquez pour une version en taille réelle

Nous pouvons voir:

  • La lettre S est la plus courante en position 1 des mots de cinq lettres, suivie de C, B et P.
  • La lettre A est la plus courante en position 2 des mots de cinq lettres, suivie de O, E et I.
  • La lettre A est la plus courante en position 3 des mots de cinq lettres, suivie de R, I et O.
  • La lettre E est la plus courante en position 4 des mots de cinq lettres, suivie de A, T et I.
  • La lettre S est la plus courante en position 5 des mots de cinq lettres, suivie de E, Y et D.

Et alors?

Que faites-vous de ces informations ? C’est là que la science des données rencontre souvent des problèmes. Ce n’est pas parce que nous avons une analyse que nous sommes en mesure d’agir. Le but de ces informations est de faciliter les devinettes dans Wordle. Ainsi, pour transformer les données en action, nous devons construire des mots qui utilisent les lettres les plus fréquentes, idéalement dans autant d’endroits corrects que possible, pour exclure les lettres les plus courantes.

Si nous utilisons le mot STORY comme entrée, nous cochons la case sur S en première position, Y en cinquième position et O en troisième position. C’est un bon début.

Nous voudrions ensuite utiliser autant de voyelles restantes que possible – parce que les voyelles sont la colle des mots – et donc ADIEU, même s’il n’est pas dans la plupart des positions correctes, correspond à la facture. Nous pourrions également utiliser ABIDE, qui utiliserait I en troisième position et E en cinquième position.

Commencer vos puzzles Wordle avec STORY et ADIEU ou STORY et ABIDE accélérera la recherche des autres mots qui pourraient être en jeu. Gardez à l’esprit qu’il y a 12 927 mots de cinq lettres dans la langue anglaise, il y a donc toujours une chance que vous soyez surpris par un mot obscur.

Plus important encore, les données sans analyse sont inutiles, mais l’analyse sans action est inutile. Lorsque vous examinez vos propres données, assurez-vous de réfléchir constamment à la manière dont vous pourriez utiliser votre analyse et vos connaissances pour prendre des décisions et entreprendre des actions. Sans ce dernier, il ne sert à rien de faire l’analyse des données pour commencer.

Méthodologie : Trust Insights a extrait 12 797 mots de cinq lettres du dictionnaire Collins Scrabble Tournament et les a traités pour effectuer un décompte brut des lettres dans chaque position. La date de l’étude est le 18 janvier 2022. Trust Insights est le seul sponsor de l’étude et n’a ni donné ni reçu de compensation pour les données utilisées, au-delà des frais de service applicables aux éditeurs de logiciels, et ne déclare aucun intérêt concurrent.


Besoin d’aide avec vos données et analyses marketing ?

Vous pourriez également profiter de :

Obtenez des données, des analyses et des perspectives uniques sur l’analyse, les informations, l’apprentissage automatique, le marketing et l’IA dans la newsletter hebdomadaire Trust Insights, Data in the Headlights. Abonnez-vous maintenant gratuitement ; nouveaux numéros tous les mercredis!

Cliquez ici pour vous abonner maintenant “

Vous souhaitez en savoir plus sur les données, les analyses et les informations ? Abonnez-vous à In-Ear Insights, le podcast Trust Insights, avec de nouveaux épisodes de 10 minutes ou moins chaque semaine.



Source link