Un guide du marketing sur l’optimisation TF-IDF pour le référencement

En tant que spécialistes du marketing numérique, le contenu est un élément essentiel de tout ce que nous faisons. Et si l’analyse et l’actualisation du contenu peuvent prendre beaucoup de temps et d’efforts, les résultats pour générer plus de trafic et améliorer le référencement sont clairs.

Compte tenu des nombreux aspects de la création de contenu, tels que la recherche sur les concurrents, la sensibilisation et les aspects techniques du contenu, l’amélioration du contenu plus ancien passe souvent au second plan, ce qui, dans la plupart des cas, est une erreur coûteuse.

Dans cet article, je vais partager comment utiliser l’optimisation TF-IDF pour vous aider à rationaliser votre processus de contenu et à améliorer votre ancien contenu afin que vous puissiez vous classer plus haut et attirer plus de prospects.

Qu’est-ce que TF-IDF?

Bien que l’utilisation de la technique TF-IDF ne soit pas exclusive au monde du référencement, Moz la définit le mieux:

TF-IDF signifie teuh Frequency-jenverse ocument Frequency. C’est une technique d’analyse de texte que Google utilise comme facteur de classement – cela signifie à quel point un mot ou une phrase est important pour un document dans un corpus (c’est-à-dire un blog sur Internet). Lorsqu’il est utilisé à des fins de référencement, il vous aide à regarder au-delà des mots-clés et à trouver un contenu pertinent pouvant atteindre votre public.

En surface, la formule peut paraître assez complexe. Alors, voyons comment décomposer les choses par rapport au contenu.

TF = (Nombre de fois qu’un terme apparaît dans un document) / (Nombre total de termes dans le document)

Par exemple, supposons que le terme «cabane en rondins» dans un document de 100 mots apparaisse 12 fois.

Votre TF = 12/100 = 0,12

Avec TF, nous avons résolu la première partie pour compter combien de fois le terme «cabane en rondins» apparaît sur notre document. Le score de 0,12 représente la densité de ce terme.

Maintenant, nous voulons savoir comment ce terme se compare à ses rivaux. Nous pouvons calculer l’IDF pour obtenir le résultat de la comparaison, en divisant le nombre de documents dans lesquels le terme apparaît par le nombre total de documents dans les résultats de la recherche:

IDF = log_e (Nombre total de documents / Nombre de documents contenant un terme)

Mettons à profit la deuxième partie de cette formule. Disons que sur 1 000 000 de résultats, certains mentionnent «cabane en rondins» et le nombre est de 409 000 fois.

Maintenant, résolvons le logarithme:

IDF (cabane en rondins) = log_e (1,000,000 / 409,000 avec terme cabane en rondins dedans) = 0,38

Avec cela, nous avons maintenant la densité et l’importance.

TF * IDF = Fréquence du terme fois Fréquence inverse des documents= 0,12 * 0,38 = 0,046

Ensuite, vous avez également un résultat de votre propre TF * IDF. Pour le mot «cabane en rondins», vous avez 0,017 alors que la moyenne de vos rivaux est de 0,046, ce qui est plus élevé que vous.

Les données vous donnent une indication que le terme «cabane en rondins» est un dénominateur commun dans le contenu qui se classe très bien.

TF-IDF est-il juste un bourrage de mots clés?

Si vous êtes impliqué dans le référencement depuis un certain temps, vous connaissez probablement le concept de bourrage de mots-clés, c’est-à-dire le processus d’ajout de mots-clés autant que possible pour augmenter vos chances de vous classer plus haut.

Ce truc, c’est que la densité des mots-clés était une première tentative sur la façon de jouer à Google dans l’optimisation TF-IDF. Les référenceurs essayaient de remplir leur contenu avec autant de mots-clés que possible, puis Panda est venu et a changé les règles du jeu.

Bien que le bourrage de mots-clés ait fonctionné dans le passé, les données indiquent clairement que le faire maintenant peut considérablement nuire à votre classement.

Personne ne gagne en valeur en voyant des termes et des phrases qui ne sont pas naturellement formulés ajoutés au contenu. Bien que TF-IDF vous aide à mieux comprendre quels mots sont souvent utilisés en relation avec le référencement par exemple, le but n’est pas simplement d’ajouter ces mots-clés au hasard dans votre contenu. Comme toujours, Google continue de récompenser la pertinence du contenu en essayant de fournir la meilleure solution à la requête d’un utilisateur.

TF-IDF pour le référencement

Dans le monde du référencement, TF-IDF consiste à gratter les résultats de recherche pour un mot-clé donné et à collecter les données sur l’utilisation de ces mots et expressions.

Par exemple, si vous êtes propriétaire d’un SaaS et que vous souhaitez savoir comment attirer plus de trafic en utilisant le référencement, vous êtes probablement intéressé à en apprendre davantage sur les sujets suivants.

Un «guide SEO» pourrait couvrir les éléments suivants:

  • Audit SEO;
  • SEO technique;
  • Backlinks;
  • Titre de la page;
  • H1, H2.

Mais il y a aussi d’autres termes très importants dans le référencement qui devraient être pris en compte.

  • Outils;
  • Rapports;
  • Investissement SEO;
  • Mises à jour de l’algorithme.

Bien qu’il existe de nombreux facteurs de classement utilisés par les moteurs de recherche, les algorithmes prennent naturellement note de la fréquence à laquelle certains mots et expressions apparaissent sur le Web, et comme les algorithmes sont avancés, ils comptent également le nombre de fois où ce terme apparaît dans tous les résultats de recherche. comparaison avec d’autres termes.

Un «score de comparaison» TF-IDF peut vous aider à voir combien de fois dans un pourcentage un terme spécifique apparaît.

Pour mieux comprendre avec un exemple, voici les mots-clés que je souhaite cibler avec une landing page pour un promoteur immobilier:

  • aide à acheter;
  • aide à acheter un régime.

À l’aide d’un outil TF-IDF, voici quelques-uns des mots qu’il est suggéré d’ajouter à la copie, en fonction de l’analyse des 10 meilleurs sites sur les résultats de recherche Google:

  • acheter la maison
  • construire la maison
  • paiements sur une hypothèque
  • prêt garanti
  • obtenir les conseils d’un conseiller financier
  • conseils hypothécaires

Il existe une différence fondamentale entre la récupération de variantes du même mot-clé et la récupération de termes apparemment non liés, mais néanmoins pertinents.

Avec l’analyse TF-IDF, c’est exactement ce qui est impliqué – avec ce type d’analyse, nous découvrirons exactement les termes utilisés pour mieux décrire un sujet de manière cohérente.

J’espère que vous vous rendrez vite compte à quel point il est important de disposer de ce type d’informations et du fait qu’il ne nécessite aucune compétence de récupération de données, vous pouvez apprécier le temps que vous pouvez gagner. J’ai récemment par exemple utilisé un outil TF-IDF qui suggérait de nouveaux termes pour mieux décrire le sujet et amélioré le classement de mon blog.

Inverse Document Frequency – le juste milieu entre la fréquence des termes et l’optimisation du contenu

Comment utiliser TF-IDF

Pour tirer le meilleur parti de cet exercice, assurez-vous que vous avez sélectionné vos articles et pages de destination qui ne fonctionnent pas comme vous le souhaitez, par exemple, un contenu que vous jugez de haute qualité mais qui reste bloqué à la page 2 ou 3.

Ensuite, vous devrez choisir un outil TF-IDF à utiliser avec votre site Web.

Il existe un certain nombre d’outils disponibles comme celui-ci ou celui-ci. J’adore utiliser SEMRush On Page SEO Checker (sans affiliations). Si vous êtes avancé en Python, vous pouvez suivre ce guide pour même créer votre propre outil TF-IDF.

Recherche améliorée de mots-clés

Le plus grand avantage de TF-IDF est que vous pouvez enrichir votre recherche de mots-clés en ajoutant non seulement les mots-clés recherchés par les internautes (pauses dans le bain à remous), mais également les mots-clés que Google a trouvés assez souvent dans les résultats de recherche.

Sans une analyse TF-IDF, vous ne seriez pas en mesure de découvrir que des termes comme «pauses romantiques», «chien amical» et «groupe d’amis» étaient liés à certains des meilleurs contenus de classement autour des spas.

Recherche approfondie des concurrents

Si vous faites du référencement et du contenu depuis un certain temps, vous avez probablement été dans des situations où vous vous demandez pourquoi vous vous classez derrière un contenu qui pourrait autrement être de moins bonne qualité que le vôtre.

Nous avons été formés pour penser à obtenir de meilleurs backlinks, un contenu plus long, un contenu plus détaillé, des liens internes, etc.

Et bien que tous ces points comptent, TF-IDF peut vous donner un léger avantage en incluant des mots et des phrases qui ajoutent de la valeur à votre contenu tout en étant recherchés par rapport à vos termes pour lesquels vous vous classez.

Par exemple, nous avons vu que le fait d’avoir une «cabane en rondins» et des «lodges avec bain à remous» devrait être pris en compte dans le corps de la page qui souhaite se classer en haut pour la «pause spa».

Encore une fois, il ne s’agit pas de trucs de mots clés. Ça ne marche pas. Vous souhaitez obtenir une certaine pertinence pour les termes censés apparaître dans la collection de contenu.

L’un des avantages de le faire est que vous pouvez découvrir des informations intéressantes sur la façon dont Google voit des pages très similaires. Les pages qui ont à peu près le même nombre de backlinks, ont optimisé pour le même mot-clé, ont une place sur le référencement sur la page mais se classent toujours à différents endroits dans les résultats de recherche.

Une fois que vous avez les données sur les termes que vos concurrents utilisent pour mieux décrire le sujet, vous pouvez regarder comment les concurrents décrivent un sujet donné, quels termes ils utilisent et à quelle fréquence, puis optimiser votre contenu plus efficacement.

Comment lire un rapport TF-IDF

Maintenant que vous savez quels termes vous manque dans votre copie et qui décriraient votre sujet de manière plus concise, il est temps de lire le rapport, de comprendre les métriques et de commencer à mettre en œuvre.

Rapport TF-IDF.

Voici une ventilation des termes importants.

Mot / Phrase: les 20 mots les plus utilisés par vos concurrents pour décrire le sujet des «pauses spa au Royaume-Uni»

Rivaux utilisant ce mot: Le nombre de vos rivaux utilisant ce mot dans les 10 premiers résultats. Plus il y a de rivaux, plus ce mot est important.

Utilisation de mots / expressions: Compare la fréquence moyenne d’utilisation de ce mot dans le corps du texte par vous par rapport à vos concurrents.

TFIDF: Le résultat de la formule TF-IDF qui récupère les termes utilisés dans la comparaison. C’est un bon début pour une session de brainstorming de mots-clés décrivant un sujet.

Que faire après le rapport

Maintenant que vous avez utilisé TF-IDF pour améliorer vos recherches et votre contenu, il est temps de vous montrer un exemple de l’apparence de la copie avant et après.

Avant et après TF-IDF.

J’ai ajouté les termes à droite que mon outil TF-IDF suggérait d’ajouter pour mieux décrire le contenu.

Comme vous pouvez le voir, il n’y a pas beaucoup de différence, je n’ai rien supprimé, j’ai simplement ajouté au contenu actuellement publié sur la page et j’ai trouvé un moyen naturel d’ajouter ces termes dans le flux.

Les résultats? Ils parlent d’eux-mêmes.

Dans Google Analytics, la même URL pour la même période a montré une croissance incroyable malgré le fait que l’industrie du voyage et de l’hôtellerie ait été très touchée par Covid-19.

Rapport de trafic GA.

Le contenu plus ancien est le meilleur candidat pour l’optimisation TF-IDF. Si vous répétez le même processus pour chaque élément de contenu de votre site Web, vous pouvez obtenir beaucoup de gains cumulés sur de nombreuses pages sans consacrer des tonnes d’heures à la mise à niveau du contenu à l’ancienne.

Comment utiliser TF-IDF?

Il existe deux cas principaux dans lesquels TF-IDF peut être utile

  1. Lorsque vous effectuez une recherche par mots-clés.
  2. Lorsque votre contenu ne se classe pas sur la page 1 des résultats de recherche Google.

Lorsque vous effectuez une recherche par mot-clé

Recherchez vos mots-clés au mieux de vos capacités en utilisant les outils de référencement les plus courants à votre disposition. Gardez à l’esprit que lorsque vous recherchez ces mots-clés, vous allez produire un contenu qui n’est pas très différent de vos concurrents.

Il y a de fortes chances que quelque chose ait déjà été écrit et que Google affiche des millions de résultats pour un sujet.

Bien classer, ce n’est pas seulement la durée ou la durée de votre contenu, mais aussi la façon dont vous êtes capable de décrire les choses. Votre objectif est de cibler non seulement les mots clés que vous recherchez, mais également les termes que les gens veulent voir dans la copie (en fonction de vos données).

Lorsque votre contenu n’est pas classé sur la première page de Google

Une fois le nouveau contenu publié, la plupart du temps, il ne se classera pas immédiatement sur la page 1. Même si vous avez une autorité de domaine très élevée, une forte présence sur le Web et des milliers de backlinks, il n’y a aucune garantie.

Le lien entre vos sujets et les nouveaux termes de TF-IDF devrait être un ajout naturel à votre contenu. Vous ne devriez pas avoir l’impression de simplement bourrer des mots-clés ici et là. Bien qu’il soit toujours avantageux d’inclure des variantes d’un mot-clé dans une copie, le but de TF-IDF n’est pas de simplement bourrer chaque mot dans la copie plusieurs fois.

Utilisez les informations d’une analyse TF-IDF pour affiner votre contenu, jetez un œil aux sujets que vous n’avez pas encore abordés et continuez à développer les angles que votre contenu aurait pu manquer auparavant.

Par exemple, il se peut qu’un produit ne dispose pas d’informations sur la taille et les frais de livraison, donc l’ajout de quelques paragraphes montrant comment la taille peut avoir un impact sur les coûts de livraison. Cela pourrait faire une grande différence. En fin de compte, TF-IDF est un outil précieux qui peut vous aider à faire passer votre contenu et votre classement au niveau supérieur. Ce n’est en aucun cas un bouton magique, mais ces petits changements peuvent s’additionner.

Conclusion

  • Commencez à utiliser TF-IDF pour découvrir des termes, des sujets et des mots clés plus pertinents au lieu d’utiliser vos instincts sur ce que Google considère comme un contenu pertinent.
    Rassemblez des données sur des concurrents, des mots-clés et des sujets spécifiques que vous souhaitez cibler;
  • Continuez à expérimenter vos leçons tirées de l’analyse TF-IDF, comprenez les rapports et ce qui doit être fait pour réussir à l’optimiser. La meilleure façon de procéder est de tester différents changements au fil du temps.
  • Passez plus de temps à analyser les termes importants plutôt que de passer trop de temps à créer des backlinks. Les résultats de votre analyse TF-IDF peuvent prendre un certain temps.