Une composante essentielle des revenus d’un blogger High-Tech est apportée par la pub via différentes régies. Le sujet reste souvent tabou et trop peu abordé à mon goût sur les blogs, je vous propose donc une analyse personnelle des résultats engendrés via Adsense (la régie publicitaire de Google) sur 80 de la centaine d’articles que j’ai écrit sur Presse-Citron.
Avant de commencer cet article, je tiens à préciser quelques points :
- Les chiffres générés sont ceux de mes bannières uniquement (Adsense sous le titre et celle en bas de l’article) sur mes articles uniquement. Aussi, comme ces chiffres ne représentent pas vraiment la totalité des revenus publicitaires par article (je n’ai pas les chiffres des bannières d’Eric) et dans un souci de discrétion également je ne ferai pas apparaître le montant en euros mais le revenu en % de l’article ayant le plus rapporté.
- Les graphiques présentés dans cet article représentent des tendances, pas des vérités statistiques, l’analyse que j’en fais n’engage que moi et certainement d’autres conclusions et une meilleure validation des résultats seraient possibles sans compter qu’avec « seulement » 80 articles considérés tous les résultats ne sont pas forcement très significatifs.
- Pour les éventuels statisticiens qui liront cet article, je ne rentrerai pas dans le détails des p-value ni même des test statistiques utilisés afin d’augmenter le confort de lecture des non-spécialistes, en revanche je serai ravi de vous donner plus de détails sur ces questions techniques en commentaire. Sachez tout de même que globalement je compare les classes en utilisant un bête t-test seulement sur les classes normalement distribuées (Shapiro test) et en vérifiant l’homoscédasticité comme il se doit (Levene test), en admettant une indépendance des articles (même si ce n’est pas entièrement vrai à cause des liens éventuels)
Cela étant dit, je vous propose de commencer. Dans les quatre parties qui composent cet article, je vous propose d’abord un point rapide sur les données que j’ai utilisées. Nous regarderons ensuite les tendances générales, ce qui nous permettra par la suite de comprendre comment les composantes sociale puis thématique d’un article influencent les revenus publicitaires.
Les données : méthodologie et traitement des cas particuliers
Comme je l’ai dit, sur les 115 articles que j’ai écrits pour Presse-Citron je n’analyse ici que les résultats de 80 d’entre eux. Les 35 articles ayant « sauté » n’ont pas été pris en compte pour différentes raisons :
- Ils ont été écrits à l’époque où j’écrivais gratuitement et n’incorporaient pas mes bannières
- Ils ont été écrits trop récemment pour avoir une véritable idée de ce qu’ils ont rapporté (plus de 90% des revenus d’un article sont engendrés les 3 premiers jours de sa publication mais j’ai pris plus de marge pour être sur)
- Ils ont généré des revenus aberrants à cause de facteurs externes qui faussent l’analyse, c’est le cas par exemple pour un article pas franchement intéressant sur la sortie d’Angry Birds sur PC mais qui au fil des mois a rapporté au moins 13 fois plus que n’importe quel autre de mes articles parce qu’il apparaît dans les premiers liens pour la recherche « Angry Birds pc » dans Google…
Pour résumer les articles considérés sont les articles au comportement « normal » publiés entre le 12 mai et le 23 août 2011. Mais venons-en aux données exploitées. Voici les informations à disposition, pour chaque article :
- Nombre d’affichage des bannières (comme pour les revenus en euros je ne donnerai pas directement ce chiffre mais un pourcentage du meilleur. Ces données reflétant la fréquentation de Presse-Citron, elles appartiennent à Eric, je ne me permettrai donc pas)
- Nombre de clics (idem)
- Pourcentage de clic par affichage ou CTR (pour mes bannières uniquement)
- Revenu par clic ou CPC
Je précise quand même que je « cache » les informations par respect pour ce site et cette entreprise qui n’est pas la mienne mais n’allez pas imaginer des chiffres incroyables, pour vous donner une idée tout de même, un article me rapporte en moyenne un peu moins de 5€ en revenus publicitaires… c’est le début mais pas encore tout à fait la richesse donc
J’ai ajouté à ces données Adsense de base des informations sur la diffusion sociale par l’article en renseignant le nombre de :
- Tweets
- Likes
- +1
- inShares
- Commentaires
J’ai également classé les articles selon deux approches : L’entreprise concernée par l’article et le thème ou l’angle de l’article.
Les thèmes sont les suivants (avec le nombre d’articles dans la catégorie) :
- Science (4) – Sujet scientifique non lié au web ou à la high-tech directement (exemple)
- Développement Web (8) – informations aux développeurs (exemple)
- Buzz (15) - Article sur un chiffre ou un évènement insolite (exemple)
- Produit (14) – Sortie d’un produit (exemple)
- Politique (5) – Information lié à une décision politique (exemple)
- Web (25) – Fonctionnalité d’un site web ou info liée à une entreprise web (exemple)
- Conflit (9) – Article lié aux diverses gueguerres des géants de la High-Tech (exemple)
Les entreprises sont les suivantes (avec le nombre d’articles dans la catégorie) :
- Google (22)
- Apple (8)
- Microsoft (5)
- Facebook (4)
- Twitter (10)
- Mix (8) - quand plusieurs entreprises sont concernées dans le même article
- Autre (6)
- Aucune (17)
J’ai fait le choix des catégories pour essayer de répartir au mieux et de la manière la plus représentative possible mes articles mais bien sur cette classification peut être sujette à débat. Tout cela étant prêt il ne reste plus qu’à ouvrir « R » (logiciel de statistiques utilisé pour générer les graphes suivants) et à s’amuser avec tout ça, allons-y gaiement !
Les tendances générales
Avant d’essayer de trouver des effets un peu « fins » et d’avoir une analyse intéressante, il convient pour ce genre de données de dégager les grandes tendances (i.e les variables fortement corrélées) pour pouvoir en faire abstraction par la suite. Pour ce faire, la première question que l’on se pose est « quelle est la variable d’intérêt dans cette affaire ? » Dans notre cas il semble raisonnable de se pencher sur les revenus (je ne perds pas le nord !).
Ce que l’on peut attendre de manière assez logique est que le nombre de vues d’une page et les revenus soient globalement proportionnels. Nous vérifions cela en générant le graphique et la droite de régression :
Pas de surprise jusqu’ici donc avec une relativement (R²=0.6) bonne corrélation entre le nombre de vues et les revenus par article même si vous pouvez remarquer que l’article le plus vu (le plus à droite) n’est pas celui qui a le plus rapporté.
Les revenus étant donc directement liés au nombre de vues, il convient de se poser la question « quels sont les facteurs qui influencent de manière directe le nombre de vues ?« . La réponse à cette question est certainement « l’intérêt de l’article » et peut-être aussi la qualité de celui-ci, malheureusement ces variables sont difficilement quantifiables (dur dur de mettre un chiffre objectif sur l’intérêt d’un article)… Sauf bien sur si l’on part du principe que les lecteurs partagent ce qui leur semble intéressant, dans ce cas on peut penser que le nombre de partages (Twitter, Likes, Linkedin) par article doit être corrélé au nombre de vues. Vérifions cela :
On peut voir dans ce cas que globalement le nombre de vues semble effectivement lié au nombre de partage mais on observe néanmoins pas mal de cas aberrants d’articles peu partagés et récoltant pourtant un grand nombre de vues (en haut à gauche sur le graphique donc) ces articles sont donc accédés par d’autres moyens que les réseaux sociaux. Je pense (mais je n’ai pas de preuve) que c’est l’effet « bon référencement » et que la plupart des visites sur ces articles proviennent de moteurs de recherche ou bien de grands sites référents, des chiffres que je n’ai malheureusement pas.
Dans tous les cas, la multiplication sur ce graphique des points en dehors de la ligne prouve que ce n’est pas parce qu’un article est beaucoup partagé qu’il rapportera forcement beaucoup de vues (donc d’argent, souvenez-vous le premier graphique !) et ce n’est pas parce qu’il est peu partagé qu’il rapportera forcement peu… cela étant dit, ces cas restent marginaux et les articles « populaires » sont quand même dans l’ensemble les plus rentables.
Voici pour les grandes tendance (que je vous invite à garder dans un coin de la tête pour bien comprendre le reste de l’article). Nous pouvons maintenant pousser l’analyse pour les partages sociaux en essayant de distinguer l’effet de chaque réseau social en particulier (Twitter, Facebook, LinkedIn et Google+) sur les revenus engrangés. C’est parti !
Réseau sociaux, qui rapporte le plus ?
Avec cette question, nous touchons à un point je pense, intéressant. Mais avant d’y répondre, il va falloir éclaircir un certaines choses. D’abord, il est souvent dit que les différents réseaux sociaux ne touchent pas les mêmes populations, en stéréotypant, Facebook est très « kikoolol », Twitter journalistique et spécialisé, G+ geek, Linkedin professionnel… En admettant que ces différences de population existent il faudrait donc savoir quelle est celle qui rapporte le plus ? (Les experts qui cliquent parce qu’ils savent que les revenus publicitaires sont importants pour la vie d’un blog ou les utilisateurs qui cliquent sur les gros boutons « Télécharger Maintenant » et se font avoir sans faire exprès voire même, qui sait, les gens intéressés par la publicité en question )
Pour déterminer cette population élite du blog-high tech et celle vers laquelle la ligne éditoriale devrait se concentrer (ou pas d’ailleurs !), il faut commencer par se détacher du facteur « Nombre de pages vues » dont on a parlé plus haut, en effet pour déterminer la qualité, il faut s’abstraire de la quantité de gens ayant visité, je vais donc diviser les revenus de chaque article par le nombre de vues de celui-ci, puis tracer les graphiques en fonction des partages sur les différents réseaux sociaux. Voyons ce que ça donne :
Comme vous pouvez le voir sur les graphiques précédents, il semblerait en fait que les quatre réseaux sociaux se comportent sensiblement de la même manière ! Apparemment pas de public de qualité spécifique à un réseau social et de mauvais public pour un autre, tout le monde est logé à la même enseigne. reste qu’il est intéressant d’observer un certain effet « buzz » car dans tous les cas (sauf Google+ mais c’est un cas particulier puisque jusqu’à très récemment le bouton +1 ne permettait pas de partager directement un article) on observe que les articles les plus partagés rapportent en moyenne en fait moins d’argent par vue que les articles les moins partagés (vous pouvez voir cela grâce aux droites rouges qui sont décroissantes).
En tout état de cause on peut donc raisonnablement éliminer le facteur « qualité des visiteurs spécifiquement à un réseau social » pour répondre à notre question : « Réseau sociaux, qui rapporte le plus ? ».
Comment faire alors ? On remarque quand on s’intéresse aux chiffres de partage que certains articles sont plus likés que d’autres, d’autres plus tweetés de manière spécifique. Cette différence entre les articles va nous permettre, de comparer directement les revenus apportés par les articles qui sont plus partagés sur un réseau social qu’un autre. Sur les graphiques suivants vous pourrez donc voir les revenus en fonction du nombre de partages sur un réseau en particulier divisé par le nombre de partages total sur l’article. (Google+ n’est pas présenté car en pleine période de lancement, les résultats seraient faussés)
On aboutit ici à une observation très intéressante, il semblerait en effet que les articles les plus spécifiquement likés sur Facebook soient en moyennes ceux qui rapportent le plus et de manière exactement symétrique les articles les plus spécifiquement tweetés sont ceux qui rapportent le moins ! Les articles spécifiquement partagés sur linkedin (qui n’existent pas vraiment d’ailleurs, le maximum était 35% des partages via linkedin) peuvent apparemment se situer dans n’importe quelle portion de revenus sans claire tendance.
Les mêmes conclusions peuvent être tirées des graphiques de nombre de vues en fonction des partages spécifiques sur un réseau (je ne les mets pas mais ils sont quasiment identiques aux précédents). Alors comment expliquer cela ? L’hypothèse que je pense la plus probable est que les articles extrêmement Tweetés, au contraire des articles populaires sur Facebook se heurtent au phénomène des gros comptes Twitter. Sur Twitter dans le domaine de la High-Tech, seulement un petit nombre de comptes concentrent un nombre immense de followers et si quelques-uns de ces comptes Tweetent un article, en fait la plupart des RT suivants seront inutiles puisque peu de nouvelles personnes verront le Tweet, n’apportant pas de nouvelles visites donc pas plus de revenus. C’est, pour moi, ce qu’on pourrait appeler le phénomène de saturation de Twitter, un phénomène qui n’existe pas (il existe surement mais beaucoup plus loin) sur Facebook puisque les « amis » ne sont pas forcement des gens ayant les même intérêts ou travaillant dans un milieu « High-Tech » et il est plus facile que l’article se répande dans d’autres sphères… c’est tout l’intérêt de la composante grand public du réseau de Mark Zuckerberg.
Thématiques, entreprises et revenus
Il est bien joli de savoir que les articles les plus likés par rapport aux autres réseaux sociaux sont ceux qui génèrent le plus de revenus, mais la vraie question que le blogueur (par intérêt scientifique, pas du tout par appât du gain ) se pose doit être la suivante : « Quels sont les articles qui rapportent le plus en terme de thématique abordée ?« .
Pour répondre à cette question j’ai donc classé mes 80 articles en fonction de deux composantes, le thème abordé et l’entreprise placée au centre de l’article. Voici les résultats que j’ai pu tirer de l’analyse des données :
Avant d’analyser ces graphiques, je vais essayer d’éclaircir la signification de ces boites bizarres à ceux qui n’en ont pas l’habitude. La chose importante pour une compréhension basique du graphique (dit en « boite à moustaches ») est que les traits horizontaux noir foncés sont les moyennes. La taille de la boite (verticalement), elle, représente la dispersion des données dans l’échantillon. En clair sur le graphique du bas par exemple, Apple et Facebook ont sensiblement la même moyenne de revenus (barre noire à la même hauteur) mais la variation des revenus sur les articles de Facebook est beaucoup plus forte avec des articles qui rapportent beaucoup et d’autres très peu.
Pour ce qui est de l’analyse, voici les points qui ressortent de ces graphiques :
- La thématique qui rapporte le plus est la catégorie « Vulgarisation scientifique » ce qui est assez intéressant à constater sur un blog dont ce n’est pas normalement la ligne éditoriale, un effet nouveauté apprécié des lecteurs ?
- Les thématiques qui rapportent le moins sont Web et Buzz, des articles généralement superficiels et courts qui peuvent être beaucoup lus mais ne sont pas très rentables. Toutes les autres catégories se valent sensiblement.
- Pour les entreprises, les différences sont moins clair, néanmoins on retrouve quand même que les articles sur Apple et les articles qui réunissent plusieurs entreprises (Mix) sont statistiquement plus rentables que les articles sur Twitter et Microsoft. Pour les autres catégories les résultats sont sensiblement les mêmes.
Voila pour ce long article qui a, j’espère, mis en lumière certaines caractéristiques propres au lectorat d’un blog comme Presse-citron et sur le comportement des internautes vis à vis des publicités en ligne.
Il reste probablement des tonnes de choses à dire sur ces chiffres, et si vous voudriez que je fournisse un graphique qui n’est pas présenté ici, demandez moi en commentaire.
Si l’article a du succès je songerai probablement à en faire une version réactualisée dans quelques mois pour voir si les tendances évoluent d’autant plus que grâce à cet article je vais pouvoir voir si les articles sur la publicité sont rentables !
Authors: