Ticket #868 (closed defect: wontfix)
Atom/RSS Feeds descriptions fields should be escaped by CDATA
Reported by: | PERECil | Owned by: | xave |
---|---|---|---|
Priority: | normal | Milestone: | 2.2 |
Component: | module:core | Version: | 2.1 |
Severity: | normal | Keywords: | |
Cc: |
Description
English:
Google has now started to analyse feeds to rate a blog. However i was really surprised when I saw that webmaster tools found out that my first keywords in my blog were "div" and "span". Digging, out, i found that all thoses keywords where coming from rss/atom feeds, because the description escape the HTML instead of encapsulating the HTML data in a <![CDATA[ ]]> tag: it would be better, SEO wise.
Français:
Il se trouve que maintenant google analyse aussi les flux RSS/Atom pour noter la pertinence d'un site web. J'ai été surpris quand, dans webmaster tools, le mot clef qui ressortait le plus sur mon site était "span" suivi de près par "div". En fait webmaster tools ne tient pas compte des caractères échappés dans la balise description, ce qui met à mal l'analyse du flux.
La seule solution viable est, il me semble, de blinder le champ description avec un !CDATA et de décoder le code HTML à l'intérieur.
Visiblement, Google a appris à lire. On va donc considérer que la méthode actuelle est correcte (d'autant qu'elle l'est. C'est visiblement une histoire de choix ensuite.)