开始前,请确保您的网站包含在 Google 资讯中。 如不包含,您可以请求加入。
资讯 Sitemap 也使用 Sitemap 协议,区别在于:
Namespace / URLset 标记
应为资讯架构添加第二个命名空间:
http :/ /www . google.com/schemas/sitemap-news/0.9 资讯 Sitemap 的 urlset 标记应如下所示:
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">网址列表
每个网址可在资讯架构中加入下表中所示的可选资讯标记。 使用全部标记的网址如下所示:
http://mynewssite.com/article123.html
2006-08-14T03:30:00Z
财经, 合并, 并购, Business, Mergers, Acquisitions
标记必须是指向文章页面的网址。
资讯特有的标记定义:
标记 必需? 说明
是 文章发布日期为 W3C 格式,一般包含时间戳。 如果您未在 Sitemap 文件中加入此字段,则网页本身必须包含可抽取的日期。 让 Google 资讯清楚此文章的发布日期非常重要。 如果 Sitemap 文件没有包含文章日期,而且文章本身不含可抽取的日期,那么此文章将不会收入 Google 资讯,并且您会在网站管理员工具的资讯抓取错误页看到该文章的"日期未找到"错误。
可选 以逗号分隔的关键字列表用于描述文章的内容。关键字可从现有 Google 资讯类别列表中抽取,但来源并不仅限于此。
资讯 Sitemap 中的所有文章必须具有相同的发布标签。 一般来说,发布标签会指定发布名称和语言。 例如,如果某个网站发布 The Example Times(英文)和 Journal Exemplaire(法文),就会有两个发布标签来代表各个发布内容。 您网站可用的发布标签可在添加资讯 Sitemap 时显示的下拉菜单中找到。 如果您网站中包含订阅与非订阅内容、新闻稿与非新闻稿的混合内容,那么这些文章类型就会有其他发布标签。 请分别在单独的 Sitemap 中针对每个发布标签提交文章。 如果没有您需要的发布标签,则需要联系 Google 资讯支持小组,申请加入您需要的标签。
资讯 Sitemap 最多只能包含 1,000 个网址, 限制的目的在于让资讯 Sitemap 只包含您网站中最新的资讯文章。 建议您时常更新资讯 Sitemap。 Google 资讯会不断检索这些资讯 Sitemap,确保我们抓取的是最新内容。
下面是仅包含一篇文章的资讯 Sitemap 示例。
xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
http://mynewssite.com/article100.html
2006-08-17T03:19:00Z
体育, 棒球, Sports, Baseball
创建 Sitemap 后,请将其上传到包含您资讯文章的顶级目录,然后将其提交给 Google。