下图为遵照《互联网新闻开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的新闻的相关信息。
XML网页示例: 
XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。
*<updatePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的新闻更及时地出现在百度新闻中。
*<item>——标记每篇新闻信息的开始和结束。标记内为单篇新闻信息,不包括新闻专题。
*<title>——新闻标题。
*<link>——新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个URL,相当于多篇新闻。
<description>——新闻内容简介。
*<text>——完整的新闻正文(仅包含正文文字,不包含HTML语言等其它字符)。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。
*<image>——新闻正文内相关图片,采用绝对地址。若该篇新闻无相关图片,可以为空;若含有多张图片,请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。
<headlineImg>——为有可能成为头条的新闻制作的头条图,采用绝对地址。
<keywords>——反映新闻主题内容的一个或多个关键词,关键词之间以空格隔开。此项仅作为参考,检索结果不完全依赖于此标签中的内容。
<category>——新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。
<author>——新闻作者,可以为机构或个人 。
<source>——新闻来源,即原创媒体或其它机构 。
*<pubDate>——新闻发布时间,与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。
使用之前,您需要了解以下几点:
新闻源收录标准:
百度希望新闻源多样化,鼓励原创新闻内容。如果是具有大量有价值的新闻内容并能及时更新的正规、合法媒体网站,且网站服务器稳定、高速,就符合了百度收录新闻源的基本原则。
百度新闻搜索收录的内容包括时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论,数码产品、房产、汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等,是由专业人士撰写或编辑的中文信息,不包括发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。
您应对提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。
下面就开始吧!
第一步:创建XML文件
请按照上面公布的开放协议内容制作XML文件。
| 字符 | 转义后的字符 | ||
| HTML字符 | 字符编码 | ||
| 和(and) | & | & | & |
| 单引号 | ' | ' | ' |
| 双引号 | " | " | " |
| 大于号 | > | > | > |
| 小于号 | < | < | < |
第二步:验证XML文件
下面的地址提供了帮助您验证XML文件结构的多种工具:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的新闻信息不被搜索引擎遗漏。
第三步:提交XML网址
提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
百度新闻搜索将对您提交的数据进行测试和观察一周,若您基本按照 《互联网新闻开放协议》的要求进行制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。
注意: 百度新闻搜索不保证一定能收录您提交的全部内容。
相关文章
发表评论