教你创建Google网站地图Sitemap.xml(转)

http://teachmyself.blog.163.com/blog/static/18881422920119895248288/

    Sitemap.xml是 google搞出来的,也就是网站地图,不过这个网站地图是用xml写的,而且要按google的标准来写,并且要将写出来的这个文件 sitemap.xml上传到自己的服务器空间中去。目前,Google, Yahoo, MSN都已经声明支持这种格式,Baidu还没有声明支持,但估计走这一步也是大势所趋。这将是向众多搜索引擎提供你网站信息的一种很好的方法。

   提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址,比如动态网页,包含大量AJAX的网页或者flash的页面。二是为搜索蜘蛛 指明“工作方向”。Sitemap就是你网站上页面的列表,googlebot就按照这个去一个个的抓取收录页面,显然比它自己去找会效率高,而且要全。 Google网站上有完整的关于sitemap.xml的详细说明:

  http://www.google.com/support/webmasters/bin/answer.py?answer=40318&hl=zh_CN

  但很多站长看后仍然不会操作,下面这个教程就是手把手教会你创建Sitemap.xml。

1.         Sitemap.XML 的格式

完整格式如下:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" ><url><loc>http://www.yrtrip.com/default.asp</loc><lastmod>2008-07-17</lastmod><changefreq>daily</changefreq><priority>1.0</priority></url><url><loc> http://www.yrtrip.com/search2.asp?id=32003044&amp;sq=1</loc><lastmod>2008-07-17</lastmod><changefreq>weekly</changefreq><priority>0.9</priority></url>……
</urlset>

 

下面,对以上标签分别加以解释

    a)       <?xml version="1.0" encoding="UTF-8"?>

<urlset xmlns="http://www.google.com/schemas/sitemap/0.84" >

这两行就相当于网页文件中的<html>标签一样的作用。不必管这两行什么意思,照抄即可。

切记:一个字符也不能错,即使多一个空格,google网站采集时也会报错。另外,千万别忘了在文件的末尾加上</urlset>标签。

  b) url:每个标签包含一个网页地址,是以下标签的父标签。

  c) http://www.yrtrip.com/default.asp

  这里是页面链接地址,也就是你希望蜘蛛访问的地址。

   切记:在地址中出现的某些特殊字符需要使用转义字符,否则,google也会报错。最典型的就是 & 号,经常在动态网址中出现,在提交地址中必须写成 & 如:提交http://www.yrtrip.com/search2.asp?id=32003044&sq=1,google管理员工具就会 报错,而改为 http://www.yrtrip.com/search2.asp?id=32003044&sq=1提交后就没有问题了。我看到网上有人说 sitemap.xml只能提交一个参数的网页的说法,其实多半是因为没有使用转义字符而导致出错的。其他的转义字符就不一一列出了,大家可以在网上查。

  d) lastmod:页面最后修改时间

   这个很重要。Google的机器人会在索引此链接前先和上次索引记录的最后更新时间进行 比较,如果时间一样就会跳过不再索引。所以如果你的链接内容基于上次Google索引时的内容有所改变,应该更新该时间,让Google下次索引时会重新 对该链接内容进行分析和提取关键字。这里必须用ISO 8601中指定的时间格式进行描述,格式化的时间格式如下:

  •   年:YYYY(2008)
  •   年和月:YYYY-MM(2008-06)
  •   年月日:YYYY-MM-DD(2008-06-04)
  •   年月日小时分钟:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)
  •   年月日小时分钟秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)

  这里需注意的是TZD,TZD指定就是本地时间区域标记,像中国就是+08:00了

  切记:其他格式可能引起出错,比如将2008-08-08 写成2008-8-8就会出问题。

  e) changefreq:页面内容更新频率。

  这里可以用来描述的单词共这几个:"always", "hourly", "daily", "weekly", "monthly", "yearly",具体含义我就不用解释了吧,光看单词的意思就明白了。

  f) priority:相对于其他页面的优先权

  定于0.0 - 1.0之间 。

  切记:建议将各类网页根据重要性给出不同的数值,以方便蜘蛛的采集,不要耍小聪明全部写1.0,google管理工具会报错的。

  2. Sitemap.xml制作方式

  制作方式无非两种,自动方式和手动方式。

  自动方式一般使用生成工具自动生成,只需输入自己的网址,就可以得到完整的xml文件。这种方式一般适用于静态网站,在此不再赘述。但需要提醒的是,网上的工具良莠不齐,生成的文件经常有错误,不一定能通过google的校验,使用者需认真辨别。

  手工方式则是由站长手工填写或写程序完成均可,代码很简单,大家可以到网上查找。

  3. 提交

  Sitemap.xml制作完成后,就需要将xml文件提交到相关搜索引擎。

  Google提交网址:http://www.google.com/webmasters/sitemaps/?hl=zh-CN

  Yahoo提交网址:http://sitemap.cn.yahoo.com/

  提交后,一般在几个小时之内,系统就开始下载处理了。

  4. Sitemap.xml的校验

  至于你的网站地图是否符合标准,最方便的手段就是使用google的管理员工具了。

   在他下载你的sitemap.xml后几天内,这个工具就会将详细的分析结果反馈回来,包括:sitemap.xml中包含了多少地址,google已 将多少地址加入索引,sitemap.xml中出现了哪些错误,甚至蜘蛛采集过程中遇到的各种问题,比如哪些网页有404,500错误都会详细的罗列出 来,非常方便。

  如果你提交的xml文件一切无误,那么接下来,你就是等着让它的搜索蜘蛛来爬了,sitemap的文件告知了文件更新的频率,这样搜索蜘蛛来得更勤快,页面被收录当然也就更快。

  5分半钟:Google网站地图 Sitemap.xml

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/280810.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Oracle存储过程语法

创建基本的存储过程 1 CREATE OR REPLACE PROCEDURE MyProName IS 2 BEGIN 3 NULL; 4 END; 行1:CREATE OR REPLACE PROCEDURE 是一个SQL语句通知Oracle数据库去创建一个叫做skeleton存储过程, 如果存在就覆盖它; 行2:IS关键词表明后面将跟随一个PL/SQL体。 行3:BEGIN关键词表…

WPF-16 图形处理

我们这节主要介绍WPF常用画图标签&#xff0c;由于WPF图形处理设计大量篇幅 ,我们在这里抛砖引玉&#xff0c;具体更多的学习资料链接https://github.com/microsoft/WPF-Samples/tree/master/Graphics 该链接中微软提供了大量的学习Demo&#xff0c;WPF图形处理最大的区别在于…

powershell 文件/文件夹操作

新建文件夹 New-Item -ItemType Directory -Force -Path $TargetPath复制文件夹到另外文件夹 Copy-Item <源文件夹> <新文件夹> -recurse -force 复制文件&#xff08;与修改文件名&#xff09; // 达到复制文件到新文件夹&#xff0c;及修改文件名效果 copy-…

纯CSS制作各种各样的网页图标(三角形、暂停按钮、下载箭头、加号等)

三角形 <div class"box"></div> <style>.box{ width: 0;height: 0;border-top: 50px solid transparent;border-bottom: 50px solid transparent;border-left: 50px solid transparent;border-right: 50px solid red; } </style> 平行四边形…

您的MyFitnessPal帐户几乎肯定已被黑客入侵,请立即更改密码

If you’re one of the millions of the 150 million MyFitnessPal users, bad news: hackers have your email address, your user name, and your hashed password. 如果您是1.5亿MyFitnessPal用户中的数百万用户之一&#xff0c;那么这是个坏消息&#xff1a;黑客拥有您的电…

Oracle Grid 11.2.0.4 安装是出现INS-30510: Insufficient number of ASM disks selected.

最新文章&#xff1a;Virsons Blog 错误的原因是由于磁盘数和冗余层级不匹配&#xff1a; 如果创建用来存放OCR和VOTEDISK的ASM磁盘组&#xff0c;那么External、Normal、High三种冗余级别对应的Failgroup个数是1、3、5。也就是说&#xff0c;创建这三种冗余级别的磁盘组至少分…

动态编译库 Natasha 5.0 版本发布

动态编译库 Natasha 5.0 于十月份发布&#xff0c;此次大版本更新带来了强大的兼容性支持&#xff0c;目前 Natasha 已支持 .NET Standard 2.0 及 .NET Core 3.1 以上版本&#xff08;包括 .NET Framework&#xff09;了。引入项目NuGet\Install-Package DotNetCore.Natasha.CS…

著名软件公司的java笔试算法题!(含参考答案)

原题如下&#xff1a;用1、2、2、3、4、5这六个数字&#xff0c;用java写一个main函数&#xff0c;打印出所有不同的排列&#xff0c;如&#xff1a;512234、412345等&#xff0c;要求&#xff1a;"4"不能在第三位&#xff0c;"3"与"5"不能相连.…

django08: 视图与路由(旧笔记)

视图&#xff08;Views&#xff09; https://www.cnblogs.com/liwenzhou/articles/8305104.html 1.CBV和FBV 2.​​​​​上传文件示例 路由 https://www.cnblogs.com/liwenzhou/p/8271147.html 1.url正则表达 2.分组命名匹配&#xff08;参数&#xff09; 3.反向解析 …

【BZOJ1042】硬币购物(动态规划,容斥原理)

【BZOJ1042】硬币购物&#xff08;动态规划&#xff0c;容斥原理&#xff09; 题面 BZOJ Description 硬币购物一共有4种硬币。面值分别为c1,c2,c3,c4。某人去商店买东西&#xff0c;去了tot次。每次带di枚ci硬币&#xff0c;买s i的价值的东西。请问每次有多少种付款方法。 In…

ios 启用 证书_如何在iOS 10中启用就寝提醒,轻柔的唤醒和睡眠跟踪

ios 启用 证书If you have trouble regularly getting a full night’s sleep, the new Bedtime feature in iOS 10 might just help. Set a wake up time and how many hours of sleep you need, and iOS offers bedtime reminders, more gentle alarms, and basic sleep trac…

struts OGNL表达式

OGNLContext对象有两部分构成 一部分是ROOT&#xff1a;可以放置任何对象作为ROOT 另外一部分Context&#xff1a;必须是Map形式&#xff08;键值对&#xff09; OGNL表达式操作 package cn.future.a_ognl;import java.util.HashMap; import java.util.Map;import ognl.Ognl; i…

纤程(FIBER)

Indy 10 还包含对纤程的支持。纤程是什么&#xff1f;简单来说&#xff0c;它也是 一个“线程”&#xff0c;但是它是由代码控制的&#xff0c;而不是由操作系统控制的。实际上&#xff0c;可以认为线程 是一个高级纤程。纤程和 Unix 用户线程(Unix user threads)很相似。 线程…

制作一个用户头像选择器仿 WeGame

制作一个用户头像选择器仿 WeGameCropAvatar作者&#xff1a;WPFDevelopersOrg - 驚鏵原文链接&#xff1a;https://github.com/WPFDevelopersOrg/WPFDevelopers框架使用.NET40&#xff1b;Visual Studio 2019;制作一个用户头像选择Canvas为父控件所实现&#xff0c;展示图片使…

PS2019进阶笔记(二)

云端网校笔记&#xff08;PS2015&#xff09; 一、图层混合模式 图层面板上的左上角&#xff0c;默认正常 混合下面图层&#xff0c;下面正片&#xff08;如模特&#xff09;。 最常用是&#xff1a;不透明度 溶解&#xff1a;需调节透明度 变暗组&#xff1a; 亮区域去除…

Html5里frameSet不在使用的替代方法,使用ifram

原来得使用方式&#xff1a; <frameset rows"100,*" frameborder"0"><frame name"header" src"header.aspx"></frame><frameset cols"15%, *"><frame name"menu" src"left.aspx&…

网曝南方电网搞末位淘汰和裁员,给各下属单位强制规定辞退率和降岗降级率!...

电网作为垄断性国企&#xff0c;在人们心中一向是好单位的代名词&#xff0c;但最近却有网友曝光南方电网搞末位淘汰和裁员&#xff0c;给各单位下了辞退率和降岗降级率&#xff0c;每个单位都要开除一部分人&#xff0c;或者把一部分人岗级降下来。有南方电网员工马上跑出来辟…

二维数组中的查找

2019独角兽企业重金招聘Python工程师标准>>> 题目 在一个二维数组中&#xff0c;每一行中的数都按照从左到右、从上到下的递增顺序排列。要求输入一个整数&#xff0c;判断数组中是否存在该整数 实现代码 function find($matrix, $rows, $columns, $key) {//TODO 参…

C# JObject转换JSON文件相关处理

一、JObject.Parse 1.把整个json文件字符串转化成JObject格式。 JObject jsonData JObject.Parse(jsonString); 2.逐级转换成JObject 最低级是"Device": "Windowsr"&#xff0c;字典。 jsonData JObject.Parse(jsonData[jsonName][jsonIndex].ToStr…

通过修改然后commit的方式创建自己的镜像

创建自己的镜像&#xff1a;通过现有的镜像来创建自己的镜像。1、首先拉取一个镜像到本地$ sudo docker imagesREPOSITORY TAG IMAGE ID CREATED SIZEubuntu 12.04 5b117edd0b76 11 months…