哪些会影响蜘蛛爬取友好性和便利性

发布时间:2022-03-18 点击:207
一、网站代码结构标准
一个初级的菜鸟seo优化都知道,蜘蛛是个程序,抓取互联网上内容就是靠识别网页代码来执行的。一个网站代码结构好坏与合理性,是会影响蜘蛛爬取的友好性和便利性的。
比如,用div+css写的网页就比用table标签写的网页对蜘蛛更加友好,更利于爬虫抓取。还有些页面标签如:h标签、b标签等都是利于蜘蛛爬取识别网站的标签。再者js、flash较多的网页加载速度慢,加大了蜘蛛爬行的难度,不利于蜘蛛的抓取。
二、网站图片标准
百度搜索引擎蜘蛛很多,对于图片就有专门抓取网页图片的蜘蛛。目前来看,图片蜘蛛是不能具体识别图片内容的。它需要靠图片的title标签、alt属性来识别图片内容。而且图片的尺寸大小也有规定(121*75比例),且图片和页面内容相关,清晰度高才受欢迎。
三、网站内容质量
网站内容属于诸多评判细节的重点,首先肯定不能是采集、相似度超高的内容。原创与否不强求原创,但是内容必须是符合用户需求的,且具有时效性和稀缺性。其次,文章标题与内容不能张三对李四,要做到题文相符。倘若都是标题党,网站内容解决不了用户的实际需求,那就没有意义了。seo外包公司认为内容的可读性也很重要,不能影响用户的正常浏览。这些蜘蛛都是可以通过跳出率、访问时间等数据来评判的,不要侥幸心。
四、网站浏览体验
页面的浏览体验是也是蜘蛛评判考核的一个细节,看网站是否有广告弹窗、页面布局是否合理、网页打开速度的快慢、内容主题内是否突出、锚文本的布局和密度。这些都是影响用户体验的,搜索引擎自然不会放过。现在好多网站广告弹窗遮住主题内容,用户浏览受限、难度加大。那你还想蜘蛛会喜欢你嘛!
五、网站可访问性
对于网站的可访问性,搜索引擎会从正常打开、权限限制、网站有效性三方面去判断。对于可以正常访问的网页,可以有正常的首页排名,对于有权限限制的网页,再通过其它维度对其进行观察;对于失效的网页,比如死链,打不开的链接,百度会降权其展现机制甚至从数据库中删除。