专业的编程技术博客社区

网站首页 > 博客文章 正文

揭秘百度收录真相!一周深度探索后,我为何选择放手?

baijin 2024-10-15 08:33:36 博客文章 7 ℃ 0 评论

揭秘百度收录真相!一周深度探索后,我为何选择放手?SEO迷途知返,揭秘那些让人头疼的爬虫秘密!

微信公众号「雪之梦技术驿站」


致读者: 点击上方 “雪之梦技术驿站” → 点击右上角“ ... ”→ 点选“设为星标★ ” 加上星标,就不会找不到我啦!


引言

俗话说: "最忠实的用户就是爬虫,而爬虫中首推的还是谷歌爬虫."

经过一周的实测是骡是马已见分晓,百度蜘蛛是真的不太行,至少对我网站是这样,若是有所怀疑请跟我一起看看复现过程.

上述来自于个人服务器Nginx日志实时监听大屏,请参考以下文章:

解锁Nginx日志的宝藏:GoAccess——你的实时、交互式Web日志分析神器!

从最初的第二名访问量如今已经跃居第一名,其中少不了主动向百度和谷歌收录网站各自推送网站,当然我对百度是一如初见,而百度对我却不屑一顾.

对比一下谷歌收录效果,不仅被收录了还有用户访问,真的不要太明显啊!

教你两步实现个人网站被谷歌快速收录

所以,百度你到底行不行啊?整个的过程再次复盘总结一下,希望获得同频好友的交流帮助.

现象

浏览器直接查询站点收录情况: site:blog.snowdreams1006.cn

不论是主动提交到百度资源搜索平台还是加入了百度统计平台数据分析,都是惨淡空数据.

复现

百度搜索资源平台[1]-资源提交-普通收录

API提交

当日使用api接口当日提交了10条链接,次日查询已经能看到统计结果,但实际上次日发现site:blog.snowdreams1006.cn并没有被百度收录.

更新: 过了快一个礼拜依然是只有一条收录记录,数据惨淡.

手动提交

为了实验的准确性,于是第二天仅仅手动提交了10条链接,等待次日查询统计结果以及再次确认site:blog.snowdreams1006.cn收录情况.

等待第二天已经统计出来了手动提交的记录,我以为会有所改观,然而现实告诉我: 不要有不切实际的期待!

不出意外的是,site:blog.snowdreams1006.cn依然没有被百度收录,看样子提交后并没有被收录.

抓取诊断

既然普通收录的三种方式均已经尝试过而且没有什么效果,依然只有一条记录,还是之前抓取诊断的记录.

于是研究了网站的各个菜单功能,发现了抓取诊断能不能有用?

每个站点每周可使用70次,抓取结果只展现百度蜘蛛可见的前200KB内容.

再次实时验证site:blog.snowdreams1006.cn依然是收录1条,等待次日或者更久的时间再来看一下.

很快时间来到了第二天,依然如此,放弃了,爱咋咋地吧!

总结

前前后后实验了快一周的时间,真没想到百度令我大失所望,没有反馈也没有数据,真的心累了!

结论: 新网站注册百度搜索资源平台[2],添加站点后普通收录短期内无反应,当然也有可能是个例吧.

不论是普通收录的api提交方式还是手动提交或者抓取诊断等方式均无实际作用,最后吐槽一下真比不过谷歌收录.

所以,放弃百度收录,只好随他自己去吧,说不定哪天一时兴起再次想起来曾经注册过,统计过也会有一种时过境迁的感觉吧!

往期精彩文章

  • 谁家爬虫这么明目张胆?连UserAgent都不要了!
  • 解锁Nginx日志的宝藏:GoAccess——你的实时、交互式Web日志分析神器!
  • 重装系统之必装神器!错过它们?你的电脑将失去灵魂!
  • <黑神话:悟空>:国产游戏的震撼崛起
  • 恋爱年龄差背后的秘密
  • 每天一道美味佳肴《糖醋排骨》

欢迎扫码关注

微信公众号「雪之梦技术驿站」

欢迎扫码关注,私信回复『加群』一起交流技术

参考资料

[1]

百度搜索资源平台-资源提交-普通收录: https://ziyuan.baidu.com/dashboard/index?site=https://blog.snowdreams1006.cn/

[2]

百度搜索资源平台: https://ziyuan.baidu.com/dashboard/index?site=https://blog.snowdreams1006.cn/

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表