网站首页 > 博客文章 正文
很多朋友听过搜索引擎中使用的是倒排索引,但是大多不知道什么叫做倒排索引,今天给大家讲解什么是倒排索引。
前面讲过搜索引擎的内容处理,搜索引擎会将内容索引到的内容处理放置库存中等待用户检索呈现,搜索引擎库中存储的信息只剩下网页主题内容。首先讲一下什么是正向索引。
正向索引如下图所示,通过正向索引直接参与排名的网页是这样进行呈现的,搜索引擎根据库存中的文件直接参与排名,这样与不分词是没有太大区别的,如果用户提交的是长尾词则搜索引擎进行内容相关度的计算会非常消耗资源。
为了使索引文件直接参与排名,搜索引擎会把上面的对应关系进行转换,也就是倒排索引,当用户发起关键词检索的时候,搜索引擎会检索已有库中存在的文件来匹配这个关键词,然后进行相关呈现。当用户搜索为关键词1+关键词2的组合词搜索引擎会把包含关键词1并且包含关键词2的文件调出,然后进行相关度和权重计算。这样会减少搜索引擎资源的消耗,进而加快搜索结果的呈现。
倒排索引中不仅仅记录了包含相应关键词文件的ID,还会记录关键词频率、每个关键词对应的文档频率,以及关键词出现在文件中的位置等信息。
因此在SEO操作中,需要注意关键词频率、核心关键词的使用位置,H标签的使用还有关键词变色的处理等方法,在倒排索引中这些都会对关键词相关度有所提升并且会提升网页排名。
猜你喜欢
- 2024-10-27 MySQL 为什么使用数据索引能提高效率
- 2024-10-27 Elasticsearch 在地理信息空间索引的探索和演进
- 2024-10-27 终于有人把Elasticsearch原理讲透了(二)
- 2024-10-27 PostgreSQL技术内幕6:PostgreSQL索引技术
- 2024-10-27 ElasticSearch的分布式架构原理(吐血整理!)
- 2024-10-27 「漫画」elasticsearch原理就是这么简单(上)
- 2024-10-27 Elasticsearch读书笔记(二)(elasticsearch 书推荐)
- 2024-10-27 搜索引擎原理系列教程:收录、索引、排名
- 2024-10-27 什么是预处理: 预处理简称为“索引”
- 2024-10-27 陈年SEO:解密百度SEO排序影响因素
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- powershellfor (55)
- messagesource (56)
- aspose.pdf破解版 (56)
- promise.race (63)
- 2019cad序列号和密钥激活码 (62)
- window.performance (66)
- qt删除文件夹 (72)
- mysqlcaching_sha2_password (64)
- ubuntu升级gcc (58)
- nacos启动失败 (64)
- ssh-add (70)
- jwt漏洞 (58)
- macos14下载 (58)
- yarnnode (62)
- abstractqueuedsynchronizer (64)
- source~/.bashrc没有那个文件或目录 (65)
- springboot整合activiti工作流 (70)
- jmeter插件下载 (61)
- 抓包分析 (60)
- idea创建mavenweb项目 (65)
- vue回到顶部 (57)
- qcombobox样式表 (68)
- vue数组concat (56)
- tomcatundertow (58)
- pastemac (61)
本文暂时没有评论,来添加一个吧(●'◡'●)