华南木棉信息检索内容摘要:

网页 url 网页标题 网页主题内容 链出锚点文本 最长匹配法分词 最短匹配法分词 Google pagerank ( GPR)算法 简单 pagerank ( SPR)算法 8 系统框架 检索 用户输入查询词 索引库 二次检索 结果 TD:找出关键资源 (HAC) url特征 网页结构,目录型网页 网页的链出锚本 网页的链出网页 HP:找出首页 NP:?? 9 系统框架 二次检索 站内聚合。 判断每个网页类型 目录型还是主题型。 对网页的链出文本进行分析,计算其与查询词的匹配程度。 匹配程度越高,说明该网页越可能是关键资源。 计算该网页的链出网页与查询词的匹配程度。 越多链出网页与查询词匹配,说明该网页属于关键资源的可能性就越大。 10 评测结果 这次 SEWM2020评测,共提交了 5组主题 检索和 5组导航查询。 采用了链接分析技术,锚点文本,对网页进行分块处理 主题采用 aut。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。