网络检索内容摘要:

ageRank 文件 ID 发出链接 ID 被链接 ID 1 1 2,3,4,5,7 2,3,5,6 2 5 1,3,4,6 1,4,6,7 3 2 1 1,3,4 4 3 1,2 1,4,5 5 4 2,3,5 1,5 6 7 5 1 7 6 1,5 5 PageRank计算(二) PageRank计算(二)  ID=1的流入量= (ID=2发出的 Rank)+(ID=3发出的 Rank)+(ID=5发出的 Rank)+(ID=6发出的 Rank) = +++ ID=2的流入量= (ID=1发出的 Rank)+(ID=3发出的 Rank)+(ID=4发出的 Rank= ++ ID=3的流入量= (ID=1发出的 Rank)+(ID=4发出的 Rank)+(ID=5发出的 Rank)= ++ ID=4的流入量= (ID=1发出的 Rank)+(ID=5发出的 Rank= + ID=5的流入量= (ID=1发出的 Rank)+(ID=4发出的 Rank)+(ID=6发出的 Rank)+(ID=7发出的 Rank) = +++ =  ID=6的流入量= (ID=5发出的 Rank=  ID=7的流入量= (ID=1发出的 Rank= HITS算法  如果网页 A指向大量的重要网页,那么 A的建议就会变得有价值,如果 A指向 B,则说明 B也是一个重要网页。  HITS算法是由康奈尔大学的 Kleiberg博士于 1998年首次提出, HITs的全称 HyperlinkInduced Topic Search,是基于链接分析的网页排名算法。 HITs算法  HITS算法描述两种类型的网页: 1) 权威型( Authority)网页,对于一个特定的检索,该网页提供最好的相关信息。 2)目录型( Hub)网页,该网页提高很多指向其他高质量权威型网页的超链接。 由此,我们可以在每个网页上定义 “ 权威型权值 ” 和 “ 目录型权值 ” 两个参数。 HITs算法  如果一个网页有大量的链接指向其他网页,则这个网也就可能是一个好的 Hub;一个网页如果被大量的链接所指,那么它就可能是一个好的 Authority。  HITS算法的基本思想 1)好的 Hub型网页指向好的 Authority网页 2)好的 Authority网页是由好的 Hub型网页所指向的网页 HITS算法  1) HITS通过搜索引擎查询主题词,生成初始网页集合,称为根集合。 由于根集合中有些网页包含指向权威网页的链接,因此,对根集合进行网页扩展生成基集合,其中包括根集合指向的网页以及链接到根集合中的网页。  2)给基集合中的每个网页赋予一个 Hub权值 hp和一个权威权值 ap,初始值为同一个非负常数,然后对 hp和 ap进行运算。 ,其中网页 q指向网页 p ,其中网页 q由网页 p指向  pp。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。