网络信息结构挖掘
作者:张敬来源:http://www.zzqkw.com日期:2013-05-15人气:939
网络结构挖掘是从Web文档结构、WWW的组织结构和链接关系中推导的。网络信息结构挖掘的目的是寻找Web和页面的结构及其蕴含在这些结构中的有用模式,然后对其链接进行合理的分类,通过不同网页的关联有助于用户找到所需信息的相关资源,并且可以通过浏览特定的网页从中获取最新的动态信息。还可以发现Web文档本身固有的结构,此种结构既可以拥有用户的浏览,也可以对网页进行比较。
1.网络信息用法挖掘
通过网络信息用法挖掘,可以充分的了解用户的网络数据实际意义。网络信息内容挖掘和网络信息结构挖掘主要是针对原始数据的,而网络信息用法挖掘主要是针对用户和网络交互的过程中产生的数据。这些数据类型包括很多:用户对网络服务器的访问记录、浏览器日志记录、用户的个人信息、用户额交易信息等等。运用网络信息用法挖掘技术能够有效的从服务器以及浏览器端的日志记录中发现隐藏在网络数据中的一些无法通过索引获取的模式信息,还可以了解用户对网络系统的访问模式以及在网络上所进行的行为模式,从而对其作出预测性分析。
2.网络新挖掘在信息检索中的应用
网络信息挖掘的作用除了体现在具有很大权威的网页的生成上外,还可以通过Web的组织结构和链接关系中发现一些其他类型的知识。网络信息挖掘可以通过挖掘web的结构信息揭示蕴含在web内容之外的许多隐含的有用信息,例如web页面上的U不仅可以反映页面的类型,还可以在一定程度上反映页面间信息的存储位置和不同信息内容的层次关系以及通过分析网页的URL来分析这种层次关系。根据上述原理已有很多人提出了与web页面URL有关的启发式规则,并将其应用于寻找个人主页上。因此,利用网络信息挖掘可以很快的寻找个人主页和与其相似的网页。除此之外,web的信息挖掘还可以对web页进行合理的分类,预测用户的链接使用及链接属性的可视化,对各个企业搜索引擎索引的web页数量进行统计分析等。它也可以揭示文档结构信息中的有用模式,有助于从多个维度和层面提供检索途径。
3.结语
因为信息时代的发展,促使网络信息挖掘成为网络信息处理领域中的一项新技术,它可以使用户通过大量网络信息中,得到数据对象间的内在特性,并根据数据间的关联在网络资源中进行有目的获取相应的信息。目前网络信息挖掘是数据挖掘技术在网络时代网络信息处理中的一项非常重要的应用,同时也是今后网络领域中的一项崭新的研究课题。随着网络的快速发展和不断的普及,网络信息资源不但来源途径更加广泛而且内容也越来越丰富,但如何分析和利用这些无以计数的网络数据是当前比较突出的一个问题。网络信息挖掘在实际工作中具有重要的实践意义和非常广阔的应用前景。
热门排行
推荐信息
期刊知识
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了
- 职称话题| 为什么党校更认可省市级党报?是否有什么说据?还有哪些机构认可党报?
- 《农业经济》论文投稿解析,难度指数四颗星,附好发选题!