数据挖掘及其在网络信息检索中的类型及应用
1、网络信息资源及其特点
所谓网络信息资源就是指网络上能够满足用户信息需求的资源的集合。可想而知,网络信息资源相当的丰富,各方面的都有,其内容涉及到世界上的每一方面,例如:农业、文学、航天、地理、医疗、计算机、法律、娱乐界等几乎所有专业领域,网络资源是知识和信息的集合,是一批非常宝贵的财富。而目前的网络信息资源与传统的不同,以成为一种新型的数字化资源。网络信息资源的特点主要体现在以下几个方面:
(1)信息数量庞大、种类繁多以及传播范围比较广。网络信息类型呈现多样化,主要有文本、数据、图文、图像、音频、视频等信息;其内容也不是单一的既有健康的信息,也少不了有害和虚假的信息,从个人到政府都有一定量的信息。
(2)目前网络信息资源管理机制多样,没有统一的机制,以至于网络信息安全缺乏一定的保障。于是就出现了普遍存在的黑客、计算机病毒和色情信息。国家花费了大量的社会资源来防止有害信息的传播。
(3)由于科学技术的不断发展造成了网络信息资源更新数的极快,在网络信息管理方面就比较困难。网络信息属于自由发布,因此信息来源广泛,内容呈现出多种多样,质量也就没有了保障。
(4)网络资源最大的优点是它给用户提供了多层次的信息交流模式,反应了当今社会生活的各个方面,形成了网络的百科全书和具有快速的传播功能。
2、网络信息挖掘的类型
2.1网络信息的内容挖掘
网络信息的内容挖掘就是从网络中存在的内容、数据中发现出对自己有用的信息。网络信息资源类型繁多,其中大量的网络信息资源可以通过在网络中的索引和检索服务直接获取,但是还有一些网络信息是通过一些工具或方法获取,如用户通过提问而动态生成的结果就属于此类信息。还有一些私人网络数据,它们不能够通过就不能通过索引收索出来。另外,网络信息内容是由文本、图像、音频、视频和数据等形式的数据组成的,由此可见网络内容挖掘是一种多媒体数据挖掘形式。
- 2025年中科院分区表已公布!Scientific Reports降至三区
- 官方认定!CSSCI南大核心首批191家“青年学者友好期刊名单”
- 2023JCR影响因子正式公布!
- 国内核心期刊分级情况概览及说明!本篇适用人群:需要发南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的学者
- 我用了一个很复杂的图,帮你们解释下“23版最新北大核心目录有效期问题”。
- 重磅!CSSCI来源期刊(2023-2024版)最新期刊目录看点分析!全网首发!
- CSSCI官方早就公布了最新南核目录,有心的人已经拿到并且投入使用!附南核目录新增期刊!
- 北大核心期刊目录换届,我们应该熟知的10个知识点。
- 注意,最新期刊论文格式标准已发布,论文写作规则发生重大变化!文字版GB/T 7713.2—2022 学术论文编写规则
- 盘点那些评职称超管用的资源,1,3和5已经“绝种”了