优胜从选择开始,我们是您最好的选择!—— 中州期刊联盟(新乡市博翰文化传媒有限公司)
0373-5939925
2851259250@qq.com
我要检测 我要投稿 合法期刊查询
您的位置:网站首页 > 优秀论文 > 社科论文 > 正文

认知情报学:大数据背景下情报分析的新机遇

作者:庞娜来源:《情报理论与实践》日期:2020-04-11人气:3854

情报分析是大数据时代情报研究中非常重要的一环。图书馆正在从信息时代向数据时代进行过渡,并伴随着资源的全面数字化、富媒体化以及开放共享政策的不断完善,爆炸式增长的数据资源为传统的情报分析提出了极其严峻的挑战,新的情报分析手段亟待解决,从数据时代到计算时代的转变已经悄然提上议程[1]。21世纪情报学的发展,离不开多学科的交叉融合,唯有在理论与实践不断的碰撞中,才能为情报学提供创新型的发展思路与更为广阔的发展前景。国外提出的“认知情报学”,正是对于情报学在当代与其他学科进行创新性融合实践的解决方案。

1 认知科学提出背景

1.1 背景学科介绍

1.1.1 认知、认知科学、认知计算 认知是一种心理活动,或是一种获取知识,理解思想、经验与感觉的过程[2]。认知包含像是知识、注意、记忆、判断、评价、推理、计算、解决问题、决策制定以及理解和语言的生产等一系列过程。在认知过程中,利用已经存在的知识来推理出新的知识[3]。

认知科学(Cognitive Science)是一门交叉学科的科学研究,其主要以现代科学的手段来研究心智及其处理过程,即探索人类的智力如何产生以及人脑信息的处理过程。在认知科学领域,认知科学家们关注语言、感知、记忆、注意力、推理和情感,并为了研究上述内容将一些诸如语言学、心理学、计算机科学、人工智能、哲学、神经科学、人类学等学科的知识运用其中[4]。

到目前为止,在学术界与工业界还没有对于认知计算(Cognitive Computing)广泛认同与接受的定义[5-7]。认识计算最早追溯到模拟人脑的计算机系统的人工智能,20世纪90年代后,研究人员开始用认知计算一词来表明可以教计算机像人脑一样去进行思考而不仅仅是开发一种人工系统[8]。通常对于认知计算的理解是指计算机通过使用硬件或者软件来模仿人大脑的功能,来辅助进行决策制定[9]。

一般来说,认知计算描述了基于人工智能的科学学科和信号处理的技术平台。这些平台包括一系列诸如机器学习、推理、自然语言处理、语音识别和图像识别、人机交互等多种技术。一个认知计算系统通常会包含以下几个特征:适应性[10]、互动性、辅助功能、上下文理解能力[11]。

1.1.2 情报学、情报分析 情报学(Informatics)最初创建于1956年,是由德国的计算机学家K.Steinbuch提出,情报学一词由“information”与“automatic”组成,描述了信息自动交互的过程。一般认为,情报研究包括情报收集、情报分析、情报处理与情报传播这四个阶段,其中,情报分析是情报研究过程中的非常重要的阶段。

情报分析亦称信息分析,是根据社会用户的特定需求,以现代信息技术和软科学研究方法为主要手段,以社会信息的采集、选择、评价、分析和综合等系列化加工为基本过程,形成新的、可增值的情报产品,为不同层次科学进行决策服务的社会化智能活动[12]。

情报分析是一个涵盖领域非常广的交叉学科,它涉及众多领域,例如,计算机科学、信息系统、信息技术与统计学等。近年来,随着计算机技术的飞速发展,更多使用数字化的方式来处理信息,情报分析的研究也逐渐偏向信息技术方向。随着人工智能的发展,一些诸如情感计算、社会计算、认知计算等领域,也正在与情报分析进行交叉融合。本文重点分析认知计算与情报分析在新时代碰撞出的火花——认知情报学(Cognitive Informatics,CI)。

1.2 大数据与学科融合背景下认知情报学的提出

大数据时代,海量、高速、多样的数据为情报学提出了更为严峻的考验。如何从海量数据中获取有效的信息,如何处理类型更加多样的富媒体化数据,如何对组织更加复杂的信息进行分析,如何有效地从庞杂的数据中抽取出知识,都是情报分析的难点。而认知计算的四大特性——辅助、理解、决策、发现,不仅为大数据提供了新的解决方案,同时也为情报分析带来了新的可能。

认知计算一般包含的技术与应用与人工智能密切相关,而人工智能正是认知计算的基础,例如,机器学习、深度学习、推理、自然语言处理、图像处理、语音处理、人机交互、特征提取、知识抽取、知识挖掘、数据可视化等。早在20世纪末,这些应用已经扩展到了情报学中辅助情报分析工作。

实际上在情报科学的许多研究领域都在借鉴认知计算的技术,或者说是人工智能的一些技术来为之服务。如基于语义的信息组织、知识抽取、知识挖掘、知识发现和智能情报检索等,均希望能够从人的认知角度去组织与管理信息,或从信息资源中挖掘出具有认知价值的知识等[8]。许多情报分析研究也在不断地吸取认知计算领域的研究成果,例如,在情报学中的引文数据分析借鉴了认知计算中的关联数据分析来为之服务,在数字图书馆的个性化服务中也借鉴了认知计算的自适应页面展示的思想来为不同类型的用户展示出不同的页面内容,认知计算中的专家系统也被应用到了情报服务中来辅助用户进行更好的决策。

认知计算虽然早被应用到了情报分析过程中去,但其作为一个独立的概念出现,标志一个新领域的诞生却是在21世纪初。2002年,美国的IEEE召开了第一届认知情报学国际年会,正式提出“认知情报学”这一概念与研究领域[13]。

认知情报学是对计算机科学、情报学、认知科学和智能科学的跨学科研究,其研究大脑和自然智能的内部信息处理机制和过程,以及在认知计算中的工程应用[14]。认知情报学作为一个多学科交叉的研究领域,主要解决一些由许多研究领域共享的问题,例如,计算智能、现代情报学、计算机科学、人工智能、认知科学、认知计算等研究领域。

2 认知情报学相关研究

在国外,认知情报学已经逐渐受到包括政府、研究机构、研究人员等的日益重视,成为认知科学的一个重要研究领域与研究热点。但目前在国内,还并未形成像在国外一样稳定且有力的研究力量,还处于初步发展阶段,并且还未直接提出如国外一般明确的认知情报学的概念,并未将其作为独立的领域进行专门研究,只是在若干研究中,提出了与认知计算融合的概念。故此处只展开国外对认知情报学研究的论述,国内的研究暂且不表。此外,还总结了国外研究中对于认知情报学的理论框架。

2.1 国外认知情报学研究历史

从早年开始,各国政府就对认知计算表现出浓厚的热情与支持。2002年,美国国家科学基金会(NSF)和美国商务部(DOC)共同资助的“聚合四大技术,提高人类性能”计划中,认知科学便名列其中,被视为是21世纪四大前沿技术,处于最优先发展的地位。同时,早期欧盟资助的聚合技术及其对社会科学与人文科学的影响(CONTECS)项目也强调了认知科学的重要性[8]。

国外早在21世纪初就将认知计算与情报学进行了成功的交叉融合。IEEE认知情报学国际学术会议(ICCI)从2002年的第一届认知情报学会议开始,迄今已经举办16届,促进了认知情报学涉及的相关领域及其技术的发展。

从ICCI会议名称的变化,我们能清楚地了解到认知情报学领域的变化,2002—2010年,会议名称一直是认知情报学国际会议(ICCI),从2011年至今,会议正式更名为认知情报学和认知计算国际学术会议(ICCI*CC),认知计算已经作为其中的重点被单独列出作为会议的名称。

其中,2016年ICCI*CC的会议主题为“Cognitive Computation,Learning,and Big Data Systems”,正式提出了将认知计算应用到大数据系统中去,解决大数据系统在处理数据时面临的诸如生产速度极快、规则与逻辑难以识别等问题,重点探讨了诸如语义化处理、自动推理、大数据的认知基础等问题。

2.2 认知情报学理论框架研究

目前国外关于认知情报学的理论框架包含以下4个领域的内容:自然智能、抽象智能、符号数学与认知计算[14]。认知情报学通过模拟基础的智能形式,抽象出来并进行数学建模,最后进行认知计算。整个框架从物理世界到抽象世界、从认知到计算,层层递进,模拟了人类知识发现、知识推理的过程。

1)自然智能基础理论主要研究了在认知情报学中涉及的人类本身就存在的智能,主要包含以下经典理论:信息物质能量IME模型、大脑的分层参考LRMB模型、实体属性关系OAR模型、自然智能NI模型。

2)抽象智能是将自然智能的概念更加抽象化,从底层研究神经、认知、功能与逻辑。抽象智能通过建立通用的数学模型来表征如何将信息转化为行动与知识。抽象智能解释了不同形式智能的基础的运行处理机制,研究了学习、思考、推理等过程。经典的抽象智能模型有通用抽象智能模型(Generic Abstract Intelligence Mode,GAIM)[15]等。

3)符号数学是利用数学来对现实世界中抽象出来的一些实体、关系、感知信息、逻辑概念、知识等进行建模,用数字化的形式将物理世界表征为抽象世界,为下一步进行认知计算提供计算基础。

4)认知计算模拟了大脑处理信息的过程,对用符号数学建立好的数学模型进行处理。认知计算一般包含如下技术:推理、自然语言处理、语音识别和图像识别、人机交互等多种技术。

整个流程如图1所示。

图1 认知情报学理论基础

3 认知情报学对情报学的支撑

下面分别从理论、技术两个角度来探讨认知情报学对情报分析的支撑。认知计算是认知情报学的核心基础,故在探讨时,会涉及利用认知计算的一些理论与技术,来表征认知情报学的一些特征。

3.1 情报理论支撑

许多情报学家从认知科学的角度对情报科学的相关理论进行过研究和探索,并形成了一些基于认知科学的情报科学理论[8]。在描述认知情报学理论支撑时,从认知计算的三个能力领域发现、决策与交流[16]来机行分析。

1)发现。发现是认知能力的体现。认知计算的发现的能力与情报学范式中的“认知观范式”联系紧密。认知观范式的主要观点是情报的接受与传递需要与用户的知识结构发生作用,并以知识结构的改变和完善为目的,基本上描述了认知过程中的知识发现过程。在情报学诸多流派中,认知科学与情报学的属性结构学派的联系尤为密切。

属性结构学派的情报学家布鲁克斯认为情报学的基本任务是探索和组织客观知识,并提出了著名的布鲁克斯方程式K(S)+ΔI→K(s+Δs),阐明了情报与知识之间的关系,并将情报定义为“是使人原有的知识结构发生变化的那一小部分知识”[17]。在认知过程中,强调利用已经存在的知识来推理出新的知识,正是描述的知识发现过程,与认知情报学中涉及的认知科学部分不谋而合。另外,该学派的另一位著名的情报学家贝尔金使情报学和认知科学的关系不断得到继续深化和体系化。他从认知观的角度提出了情报的概念,提出知识非常态状态(ASK),即用户之所以有情报需求,是认识到自己存在知识的非常态以至于无法解决某种问题,也无法正确描述需要什么来解决非常态,因此情报检索的目的就在于描述、理解和解决知识的非常态[17]。知识非常态状态本质也是一种寻求知识发现的过程。

2)决策。认知计算的决策能力是基于事实的,并且可以随着新知识的获取而不断更新迭代,并做出无偏见的决策。认知计算的决策能力,与情报学的竞争情报服务范式密切相关。竞争情报服务主要指的是人们通过合乎规范的方式进行信息收集、信息分析和信息服务。其主要提供的服务包含咨询服务、决策信息服务、情报分析服务等。

竞争服务范式的服务对象是决策咨询、商业决策、战略决策等情报需求,这与认知计算的能力领域中“决策”相对应。目前,认知计算系统更多地扮演一种顾问角色,向真人用户提供一组选项,而最终决策由真人用户给出。认知计算的“决策”能力可以为竞争情报服务提供决策支持。

3)交流。认知计算的交流能力是指,认知计算可以通过学习海量的、复杂多样的数据来发现其中的规则,并实时地为人们提供这些信息,其可以通过专家级的援助与理解能力,从根本上改变人和系统交互的方式[16]。通过深入的领域洞察并及时、自然、有辅助作用地呈现信息给用户。

认知计算的交流能力与情报学的学术信息服务范式联系紧密。学术信息服务范式主要指通过学术信息服务、图书馆信息服务、学科信息服务来辅助科学交流。在该范式下,涉及的领域诸如数字图书馆自动化与服务、知识化服务等,认知计算都能为之提供良好的人机交互支撑。

3.2 情报技术支撑

认知计算三个能力的实现,离不开5个要素:学习、个性化交互、可扩展性、多种数据类型处理以及无处不在的服务[16]。这5个要素与情报学的技术紧密相关,是情报学的支撑技术。

谈及情报学利用到的技术,首先会先涉及情报学所涵盖的服务。一般情报服务主要涵盖如下几个方面:自动收集不同信息源的信息、对收集到的信息进行深入分析与挖掘、情报检索、将有价值的信息向用户进行个性化情报服务等。这些服务通常会涉及自然语言处理、实体识别、语义检索、个性化推荐、数据挖掘、社会网络分析、数据库、模式识别等技术。

认知计算学习要素的实现,主要会涉及情报领域自动收集的不同信息源的信息,同时还涉及知识发现等相关技术;个性化交互要素的实现,与情报学中为不同用户进行个性化推荐技术紧密相关;可扩展性要素的实现,同时也为大数据环境下信息海量增长为情报学的知识发现带来种种困难提供了新的可能的解决方案;多种数据类型的处理,也与情报领域积极扩展自然语言处理之外的、更加复杂的数据的尝试相联系,未来可以为情报学在相关类型数据处理上进行技术支撑,例如,情报领域现在对图像处理也展开了积极的探索,传统文本中不能分析的电路图等进行有效分析与利用,已经比较成功的尝试可以抽取其中的电路元件进行分析,构建电路设计元知识表示[18];无处不在的服务,与信息服务中的数字图书馆、科技情报服务中随时随地远程实验追踪与控制[19]等技术服务相辅相成。

4 认知情报学为情报分析带来新机遇

大数据时代的到来,席卷了所有的行业,情报领域自然也不能例外。变革赋予情报领域的却不仅仅是阵痛,还有阵痛之后更为明晰的洞见与思考,以及对于情报分析未来走向更为明确的设计。

大数据为情报分析带来了许多非常有价值的内容,比如,数据变得越来越容易获取与透明化程度越来越高、能够更好地通过大量的浏览记录来发现用户需求、更好地为用户提供个性化服务、更好地辅助用户进行决策、能够催生出许多新的服务模式与产品、可以进行实时数据分析、促进数据驱动的发现与创新[20-21]。但是,与此同时,大数据的“4V”特征同时也为情报分析带来了一些挑战。

4.1 大数据时代情报分析面临的挑战

情报分析在大数据时代进入了飞速发展期,科技出版物每年的增长率大概在9%左右,每9年左右科技产出大概就会翻倍[22]。大数据的研究价值可以媲美“石油”,但如何进行挖掘与开采其价值,一直都是难点。

海量数据将会为情报分析提供前所未有的有价值的信息,但与此同时,如何对庞杂的数据进行分析,发掘看似“杂乱无章”的数据之间的关联,也是难点之一,当前情报分析中仅有极小的一部分数据被整合、分析、利用并且发掘出其中内涵与价值,大部分数据仍是尚未开发利用的。

大数据同时还具有“高速”的特征,即其生产速度极快,而传统的情报分析很大程度上是不能做到完全自动分析的,必须要有人工的参与才能进行,如何将情报分析过程实现完全自动化,也是大数据对于情报分析提出的严峻挑战。

大数据的“多样性”表征除了以前在情报分析的利用较多的结构化数据外,非结构化数据也在其中占有相当大的比例。事实上,近年生产出来的数据大部分都是非结构化的数据,例如文本、音频、视频等富媒体数据,是未来情报分析中非常重要且不可忽视的部分,将其他的富媒体化数据纳入情报分析的范畴,将会极大地丰富情报分析的内容与提高情报分析质量,但与此同时,这些非结构化的数据对情报分析工作提出了极大的挑战。

最后就是数据的质量问题,当前几乎所有领域中的数据都充斥着大量的冲突数据与噪声数据,会很大程度上干扰专业人员做出正确的情报分析。传统的情报分析在收集完数据之后,需要人工判断信息的真实与否,而大数据时代,如此海量的数据已经不是人力可及,必须借助计算机进行自动判断与分析才能满足时代对于情报分析的要求。

4.2 认知情报学为情报分析带来新机遇、新应用场景

数据时代犹如海浪一般席卷而来,从数据到信息、到知识、到智慧、到解决方案的整个过程的活动[1]需要计算能力的不断推动。认知情报学为知识发现与决策方案的制定提供了极具前景的解决方案,加速从数据到知识再到行动的转化过程,推动数据时代迈向计算时代。

4.2.1 大数据情报分析的解决方案 大数据蕴含着巨大有价值的信息的同时,其数据量之大、数据类型之广、生产速度之快、数据质量之痛,都为从业人员提出了不少难题,只有层层盘剥、深入大数据背后的矿藏,才会提取出其中最有价值的资源。

对于目前情报分析仅仅分析利用了一部分数据而很大一部分的数据被闲置并没有被开发利用、发掘其内涵价值的问题,认知计算为其提供了一个新的解决方案,认知计算是主要设计来整合与分析大的数据集的[23],为情报分析中的海量数据提供了解决思路。对于大数据产生速度极快的、传统的人工参与的情报分析已经不足以满足大量数据的分析需求,认知计算通过创建特定的应用场景,通过不断的人机互动以及与环境之间的互动,通过学习、推理和分析做出恰当决策来模拟人类的思维处理过程,可以快速对短时间内生产出来的大规模数据进行处理分析,并且可以无偏倚地对之进行评价。例如,在生命科学领域,由于生产速度极快,每年文献约提高9%,每9年文献即可翻一番[23],在该领域可以依托认知计算的分析、推理能力,对科技文献中的例如药物、疾病等实体,利用已有的知识,通过文章的描述自动推理出新的药物、疾病的关系,提高新药的问世效率以及疾病的攻关速度。

针对各类富媒体化数据情报分析难以满足的问题,认知计算可以理解科技论文等非结构化数据,并且将结构化数据与非结构化数据结合处理[23],为数字图书馆向各种数据类型拓展业务,例如音频、视频、图像等数据的处理,提供了新的可能。其可以支撑数字图书馆向真正的多媒体化的图书馆进行转型,未来的图书馆在其支撑下,可以包含更加丰富多样化的资源,诸如名师讲课视频、音频等,并对视频、音频等自动分析处理,可以直接对其中的内容进行跨数据类型的检索。比方说,可以根据通过文字直接检索出视频中与之相关的一小段内容或者与文字描述相关的图片。

4.2.2 重新定义知识发现 在情报分析方面,传统的基于数据计算的数据挖掘技术正向基于内容的知识发现技术发展[8]。但在基于内容的知识发现实现过程中,捕捉非结构化数据中蕴含的深层含义一直是一大难点。以科技领域为例,自然语言处理会面临的困难重重,例如,不同行业、不同学科、不同语言、不同的术语表示方式,等等,一直是自然语言处理的难点。可以借助认知计算在某个特定领域训练,学习相应的语言、术语、该领域中的思维模式以及通过与专家的交互来辅助理解该领域的知识。例如,IBM在医疗领域,通过认知计算向医生提供专家级的辅助能力,帮助医生精准、迅速地识别癌症,给癌症病人尽可能多的治疗时间,延长病人生命。

认知计算在实现自动知识发现的过程中,含有细粒度实体的知识图谱的创建是实现特定领域知识发现非常重要的一环。现在各个领域都有成功的领域知识图谱的创建,例如生物领域Smartfigures知识图谱[24]、地理领域的CrowdGeoKG知识图谱[25]、医学领域的KnowLife知识图谱[26]。除此之外,还有各大数据出版社,如Springer、Elsevier等,推出内容更加丰富的知识图谱,这些知识图谱中包含了更细粒度的实体,如期刊论文、论文附属数据、数据集、图书、参考文献、专利、临床实验、机构、会议、作者、主题领域、资助项目、下载阅读数量以及对应的软件工具等[1]内容。

抽取出离散的知识要素后,可以在其上进行关系抽取,实现自动的知识发现。例如,从文献中抽取蛋白质的相互作用[27],抽取药物与其不良反应[28],抽取公司之间的合作、竞争关系[29]等。在其上建立应用,可以辅助用户的日常工作,如加速新药的问世、识别潜在的合作竞争关系来确立本公司的经营管理方案等。

除了对于论文中细粒度实体间关系的知识自动发现,还可以对整个篇章知识结构进行知识发现,帮助用户迅速发现文章的脉络,包括研究目的、方法、手段、工具、结论等[30],高效地利用科技文献,加快知识获取过程。

4.2.3 新型的人机交互环境 在人机交互方面,认知计算可以辅助情报分析在为用户进行服务时提供非常好的解决方案,通过专家级的援助与理解能力,直接将解决方案嵌入到用户的搜索、浏览等行为中去,与用户进行深度交互,为用户提供更加高效的、舒适的专家服务来辅助用户做出更好的决策。目前已有人机推理网络(HuMaINs)[31]的探索,通过机器无偏倚的认知能力来辅助人类去规避非理智的决策。人机推理网络可以应用于网络教育,通过个性化的定制方案,为不同的用户提供根据用户水平自动调整教学难度以及教学目标的教学内容;还可以应用于医学健康领域,将医生纳入循环中,共同为患者的治疗方案做出决策;此外,在科学发现中,可以利用人机推理系统,突破以往的需要人为设定好数据以及技术的限制,将人与机器同时纳入解决问题的循环中去,在交互中共同去探寻复杂问题的解决方案。

除此之外,问答式服务、无人化服务方式也日益提上日程,成为新的服务模式。认知计算良好的推理与学习能力为深度理解人们的问题以及提供更为“专”“精”的答案提供了可能性。在未来,应用于图书馆的自动问答机器人将会代替人工成为主流,更好的分析理解能力与庞大的知识库会使图书馆自动问答机器人在服务质量上不逊于人工服务,并且还可以结合射频识别技术、物联网、无人机驾驶等技术,实现精准地定位服务以及自动书架取书等服务。

5 结束语

认知计算通过模拟人类的思维来进行感知、推理与应激反应,已经逐渐被各领域所关注并且尝试使用。认知计算有着处理各种类型的数据、理解数据、评估数据并且可以从数据中学习出潜在的、未知的、新颖的洞见[23]的能力,可以加速科研工作者的科研过程,在情报分析领域有着自己独特的优势,可以完善传统情报分析技术在大数据时代的不足。但目前国内对于认知情报学的研究刚刚起步,还不成熟,并未提出明确的概念,将认知计算与情报分析交叉融合进行实践的探索还并不成熟。认知计算会大大加快将信息转化为知识与行动的过程,为情报分析面临的当前信息环境迅猛的变革提供新的解决方案,为整个行业的服务业态探索提供新的思路。 


网络客服QQ: 沈编辑

投诉建议:0373-5939925    投诉建议QQ:

招聘合作:2851259250@qq.com (如您是期刊主编、文章高手,可通过邮件合作)

地址:河南省新乡市金穗大道东段266号中州期刊联盟 ICP备案号:豫ICP备2020036848

【免责声明】:中州期刊联盟所提供的信息资源如有侵权、违规,请及时告知。

版权所有:中州期刊联盟(新乡市博翰文化传媒有限公司)

关注”中州期刊联盟”公众号
了解论文写作全系列课程

核心期刊为何难发?

论文发表总嫌贵?

职院单位发核心?

扫描关注公众号

论文发表不再有疑惑

论文写作全系列课程

扫码了解更多

轻松写核心期刊论文

在线留言