大数据知识工程(BigKE: Knowledge Engineering with Big Data)不同于依靠领域专家的传统知识工程,除权威知识源以外,知识主要来源于
用户生成内容(UGC: User-Generted Contents),具有海量异质的特点,知识库需要自完善与增殖能力,问题求解过程根据用户交互进行学习。
大数据知识工程(BigKE: Knowledge Engineering with Big Data)是从国内兴起、引领大数据分析走向大知识研究和应用的一个国际前沿研究方向。2014年1月,吴信东教授等提出了大数据在异构、自治、复杂、演化环境下的HACE定理。2015年9月,吴信东与郑南宁院士、陆汝钤院士等基于HACE定理提出了大数据知识工程的顶层设计与研究纲要。不同于依靠领域专家的传统知识工程,大数据知识工程除权威知识源以外,知识主要来源于用户生成内容(UGC: User-Generated Contents),具有海量异质的特点,知识库需要自完善与增殖能力,问题求解过程根据用户交互进行学习。
依据大数据知识工程的顶层设计与研究纲要,本研究旨在建立大数据知识工程基础理论,形成利用海量、低质、无序的碎片化知识构建新型知识服务平台的方法学体系。本研究有望突破以专家知识为核心的传统知识工程中的“知识获取”和“知识再工程”两个瓶颈问题,并在医疗、教育、商业等各领域都具有巨大需求。
科学问题:本研究主要以构建具有群智、增殖、适配特征的大数据知识工程的基础理论为目标,以解决大数据知识工程中的碎片化知识表示、质量、适配问题为切入点,提炼并突破三个关键科学问题:(1)探索碎片化知识发现、表示与演化规律。提出适应碎片化知识分面、多维度、即时动态等特征的表示模型与在线挖掘方法,揭示碎片化知识的时空特性和演化机理,构建知识演化模型。(2)揭示碎片化知识拓扑融合机理。依据“拓扑影响机理”这一普适原理,分析碎片化知识间语义关联的拓扑与涌现特性,研究动态挖掘与拓扑融合机理,实现知识量质转换与增殖。(3)构建个性化知识导航的交互模型。针对碎片化知识的无序性与用户需求的动态多样性,设计多粒度情景感知与知识寻径模型,建立逐步求精的知识适配模型。