富丽贞
- 作品数:21 被引量:69H指数:6
- 供职机构:中北大学软件学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术天文地球理学电子电信更多>>
- 大规模图数据可达性索引技术:现状与展望被引量:16
- 2015年
- 随着社交网络、生物信息网、本体等新兴领域的飞速发展,在现实应用中涌现出大量的图数据.可达性查询是有向图上一类最基本的查询.当图的规模非常小时,利用深度优先遍历(depth-first search,DFS)或可达性传递闭包可以很容易处理可达性查询.但是,随着图的规模越变越大,由于DFS方法的查询效率太低而可达性传递闭包方法占用的存储空间太大,这2种方法不再适用.因此,许多可达性索引方法相继被提出.这些方法已经被广泛应用于多个计算机科学领域,如软件工程、编程语言、分布式计算、社交网络分析、生物网络分析、XML和RDF数据库、路由规划等领域.此外,可达性索引还可用于加速其他图算法,如最短路径查询和子图模式匹配.首先介绍了可达性索引的应用背景.接着,依据支持的数据规模、数据类型以及查询类别,将现有可达性索引工作进行了分类,并对代表性工作进行分类比较;最后,讨论了现有的大规模图数据可达性索引方法存在的问题,并指出了未来的研究方向.
- 富丽贞孟小峰
- 关键词:可达性索引查询处理
- 基于信息熵的医疗概念语义相似度算法被引量:2
- 2017年
- 针对医疗概念中传统语义相似度计算精确度不高的问题,提出一种基于信息熵计算概念特征相似度和概念相关度的方法,综合得出概念语义相似度的计算模型。利用朴素贝叶斯分类对医疗概念分类,根据概念分类概率与分类质量评估函数得到概念的信息熵;通过熵值求得概念特征相似度,通过分析概念特征信息求得概念相关度;利用加权的方法将前两者的值综合为最终的概念语义相似度。实验结果表明,该算法较传统算法更加接近医疗领域专家评估的经验值,可以提高相似度计算精度,为医疗领域的相关应用和研究提供更高效的方法。
- 王超宋文爱富丽贞张晶亮
- 关键词:信息熵朴素贝叶斯分类概念语义相似度
- 电子病历的检索和结果多样化算法研究被引量:2
- 2016年
- 为使用户在电子病历中的检索更贴近用户意图,提出用图结构来表示电子病历数据的研究方法。根据电子病历所具有的实体和属性联系与图的拓扑结构类似的特性,首先将电子病历数据和检索图结构化;将EMRSearch算法与EMR-Tree索引结合,并引入新的Upper bound模型进行裁剪;然后进行匹配,最后将匹配得到的结果集通过Sort Diversity算法进行多样性重排序。实验结果表明,该方法不仅可以提高用户检索效率,还可以提高用户搜索满意度。
- 王超宋文爱富丽贞张晶亮
- 关键词:电子病历图结构
- 基于SSL-DDPM的脑电疲劳状态检测方法
- 2024年
- 疲劳检测对日常生活是至关重要的,尤其对于驾驶领域。基于脑电(EEG)信号的疲劳驾驶检测已吸引了众多学者的关注,但由于高质量带标签的EEG样本稀少问题严重阻碍了疲劳检测领域的发展。因此,文中首次将自监督学习(SSL)与扩散模型(DDPM)相结合应用于EEG的疲劳检测研究中,提出一种基于SSL-DDPM的脑电疲劳状态检测方法。该方法分为预训练和下游任务两部分,预训练阶段中首先对原始信号进行DDPM扩增,然后以ResNeXt代替ResNet为骨干网络对扩增前后的EEG信号进行特征提取,最后对提取的特征进行信号重构。下游任务的网络以共享预训练网络参数为主,对扩增前后的信号进行疲劳检测。通过SEED数据集和Multi-channel数据集进行实验验证,最终分类准确率分别达到88.23%和86.14%,验证了文中疲劳状态检测方法的有效性。
- 张麟华郭彩萍许骁哲富丽贞邢珍珍
- 关键词:脑电信号骨干网络信号重构
- 基于深度学习的短文本语义相似度计算模型被引量:10
- 2022年
- 基于深度学习的短文本语义相似度度量方法是现代自然语言处理任务的基石,其重要性不言而喻。本文提出一种基于卷积神经网络和双向门控循环单元的文本编码模型,通过卷积层提取重要语义并且通过双向门控循环单元保证语义顺序,采用孪生神经网络结构保证文本编码的一致性。选取传统的卷积神经网络和长短期记忆网络以及BERT模型进行对比验证,在Quora、Sick和MSRP数据集上的验证结果表明,本文模型的精确率和召回率表现优异,且F_(1)值也优于传统模型。
- 周圣凯富丽贞宋文爱
- 关键词:自然语言处理语义相似度卷积神经网络
- 基于代数的Transform查询优化策略
- XQuery/Update中定义了一种特殊的查询——Transform查询.Transform查询类似于关系数据库中的假设查询,可以表示成假设查询的一般形式:"Q when{U}",即查询Q的查询结果是假设数据库执行了更...
- 王伟郭青松富丽贞孟小峰
- 关键词:查询优化
- 文献传递
- 一种高效非归并的XML小枝模式匹配算法被引量:12
- 2009年
- 在XML数据库中,小枝模式查询是XML查询处理的核心操作.近几年,研究人员已提出许多种算法,如Holistic Twig和TJFast算法等.然而它们都是基于归并的,会有很高的计算代价.已提出的Twig2Stack和TwigList算法虽然可以克服这一点,但算法非常复杂.针对这一问题,尤其是考虑了通常查询表达式中只有少数几个结点是最终的输出结点这一特点,提出了TiwgNM算法及其扩展算法TiwgNME算法.算法不需要归并,且只用了少数栈来实现.实验结果表明,这些算法优于以前算法,尤其是对查询中只有祖先-后裔关系的表达式更有效.
- 陶世群富丽贞
- 一种轻量化伪装单兵目标检测算法
- 2024年
- 针对已有模型参数量较大、推理速度较慢的问题,提出了一种轻量化伪装单兵目标检测算法。其骨干部分以HGNetv2为基础,采用SRepVGG模块进行多尺度特征融合,在耦合检测头中组合使用了部分卷积和1×1卷积。提出的深度学习网络与基准模型YOLOv8对比,在保证检测精度的同时,参数量减少了35.4%,推理速度提升了18.9%,更适合在算力资源受限的边缘计算设备上运行。
- 张麟华李腾赵爽富丽贞
- 关键词:轻量化伪装目标检测骨干网络
- 基于代数的Transform查询优化策略
- XQuery/Update中定义了一种特殊的查询——Transform查询.Transform查询类似于关系数据库中的假设查询,可以表示成假设查询的一般形式:“Q when{U}”,即查询Q的查询结果是假设数据库执行了更...
- 王伟郭青松富丽贞孟小峰
- 关键词:XML文档查询优化策略关系数据库
- 文献传递
- 大规模图数据边受限制的最短距离查询算法
- 2019年
- 计算两点之间的最短距离是标记图的基本操作之一。对于大图,根据路标节点估算两点之间最短距离的方法来提高查询效率。现有的路标节点选择策略不能在中心性和计算量小两方面同时满足,路标节点存储到其他节点的距离信息,存储量仍然很大。对于大规模有向图来说,路标节点选取策略保证中心性的同时减少了计算量,使用了DBSCAN聚类思想将节点划分成不同的类,选择具有联通性的向前和向后核心节点作为向前和向后路标节点;存储类内路标节点与普通节点之间的距离信息以及类间路标节点之间的距离信息来减少存储量;源节点通过向后路标节点和向前路标节点到达目标节点,采用上界和下界的最小均值作为估计值。理论证明算法策略在时间复杂度和空间复杂度方面与传统方法相比降低了。实验证明对于大图在平均相对误差方面与传统方法误差数量级相同。
- 吕伟宋文爱富丽贞许文
- 关键词:预处理