李韧
- 作品数:13 被引量:63H指数:5
- 供职机构:重庆交通大学信息科学与工程学院更多>>
- 发文基金:重庆市教育委员会科学技术研究项目国家自然科学基金重庆市自然科学基金更多>>
- 相关领域:自动化与计算机技术交通运输工程建筑科学文化科学更多>>
- 云计算与大数据处理课程教学模式研究被引量:4
- 2015年
- 针对当前我国对高素质云计算与大数据处理专业人才的迫切需求,分析了该领域的关键技术和主流工具,探讨了高等院校计算机相关专业的云计算与大数据处理课程体系结构,提出了以Hadoop开源平台下MapReduce、Spark和Storm等编程框架为重点的课程教学模式。
- 李韧
- 关键词:云计算大数据HADOOP教学模式
- 桥梁检测领域知识图谱构建与知识问答方法被引量:7
- 2022年
- 针对桥梁检测报告中数据抽取融合不充分以及管养决策过程中知识问答服务不足的问题,提出一种桥梁检测领域知识图谱构建与知识问答方法。首先,采用Web本体语言(OWL)对桥梁检测领域知识进行形式化语义建模,定义了该领域的概念、属性及公理约束;然后,采用基于Transformer编码器、双向长短时记忆(BiLSTM)网络和条件随机场(CRF)的联合模型以及网格化长短时记忆(Lattice-LSTM)网络对细粒度息进行抽取,并将融合后的实例数据存储在Neo4j图数据库中,实现知识图谱化表示;最后,采用朴素贝叶斯分类算法进行问题模板匹配,根据匹配结果生成结构化查询,并以自然语言形式返回问题答案,实现细粒度领域信息的交互式问答。在与卷积神经网络(CNN)、BiLSTM的对比实验中,该方法在命名实体识别、关系抽取任务中的F1值分别为93.28%、74.00%,优于上述神经网络模型。实验结果表明,所提方法能较好地适应桥梁检测领域交互式问答实际需求。
- 杨小霞杨建喜李韧罗梦婷蒋仕新王桂平杨一帆
- 关键词:知识图谱问答系统桥梁检测本体
- 面向垂直领域上下文特性的少样本关系抽取方法
- 2025年
- 现有的少样本关系抽取解决方案主要基于通用领域语料,尚未充分考虑垂直领域中存在的长文本、关系重叠等问题,面对垂直领域上下文时其关系抽取性能有待提升。针对上述问题,该文以桥梁检测领域和医疗健康领域为背景,提出了一种面向垂直领域上下文特性的少样本关系抽取方法。该方法首先通过预训练语言模型RoBERTa_chinese_base对文本进行编码,再分别在双向长短时记忆网络(BiLSTM)和实体特征提取模块中进一步提取上下文特征和实体级特征,并在特征融合的基础上,通过原型网络进行关系预测。实验结果显示,该文方法在自建的桥梁检测领域数据集Bridge-FewRel上评测结果优于对比的基线模型。在中文医疗健康领域数据集TinyRel-CM的少样本关系抽取任务上,该文方法的大部分结果优于基线模型。同时,该文方法在公有领域数据集FewRel 1.0的5-way-5-shot和10-way-5-shot任务上也取得了有竞争力的结果。
- 任浩李韧杨建喜肖桥杨小霞蒋仕新王笛
- 基于深度神经网络的实体链接研究综述
- 2024年
- 实体链接旨在将文本中的实体指称映射到知识库中相应的实体,是知识图谱问答、智能推荐等下游任务的基础。近年来,深度神经网络和预训练语言模型的快速发展为实体链接方法研究提供了坚实基础,并取得了显著性能提升。该文对近期实体链接模型与方法进行了系统性的综述,主要从四个方面进行:第一,介绍实体链接的一般框架,包括候选实体生成、候选实体排序和不可链接指称预测;第二,分析低资源实体链接研究现状,包括跨语言迁移方法和跨领域迁移方法;第三,探讨面向特定领域的实体链接研究方法,重点介绍生物医学和社交媒体领域;第四,简述多模态实体链接相关成果。最后,该文分析了目前实体链接方法面临的技术挑战,并展望了未来的研究趋势。
- 张玥李韧杨建喜肖桥谢江村蒋仕新王笛
- 公路桥梁定期检测领域命名实体识别语料库构建被引量:6
- 2020年
- 针对目前业界缺少适应我国公路桥梁检测领域文本特性的中文命名实体语料库的现状,构建一个较大规模并具有较高标注质量的公路桥梁定期检测命名实体语料库。在分析该类型文本的领域特性基础上,定义了由桥梁实体、结构实体、结构病害实体等六种目标命名实体类别及其标注规范,完成了1 245份真实桥梁检测报告和1 400余万字相关网页文本信息的数据准备和预处理工作,选取了其中150份作为标注语料并完成了多轮迭代标注,标注总字数超过32万字,各类型实体最终标注一致性最高达到98.5%,最低达到85.2%。选取了当前命名实体识别领域主流算法和通用领域预训练模型对标注语料进行初步实验,实验结果表明其识别效果有较大提升空间。该语料库的提出可为后续研究提供识别目标定义,并奠定数据和评测基础。
- 莫天金李韧杨建喜李童蒋仕新李东
- 关键词:命名实体识别语料库桥梁检测信息抽取
- 复杂背景下基于改进YOLO v8s的混凝土桥梁裂缝检测方法
- 2024年
- 针对混凝土桥梁裂缝因背景复杂、细小模糊导致检测精度较差的问题,提出了一种基于改进YOLO v8s的混凝土桥梁裂缝检测算法,精确定位了裂缝位置信息,并测量了裂缝长、宽等关键参数;以YOLO v8s模型为基础,引入全维度动态卷积(ODConv)获取特征图中更丰富的上下文信息,以增强目标特征提取能力,提高对细小模糊裂缝的检测能力;采用改进通道注意力模块构建了级联双层特征改进注意力(C2f-MA)融合模块,以挖掘特征图中更多的纹理信息,进一步使网络更加关注裂缝特征,从而抑制无关背景信息的干扰,提高复杂背景下的裂缝检测效果;使用焦距交并比(WIoU)损失函数来解决低质量样本的识别问题,进一步优化了模型的收敛速度和检测准确率;在桥梁检测报告中筛选出存在裂缝细小模糊、阴影、人工画线、杂草等具有复杂背景的裂缝图像,通过人工标注的方式建立了复杂背景条件下桥梁裂缝图像数据集;以召回率、平均精度和模型存储容量作为量化评价指标,并依次通过对比试验及消融试验来对模型进行综合评估。研究结果表明:改进YOLO v8s算法的召回率、平均精度和模型存储容量分别为0.829、0.893和11.14 MB,其综合评价指标优于基准方法YOLO v8s和其他目标检测模型,证明了提出的算法在复杂背景下具有良好的鲁棒性。
- 蒋仕新邹小雪杨建喜李昊黄雪梅李韧张廷萍刘新龙王笛
- 关键词:桥梁工程目标检测
- 语义Web技术课程教学模式探索与研究
- 2015年
- 语义Web是实现计算机理解Web资源语义和知识共享的下一代万维网远景,是世界万维网联盟推荐的未来Web技术发展重要方向。以现有Web开发技术为基础,探讨了高等院校计算机相关专业语义Web技术课程的体系结构,提出了以案例为驱动并充分使用Protégé建模工具、Pellet推理机及Jena查询引擎等本体应用工具开展实验教学的教学方法。
- 李韧
- 关键词:语义WEBWEB开发教学模式
- 基于Transformer-BiLSTM-CRF的桥梁检测领域命名实体识别被引量:21
- 2021年
- 作为我国桥梁工程领域最重要的数据源之一,桥梁检测文本蕴含了丰富的结构构件参数及检测病害描述等关键业务信息,但面向该领域的文本信息抽取研究尚未有效开展。该文在阐明其领域命名实体识别目标任务的基础上,分析了待识别实体在蕴含大量专业术语的同时,存在地名或路线名嵌套、字符多义、上下文位置相关和方向敏感等领域特性。鉴于此,该文提出一种基于Transformer-BiLSTM-CRF的桥梁检测领域命名实体识别方法。首先,利用Transformer编码器对检测文本字符序列的上下文长距离位置依赖特征进行建模,并采用BiLSTM网络进一步捕获方向敏感性特征,最终在CRF模型中实现标注序列预测。实验结果表明,相较于当前主流的命名实体识别模型,该文提出的方法具有更好的综合识别效果。
- 李韧李童杨建喜莫天金蒋仕新李东
- 关键词:命名实体识别桥梁检测TRANSFORMER
- 基于改进Segformer的混凝土桥梁表观病害轻量级识别方法被引量:1
- 2024年
- 现有基于语义分割的混凝土桥梁表观病害识别方法具有模型参数量较大、特征提取不充分、分割精度不高等缺点。针对上述问题,提出基于改进Segformer的混凝土桥梁表观病害轻量级识别方法——Segformer-SP,该方法选取MiT B0作为编码器,并引入语义融合模块(Semantic Fusion Module,SFM)和极化自注意力机制(Polarized Self-Attention,PSA)。在Segformer-SP中,SFM模块对低级特征和高级特征进行融合,以提高低级特征的语义信息量;同时,PSA自注意力机制模块可以在分割过程中捕捉全局上下文信息,解决病害特征不够充分的问题,从而进一步提高分割效果。试验结果表明:Segformer-SP的平均交并比(mIoU)和平均F1分数(mF1)相较于Segformer-B0分别提高了2.41%和1.91%;此外,Segformer-SP的mIoU和mF1均优于大部分主流语义分割算法;Segformer-SP的参数量仅为6.09×10^(6),FPS为56.54,更适合应用于终端检测设备。
- 蒋仕新唐椿程杨建喜李昊熊元俊李韧刘新龙王笛
- 关键词:桥梁工程轻量级
- 长短答案分类指导的机器阅读理解方法
- 2023年
- 针对现有机器阅读理解模型存在长答案不完整、短答案冗余,即模型对答案的边界信息捕捉能力有待提升问题,该文基于“问题分类+答案预测联合学习”的流水线式策略,提出了一种通过答案长短特征分类指导机器阅读理解的神经网络模型。该方法采用预训练语言模型对问题和文章进行语义表示,并以待预测答案的长短类型对相应问题进行分类,然后将问题分类的结果用于指导阅读理解中的答案预测模块,最终以多任务学习的方式得到全部答案的开始位置和结束位置。实验结果表明,该模型在CMRC2018数据集上的EM平均值为67.4%,F1平均值为87.6%,相比基线模型,分别提升了0.9%和1.1%。在自建的中文桥梁检测问答数据集上的EM平均值为89.4%、F1平均值为94.7%,相比基线模型,分别提升了1.2%和0.5%。在更少训练集规模的CMRC2018和中文繁体数据集DRCD上,该文方法也优于基线模型。
- 杨建喜向芳悦李韧李东蒋仕新张露伊肖桥
- 关键词:文本分类多任务学习