您的位置: 专家智库 > >

曹海龙

作品数:124 被引量:14H指数:2
供职机构:哈尔滨工业大学更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学语言文字电气工程更多>>

文献类型

  • 117篇专利
  • 4篇会议论文
  • 2篇学位论文
  • 1篇期刊文章

领域

  • 31篇自动化与计算...
  • 14篇文化科学
  • 8篇语言文字
  • 1篇电气工程

主题

  • 42篇翻译
  • 30篇机器翻译
  • 25篇语言
  • 19篇语料
  • 19篇向量
  • 18篇文本
  • 17篇句子
  • 14篇自然语言
  • 13篇源语
  • 13篇源语言
  • 11篇中文
  • 11篇网络
  • 11篇目标语
  • 10篇多语
  • 10篇语言模型
  • 9篇短语
  • 9篇语言处理
  • 9篇双语
  • 9篇自然语言处理
  • 9篇文档

机构

  • 124篇哈尔滨工业大...

作者

  • 124篇曹海龙
  • 117篇赵铁军
  • 108篇杨沐昀
  • 106篇朱聪慧
  • 106篇徐冰
  • 37篇郑德权
  • 5篇黄辉
  • 5篇朱俊国
  • 5篇李生
  • 4篇张越
  • 4篇李婷婷
  • 4篇张春越
  • 4篇刘乐茂
  • 3篇李晓倩
  • 2篇朱晓宁
  • 2篇于墨
  • 2篇徐旺
  • 2篇张文文
  • 2篇梁华参
  • 2篇胡鹏龙

传媒

  • 1篇智能计算机与...

年份

  • 7篇2025
  • 23篇2024
  • 12篇2023
  • 16篇2022
  • 13篇2021
  • 7篇2020
  • 8篇2019
  • 8篇2018
  • 10篇2017
  • 6篇2016
  • 3篇2015
  • 4篇2014
  • 2篇2013
  • 2篇2011
  • 1篇2006
  • 1篇2002
  • 1篇2001
124 条 记 录,以下是 1-10
排序方式:
基于外部检索提高大语言模型在财务查询问题上准确率的方法及其系统
本发明属于计算机技术领域,具体涉及一种基于外部检索提高大语言模型在财务查询问题上准确率的方法及其系统。步骤1:对财务问题进行总结;步骤2:基于步骤1财务查询问题的总结对大语言模型进行训练;步骤3:对财务问题的复杂度进行判...
赵铁军徐冰朱聪慧杨沐昀曹海龙智和露钟俊深夏赫绅
一种基于深度学习面向公检法领域的相关事件识别方法
本发明公开一种基于深度学习面向公检法领域的相关事件识别方法。步骤1:采集网络上各种热点信息标题,进行非中文、非英文、非数字字符的清理并存储在数据库中;步骤2:对步骤1数据库中的热点信息标题采用文本分类技术及深度学习进行识...
赵铁军徐冰杨沐昀郭常江朱聪慧曹海龙
一种面向多语言大模型的词语表示学习方法
本发明提出一种面向多语言大模型的词语表示学习方法。所述方法在表示能力上能够显著高于主流的静态和动态词向量模型。本发明突破性地将单语词的向量表示改进为多点的流形表示。这种新的框架有望增加词向量空间的整体容量,更好地应对一词...
曹海龙杨沐昀朱聪慧赵铁军徐冰傅畅
基于多任务学习的篇章级文本连贯性分类方法
本发明提出基于多任务学习的篇章级文本连贯性分类方法,所述方法包括:步骤1、使用预训练模型得到篇章级文本中每一句话的句子向量表示;步骤2、将句子向量作为输入,使用Transformer模型,得到篇章级文本的整体向量表示;步...
赵铁军夏名宏朱聪慧徐冰杨沐昀曹海龙
一种面向法律文本的多关系中主要关系的抽取方法
本发明公开了一种面向法律文本的多关系中主要关系的抽取方法。步骤1:根据选定的法律条文文本进行实体及实体间关系的定义;步骤2:根据步骤1的法律实体定义和关系定义,确定对法律原文的序列标注方式;步骤3:根据步骤2对法律原文的...
赵铁军杨沐昀徐冰徐家豫朱聪慧曹海龙
一种基于平行语料训练的篇章级可比语料平行短语对的抽取方法
一种基于平行语料训练的篇章级可比语料平行短语对的抽取方法,本发明涉及可比语料平行短语对的抽取方法。本发明是要解决获取平行语料需要花费高、将最相近的上下文的两个单词或片段互为翻译应用到可比语料上存在对于双语词典依赖很严重的...
曹海龙张捷鑫赵铁军
一种基于翻译简易度的数据筛选方法
一种基于翻译简易度的数据筛选方法,它涉及一种数据筛选方法。本发明为了解决机器翻译数据增强过程中数据质量不佳的问题。本发明将扩增后的所有平行句对作为筛选的对象,首先,利用原有数据集训练得到一个语言模型,该语言模型用于后续的...
曹海龙杨沐昀徐冰 翁兆辰朱聪慧
一种基于预训练的字音字形知识增强的中文拼写纠正方法
本发明提出一种基于预训练的字音字形知识增强的中文拼写纠正方法。属于自然语言处理技术领域。本发明的目的是为了改进中文拼写纠正技术的准确性,更好地解决字音或字形混淆导致的拼写错误,节省人工复核的时间。本发明首先从数据库中取出...
赵铁军 王晨懿徐冰杨沐昀朱聪慧曹海龙
基于多语平行语料的语义向量的机器翻译方法
基于多语平行语料的语义向量的机器翻译方法,本发明涉及机器翻译方法。本发明是要解决双语平行语料获得的语义信息通常较少的问题。本发明是通过一、输入平行的源语言1、2以及目标语言;二、根据公式(1)到公式(6)计算得到隐状态h...
朱聪慧赵铁军郑德权杨沐昀徐冰曹海龙
一种基于语料合并的无监督双语词典构建方法
一种基于语料合并的无监督双语词典构建方法,属于无监督双语词典构建领域。本方法步骤为:一、根据单语语料训练得到对应的单语词向量;二、根据单语词向量得到映射矩阵W;三、根据映射矩阵W抽取替换单词的词典;四、根据替换词典替换原...
曹海龙赵铁军朱聪慧韩梦凡
共13页<12345678910>
聚类工具0