专利名称:一种训练自然语言处理模型的方法和系统专利类型:发明专利发明人:程浩,杨晓庆,李奘申请号:CN202010794536.0申请日:20200810公开号:CN111950295A公开日:20201117
摘要:本申请实施例公开了一种训练自然语言处理模型方法及系统。所述方法包括:获取语言训练样本以及初始模型,所述初始模型包括第一模型以及第二模型,所述第一模型至少包含编码器,所述第二模型至少包含所述第一模型的编码器;以及利用所述语言训练样本,经过迭代训练过程训练所述初始模型以生成自然语言处理模型,其中,所述迭代训练过程包括一次或以上的迭代,所述编码器在每一次迭代中被更新两次。本申请在训练执行具体自然语言处理任务的第二模型时,先通过训练编码器的方式对语言训练样本进行预处理,可以解决自然语言处理过程中数据集较大的问题,提高训练效率以及准确率。
申请人:北京嘀嘀无限科技发展有限公司
地址:100193 北京市海淀区东北旺路西路8号院34号楼
国籍:CN
代理机构:成都七星天知识产权代理有限公司
代理人:杨永梅
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容