-
技术详细介绍本发明涉及一种基于MST算法的越南语依存树库构建方法,属于自然语言处理技术领域。本发明包括步骤:首先构建越南语依存树库训练语料库;再利用越南语依存树库训练语料库的语料训练得到MST模型,再利用MST模型训练越南语句子得到越南语依存树库;对得到的越南语依存树库语料库进行校正。本发明所构建的越南语依存树库对越南语语言的句法分析、机器翻译及息获取等上层应用能提供有力支撑;可以构建10万句越南语依存树库;本发明的方法避免了人工收集和标注越南语依存树库的过程,节省了人力和构建树库的时间;本发明的方法相比采用CRFParser和借助汉‑越双语词对齐语料构建越南语依存树库方法准确率明显提高。
-
最新需求
