基于文本挖掘的ISO標準術語自動識別與標準術語知識圖譜構建研究

打開文本圖片集
關鍵詞:ISO,國際標準,術語自動識別,標準數(shù)字化,文本挖掘
0 引言
術語(Ter m)是蘊含特定學科領域核心概念的專用名詞,與特定學科的領域知識密切相關[1,2]。術語識別(Terminology recognition,TR)是指從語料中抽取具有領域代表性的詞匯或短語的過程,被視為信息抽取和命名實體識別(Naming entityrecognition,NER)領域的重要分支[3]。(剩余3906字)