首頁 > 期刊 > 自然科學與工程技術 > 基礎科學 > 自然科學理論與方法 > 山東大學學報·理學版 > 基于時間片段和主題片段的時間關系識別 【正文】
摘要:時間關系的識別成為近年來自然語言處理領域(nature language processing,NLP)的一個研究熱點。引入時間片段和主題片段這兩種比事件觸發詞粒度粗的語義單元進行時間關系識別,首先在文本中利用一些時間篇章特點識別時間片段,然后利用相似度計算與支持向量機(support vector maehine,SVM)模型相結合的方法識別主題片段,最后在主題片段范圍內,以時間片段為排序對象,使用最大熵分類模型識別時間關系。在TempEval-2010的漢語語料上進行實驗,得到的時間關系識別宏平均精確率為60.09%。實驗結果表明:引入時間片段后可有效減少不必要的事件時序關系的識別;同時,在主題片段的約束下所得到的時間關系更簡潔、語義邏輯性更好。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社