首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電子信息科學綜合 > 計算機學報 > 一種融合語義資源的生物醫(yī)學查詢理解方法 【正文】
摘要:近年來,隨著生物醫(yī)學相關研究的快速發(fā)展,生物醫(yī)學文獻的數(shù)量與日俱增,相關人員從海量文獻中獲取所需信息變得越來越困難,信息檢索技術能夠為用戶提供所需信息,但由于領域專業(yè)度高,術語龐雜,傳統(tǒng)通用領域的檢索技術往往很難勝任這項任務,而生物醫(yī)學領域存在豐富的語義資源,這些資源涵蓋該領域專業(yè)術語,可以對文獻檢索起到輔助和提升作用.因此,為進一步提升生物醫(yī)學文獻檢索的性能,該文嘗試基于詞共現(xiàn)查詢擴展模型,結合生物醫(yī)學領域特征,利用醫(yī)學主題詞表衡量擴展詞的重要性,綜合權衡擴展詞與查詢詞的共現(xiàn)關系和擴展詞在醫(yī)學主題詞表中的分布情況,選擇優(yōu)質擴展詞;并在此基礎上提出一種基于組排序學習的監(jiān)督式查詢擴展方法,該方法根據(jù)候選擴展詞對檢索性能的影響和候選擴展詞能否反映查詢的主題信息兩個方面對擴展詞進行相關性標注,提取與擴展詞相關的上下文特征和領域語義特征對擴展詞進行向量化表示,最后采用組排序學習方法訓練擴展詞選擇模型,完成查詢擴展.在TREC基因任務數(shù)據(jù)集上的實驗結果表明,該方法能夠有效提升查詢擴展性能,與基于排序學習方法ListMLE的監(jiān)督式查詢擴展方法相比,在文檔平均準確率方面分別提升4.41%和11.35%,有效提升了生物醫(yī)學文獻檢索的綜合性能.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社