<cite id="yyiou"><tbody id="yyiou"></tbody></cite>
<cite id="yyiou"><samp id="yyiou"></samp></cite>
  • <s id="yyiou"></s><bdo id="yyiou"><optgroup id="yyiou"></optgroup></bdo>
  • <cite id="yyiou"><tbody id="yyiou"></tbody></cite>

    首頁 > 期刊 > 自然科學與工程技術 > 基礎科學 > 地球物理學 > 地球信息科學學報 > 基于BiLSTM-CRF的中文層級地址分詞 【正文】

    基于BiLSTM-CRF的中文層級地址分詞

    程博; 李衛紅; 童昊昕 華南師范大學地理科學學院; 廣州510631; 航天精一(廣東)信息科技有限公司; 廣州510665
    • 中文分詞
    • 地址標注
    • 中文層級地址分詞

    摘要:中文地址分詞是中文地址標準化的基礎工作和地理編碼的重要手段,同時也是中文分詞和地理研究領域中關注的熱點問題之一。針對當前中文地址分詞方法缺乏地址層級切分和過多依賴詞典和特征的問題,本研究結合四詞位標注集和中文層級地址特點,構建針對中文層級地址分詞的地址標注體系,并提出融合雙向長短時記憶網絡和條件隨機場(BiLSTM-CRF)的中文層級地址分詞模型。該模型既考慮了BiLSTM模型能夠記憶上下文地址的特性,也保留了CRF算法可以通過轉移概率矩陣控制地址標注輸出的能力。針對該地址標注體系標注的訓練地址樣本,分別使用CRF、LSTM、BiLSTM與BiLSTM-CRF模型進行訓練對比。結果表明:①基于中文地址標注體系的模型分詞效果更佳,地址標注更為精細,符合實際地址分布情況;②BiLSTM-CRF模型精確度達到93.4%,高于CRF(90.4%)、LSTM(89.3%)和BiLSTM(91.2%),其整體地址分詞性能和各層級地址分詞效果相對于其他模型更突出;③各模型分詞性能與地址層級保持一致,即地址層級越高,分詞效果越好。本研究提出的中文地址標注體系和分詞模型為開展中文地址標準化工作提供了方法參考,同時也為進一步提升地理編碼技術的精準度提供了可能。

    注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

    投稿咨詢 免費咨詢 雜志訂閱

    我們提供的服務

    服務流程: 確定期刊 支付定金 完成服務 支付尾款 在線咨詢
    主站蜘蛛池模板: 文登市| 高雄县| 噶尔县| 湄潭县| 怀仁县| 徐汇区| 安福县| 康马县| 延安市| 新晃| 石家庄市| 南皮县| 湛江市| 图片| 纳雍县| 黑河市| 都江堰市| 平阴县| 永兴县| 沾化县| 永春县| 咸丰县| 寻乌县| 易门县| 罗山县| 杭锦旗| 左权县| 尼玛县| 昭平县| 侯马市| 普定县| 浦东新区| 怀集县| 桂林市| 两当县| 介休市| 福建省| 手机| 霸州市| 沾益县| 栾川县|