首頁 > 期刊 > 自然科學與工程技術(shù) > 信息科技 > 計算機軟件及計算機應用 > 科研信息化技術(shù)與應用 > 一種基于聚類的文章自動摘要方法及實現(xiàn) 【正文】
摘要:本文提出一種基于聚類的自動摘要方法,該方法將文章中所有句子轉(zhuǎn)換為句子向量,并且使用基于AGNES的算法對刪除離群點后的句子向量進行聚類,形成多個句子向量個數(shù)不超過設定閾值的簇,刪除句子向量個數(shù)極少的“無用”簇后,從每個簇中挑選出最能代表簇的語義的一個或者兩個句子,根據(jù)每個句子到語義中心的距離等信息從小到大確定指定數(shù)量的幾個句子作為關(guān)鍵句,拼接成文章摘要。通過在中國科普博覽網(wǎng)站上隨機挑選的500篇科普文章上進行實驗,上述方法各項指標均優(yōu)于基于圖模型的TextRank算法以及基于統(tǒng)計的方法,證明了該方法的有效性和可用性。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
一對一咨詢服務、簡單快捷、省時省力
了解更多 >直郵到家、實時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進度實時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >