首頁 > 期刊 > 人文社會科學 > 社會科學II > 教育綜合 > 山東醫(yī)科大學學報 > 基于網(wǎng)絡爬蟲技術的健康醫(yī)療大數(shù)據(jù)采集整理系統(tǒng) 【正文】
摘要:目的快速、準確地獲得公共衛(wèi)生服務系統(tǒng)的醫(yī)療數(shù)據(jù),并進行數(shù)據(jù)整理,為建立人群健康風險評估模型提供數(shù)據(jù)基礎。方法運用聚焦網(wǎng)絡爬蟲技術,設計算法并編程,在自動記錄和修正URL異常、原始數(shù)據(jù)存檔、保持登錄方式3個方面進行算法改進。將設計好的爬蟲應用于爬取已獲得授權網(wǎng)站的醫(yī)療數(shù)據(jù),通過醫(yī)學數(shù)據(jù)庫系統(tǒng),對數(shù)據(jù)進行解析、整理與導出。結果獲得多個公共衛(wèi)生服務基地數(shù)據(jù),為當?shù)卣块T提供數(shù)據(jù)分析報告,利用整理分析的數(shù)據(jù)完成多項健康風險評估模型建立。結論基于網(wǎng)絡爬蟲技術建立的數(shù)據(jù)采集整理系統(tǒng),可以解決獲取及整理網(wǎng)絡許可數(shù)據(jù)的難題,將此技術應用于醫(yī)藥衛(wèi)生領域,可使現(xiàn)有豐富的醫(yī)學數(shù)據(jù)資源得以充分利用并提高利用效率。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社
一對一咨詢服務、簡單快捷、省時省力
了解更多 >直郵到家、實時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進度實時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >