<cite id="yyiou"><tbody id="yyiou"></tbody></cite>
<cite id="yyiou"><samp id="yyiou"></samp></cite>
  • <s id="yyiou"></s><bdo id="yyiou"><optgroup id="yyiou"></optgroup></bdo>
  • <cite id="yyiou"><tbody id="yyiou"></tbody></cite>

    首頁 > 期刊 > 自然科學與工程技術(shù) > 信息科技 > 計算機軟件及計算機應用 > 科研信息化技術(shù)與應用 > 一種基于層次分割和聚合的大數(shù)據(jù)流水線任務處理方法 【正文】

    一種基于層次分割和聚合的大數(shù)據(jù)流水線任務處理方法

    陳天樂; 蒲軍; 朱小杰; 崔文娟; 馮偉華; 王銳; 杜一; 周園春 中國科學院計算機網(wǎng)絡信息中心; 北京100190; 中國科學院大學; 北京100049; 中國煙草總公司鄭州煙草研究院; 河南鄭州450001
    • 大數(shù)據(jù)
    • 流水線
    • 批處理
    • 流處理

    摘要:近年來,互聯(lián)網(wǎng)各類型的數(shù)據(jù)不斷增長,數(shù)據(jù)的應用場景也越來越廣泛。如何將各種類型數(shù)據(jù)自動整合后接入不同的場景平臺成為了各界關(guān)心的問題。業(yè)界通常采用流水線工具進行任務調(diào)度,然而大多數(shù)流水線工具都無法將任務分割為多個子任務并行執(zhí)行。因此本文提出一種基于層次分割和聚合的大數(shù)據(jù)流水線任務處理方法:首先在分割模塊中將流水線中的任務分割為多個子任務,然后在合并程序中等待各子任務全部完成,合并結(jié)果,最終獲得整個任務的完成事件。實現(xiàn)了利用流處理框架處理有限數(shù)據(jù)集,擴展了流處理系統(tǒng)的使用場景,提升了流水線工具的代碼重用性。實驗表明,本文方法極大減少了數(shù)據(jù)庫I/O次數(shù),使得本文方法處理DBLP[1]數(shù)據(jù)的速率是Apache NiFi[2]傳統(tǒng)處理方法的7倍多。

    注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社

    投稿咨詢 免費咨詢 雜志訂閱

    我們提供的服務

    服務流程: 確定期刊 支付定金 完成服務 支付尾款 在線咨詢
    主站蜘蛛池模板: 凤阳县| 陇川县| 太仆寺旗| 沙洋县| 施秉县| 垣曲县| 嵩明县| 綦江县| 固安县| 延川县| 蚌埠市| 唐河县| 日喀则市| 鄯善县| 大埔区| 宁都县| 凉山| 高陵县| 洮南市| 徐州市| 深水埗区| 安西县| 阿瓦提县| 石渠县| 桑日县| 平定县| 江源县| 海口市| 宁波市| 九寨沟县| 高尔夫| 建始县| 萨迦县| 赤城县| 墨江| 高阳县| 高密市| 元江| 五大连池市| 和龙市| 威宁|