<cite id="yyiou"><tbody id="yyiou"></tbody></cite>
<cite id="yyiou"><samp id="yyiou"></samp></cite>
  • <s id="yyiou"></s><bdo id="yyiou"><optgroup id="yyiou"></optgroup></bdo>
  • <cite id="yyiou"><tbody id="yyiou"></tbody></cite>

    學(xué)術(shù)刊物 生活雜志 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊 購物車(0)

    首頁 > 精品范文 > 數(shù)據(jù)分析方向

    數(shù)據(jù)分析方向精品(七篇)

    時間:2023-06-27 15:55:25

    序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇數(shù)據(jù)分析方向范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

    篇(1)

    根據(jù)不完全統(tǒng)計,2016年1D6月,全球大數(shù)據(jù)領(lǐng)域共計發(fā)生157起投融資事件,其中中國發(fā)生了97起,超過總量的一半,其次為美國,發(fā)生41起,其他國家在大數(shù)據(jù)領(lǐng)域的投融資事件數(shù)量遠遠落后于中國和美國。

    2016年1D6月,中國大數(shù)據(jù)領(lǐng)域投融資金額規(guī)模達到503.70億元,排名第二的美國,投融資金額規(guī)模為111.38億元。其他上億元投資的國家分別為以色列5.35億元、英國4.32億元、德國2.24億元、加拿大1.06億元。

    中美大數(shù)據(jù)領(lǐng)域投融資對比

    從2016年上半年的整體投融資狀況來看,中國和美國的投融資事件占全球絕大多數(shù)的比例,中美兩國大數(shù)據(jù)業(yè)務(wù)的發(fā)展基本代表了大數(shù)據(jù)在全球的發(fā)展狀況。深入對比中美大數(shù)據(jù)領(lǐng)域的投資,對掌握大數(shù)據(jù)的應(yīng)用方向和技術(shù)方向具有較大的意義。

    從圖3可以看出,在大數(shù)據(jù)行業(yè)應(yīng)用方面,中美都有涉及的行業(yè)有醫(yī)療、營銷、物流、娛樂、體育和教育。其中,醫(yī)療領(lǐng)域是2016年上半年行業(yè)中發(fā)生投融資事件最多的領(lǐng)域,中國發(fā)生18起,美國發(fā)生5起;其次為營銷領(lǐng)域,中國發(fā)生6起,美國發(fā)生3起。

    相比美國,大數(shù)據(jù)的應(yīng)用行業(yè)在中國更加廣泛和活躍,2016年上半年中國有大數(shù)據(jù)投資而美國尚未涉及的領(lǐng)域比較多,如媒體、交通、金融、汽車、物聯(lián)網(wǎng)、藝術(shù)、招聘、旅游、農(nóng)業(yè)和租房等領(lǐng)域。其中媒體行業(yè)發(fā)生10起投融資事件,交通行業(yè)發(fā)生6起,金融行業(yè)發(fā)生6起。

    在大數(shù)據(jù)技術(shù)應(yīng)用方面,2016年上半年涉及的投融資方向有數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用、數(shù)據(jù)安全和數(shù)據(jù)工具。其中數(shù)據(jù)分析方向投融資事件最多,美國15起,中國14起;其次為數(shù)據(jù)工具方向,美國8起,中國5起;數(shù)據(jù)應(yīng)用方向,中國6起,美國3起;數(shù)據(jù)安全方向,中國5起,美國3起。

    從投融資的金額規(guī)模上看,2016年上半年,中國和美國的側(cè)重點各不相同,中國偏重于大數(shù)據(jù)行業(yè)領(lǐng)域的應(yīng)用,而美國側(cè)重于大數(shù)據(jù)技術(shù)領(lǐng)域的應(yīng)用。2016年上半年中國在大數(shù)據(jù)行業(yè)應(yīng)用的投資總規(guī)模達到485.1億元,在大數(shù)據(jù)技術(shù)應(yīng)用領(lǐng)域只有18.6億元;美國在大數(shù)據(jù)行業(yè)應(yīng)用領(lǐng)域的總投資規(guī)模為26.9億元,在大數(shù)據(jù)技術(shù)應(yīng)用領(lǐng)域達到84.4億元。

    中國投融資規(guī)模的TOP3均為行業(yè)領(lǐng)域,分別為交通、物流和醫(yī)療,投融資規(guī)模分別為305.4億元、105.0億元和50.7億元。而美國投融資規(guī)模的TOP3中有兩個為技術(shù)領(lǐng)域,分別為數(shù)據(jù)工具44.2億元、數(shù)據(jù)分析31.3億元;有一個為行業(yè)領(lǐng)域――醫(yī)療16.6億元。在行業(yè)應(yīng)用方面,中美投資事件最多的均為醫(yī)療領(lǐng)域。

    中美數(shù)據(jù)分析領(lǐng)域投融資市場對比

    可以看出,美國比較側(cè)重發(fā)展大數(shù)據(jù)的技術(shù)應(yīng)用,而數(shù)據(jù)分析是大數(shù)據(jù)技術(shù)應(yīng)用領(lǐng)域投融資最多的技術(shù)方向。2016年上半年,中國在數(shù)據(jù)分析方向的投融資事件達到14起,美國15起,高于中國。在金額方面美國更是遠遠超過中國,投融資金額高達31.3億元,而中國只有7.3億元。

    2016年上半年,數(shù)據(jù)分析領(lǐng)域的投融資事件主要集中在分析平臺、用戶分析和商業(yè)智能方向,分別發(fā)生投融資事件12起、10起和3起,各自占比為41%、35%和10%;其他幾個方向的占比都比較小。從金額分布上看,分析平臺占比最大,達到61%,其次為用戶分析16%,可視化分析13%。

    篇(2)

    關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)倉庫;數(shù)據(jù)分析;校園卡;教務(wù)

    中圖分類號:G434 文獻標志碼:B 文章編號:1673-8454(2015)10-0013-03

    隨著大數(shù)據(jù)時代的到來,各行各業(yè)都在利用大數(shù)據(jù)推動本領(lǐng)域的發(fā)展。常熟理工學(xué)院自2009年開展教育信息化建設(shè)以來,在數(shù)據(jù)分析方面進行了不斷地探索與實踐,目前廣泛應(yīng)用于教學(xué)和管理中。

    一、數(shù)據(jù)分析的必要性和可行性

    高校內(nèi)部一般都建有:教務(wù)系統(tǒng)、科研系統(tǒng)、學(xué)工管理系統(tǒng)、人事管理系統(tǒng)、資產(chǎn)管理系統(tǒng)等獨立業(yè)務(wù)系統(tǒng)。這些系統(tǒng)都各自記錄著學(xué)校方方面面的數(shù)據(jù),卻都靜靜地躺在服務(wù)器硬盤里,猶如埋藏在地下的金礦,不能為高校全局決策提供支撐。

    數(shù)據(jù)分析的目的就是要讓數(shù)據(jù)發(fā)聲,通過直觀的數(shù)據(jù)圖表來為高校管理提供輔助決策。例如:對教師的專業(yè)與學(xué)校開設(shè)專業(yè)的統(tǒng)計分析可以為人才引進提供參考;對學(xué)生的校園卡使用記錄和校內(nèi)上網(wǎng)認證記錄結(jié)合起來,可以為判斷學(xué)生的行為指明方向;對各二級學(xué)院的資產(chǎn)數(shù)據(jù)統(tǒng)計分析有助于學(xué)校對二級學(xué)院進行成本核算。

    二、數(shù)據(jù)倉庫的建立

    數(shù)據(jù)庫是數(shù)據(jù)分析的源頭,數(shù)據(jù)倉庫的建立是數(shù)據(jù)分析的基礎(chǔ)。

    建設(shè)過程中,首先要統(tǒng)一數(shù)據(jù)標準,只有準確的數(shù)據(jù)才是有價值的,如果各系統(tǒng)的數(shù)據(jù)標準不統(tǒng)一,就會造成不準確的數(shù)據(jù)分析結(jié)果,也就無法為高校管理提供真實有效的統(tǒng)計數(shù)據(jù);

    其次要建立公共數(shù)據(jù)平臺,公共數(shù)據(jù)平臺是指實現(xiàn)校園內(nèi)各種信息系統(tǒng)的互通互連和數(shù)據(jù)共享,包括多個系統(tǒng)業(yè)務(wù)數(shù)據(jù)集中存儲、備份、數(shù)據(jù)共享和數(shù)據(jù)管理的公共平臺,為學(xué)校各應(yīng)用系統(tǒng)提供基礎(chǔ)數(shù)據(jù);

    三是要規(guī)范數(shù)據(jù)流程,把各業(yè)務(wù)系統(tǒng)中形形的數(shù)據(jù)按標準定期抽取到學(xué)校公共數(shù)據(jù)平臺中。確保任何業(yè)務(wù)系統(tǒng)的添加和修改不影響其他系統(tǒng)的正常運行,同時新建應(yīng)用系統(tǒng)應(yīng)建立在統(tǒng)一的數(shù)據(jù)規(guī)范基礎(chǔ)和統(tǒng)一身份認證基礎(chǔ)上,調(diào)用公共數(shù)據(jù)平臺的基礎(chǔ)數(shù)據(jù)(如部門、教工、學(xué)生等基礎(chǔ)信息),應(yīng)用系統(tǒng)產(chǎn)生的數(shù)據(jù)也應(yīng)成為公共數(shù)據(jù)平臺的基礎(chǔ)數(shù)據(jù),可供數(shù)據(jù)平臺共享訪問。確保提供反映學(xué)校全面情況的數(shù)據(jù)信息,為整個學(xué)校提供決策支持所需的數(shù)據(jù)信息,為今后應(yīng)用系統(tǒng)的建設(shè)和信息服務(wù)奠定良好的數(shù)據(jù)基礎(chǔ)。

    圖1為數(shù)據(jù)架構(gòu)圖,最底層的是各業(yè)務(wù)系統(tǒng),他們產(chǎn)生的數(shù)據(jù)按編碼標準經(jīng)過抽取、轉(zhuǎn)換、加載到數(shù)據(jù)中心,數(shù)據(jù)中心再按需要把相關(guān)數(shù)據(jù)同步給相應(yīng)的應(yīng)用數(shù)據(jù)庫或各數(shù)據(jù)集市,最后形成各類主題數(shù)據(jù)分析或綜合決策系統(tǒng)。

    三、基于數(shù)據(jù)倉庫的數(shù)據(jù)分析

    在統(tǒng)一數(shù)據(jù)倉庫的基礎(chǔ)上,我們利用數(shù)據(jù)倉庫技術(shù)(ETL、OLAP、REPORT)和數(shù)據(jù)挖掘技術(shù),對多種數(shù)據(jù)集市進行數(shù)據(jù)分析,建立了校情綜合統(tǒng)計分析系統(tǒng)。該系統(tǒng)從學(xué)校基本情況、教職工信息、學(xué)生信息、教學(xué)信息、科研信息、資產(chǎn)與設(shè)備信息、圖書資料信息與師生消費等方面進行統(tǒng)計分析,為學(xué)校管理提供輔助決策支撐數(shù)據(jù)。

    該系統(tǒng)從學(xué)校全局出發(fā),通過多元主題展開分析,以文字、報表、圖表等多種形式展現(xiàn)分析成果。

    該系統(tǒng)的推出實現(xiàn)了教學(xué)質(zhì)量、學(xué)生學(xué)習(xí)、生活行為等各種信息的監(jiān)控與分析,對高校資源配置優(yōu)化、提高高校管理科學(xué)化等方面具有不可估量的重要意義。這里筆者將以校園卡和教務(wù)數(shù)據(jù)分析功能為例進行闡述。隨著校園卡在校園生活中使用范圍的日益擴大,在應(yīng)用過程中產(chǎn)生了大量數(shù)據(jù)。校園卡僅僅一年的交易數(shù)據(jù)就有大約1000萬條記錄。

    校園卡數(shù)據(jù)分析主要實現(xiàn)以下五大類的分析功能:

    (1)各時間段消費情況分析

    ①從“月、季度、半年、年”的角度來查詢消費總額、消費用戶數(shù)和人均消費等,反映出用戶消費支出的趨勢,也可反映出物價的變化情況。

    ②從“幾點幾分”的角度查詢消費人數(shù)可反映用戶在時間點上的消費習(xí)慣,對于各營業(yè)部門來說可以合理地調(diào)整工作時間、工作人員等,以加強服務(wù)。還可根據(jù)教職工就餐時間點來分析他們是否嚴格遵守學(xué)校作息時間。

    ③從“早、中、晚”的角度統(tǒng)計分析學(xué)生早餐、中餐、晚餐的就餐率。

    (2)各類消費人群消費情況分析

    ①對于學(xué)生工作管理層來說,從“個人、班級、院系”的角度來查詢消費金額作為發(fā)放貧困補助的依據(jù)。

    ②通過查詢一個時間周期內(nèi)(三天)學(xué)生消費人數(shù),起到了解學(xué)生是否在校的危機預(yù)警作用。

    ③從學(xué)生所屬院系、專業(yè)、年級等角度來查詢消費人數(shù)、消費金額和分布情況。

    ④從學(xué)生性別、來源地區(qū)(省、市、區(qū))、年齡等人的自然屬性來查詢消費人數(shù)、消費金額和分布情況。

    ⑤分析教職工的消費水平。

    (3)各營業(yè)單位消費情況分析

    從各個營業(yè)單位角度來查詢校園用戶消費人數(shù),消費金額和分布情況。

    (4)各交易類型消費情況

    從消費類型角度來查詢用餐、購物、上網(wǎng)、上機、水電消費等情況。

    (5)工作站、終端個數(shù)統(tǒng)計

    為直觀反映上述消費數(shù)據(jù),我們除用表格形式將分析結(jié)果展現(xiàn)在用戶終端外,還提供了柱狀圖、餅圖、曲線圖、點圖等形式來展現(xiàn)。圖2展示了我校2010年至2014年學(xué)生早、中、晚三餐平均價格,呈逐年穩(wěn)步上升狀態(tài),這給餐飲部門提供準確統(tǒng)計數(shù)據(jù)的同時,也穩(wěn)定了學(xué)生就餐消費水平的承受心理。

    高校教學(xué)信息化建設(shè)積累了豐富的業(yè)務(wù)數(shù)據(jù),根據(jù)需求,教務(wù)數(shù)據(jù)分析功能主要包括三大類:教學(xué)任務(wù)、學(xué)生成績和教學(xué)評價。圖3為教務(wù)數(shù)據(jù)分析數(shù)據(jù)源視圖,圍繞教師的教學(xué)工作量、學(xué)生取得的成績以及學(xué)生對教師的評價等,我們做了一系列的報表。例如:教學(xué)場地信息、學(xué)生情況、任課教師情況、各學(xué)期教學(xué)任務(wù)情況、成績信息、教學(xué)評價、歷年各專業(yè)招生人數(shù)、各學(xué)院歷年教學(xué)情況、各學(xué)院歷年學(xué)生對教師評價。

    另外,為滿足各二級學(xué)院要求,做了學(xué)業(yè)預(yù)警方面相關(guān)報表,各二級學(xué)院可根據(jù)年級、專業(yè),通過總學(xué)分排行、課程門數(shù)排行來關(guān)注排在后面的學(xué)生情況。

    數(shù)據(jù)分析表明,教師平均教學(xué)任務(wù)逐年增多,教師總體比較年輕,平均年齡男教師比女教師高,年齡在30-39之間的教師平均課時最多。管理學(xué)院歷年招生數(shù)比其它學(xué)院明顯高出很多,其中財務(wù)管理專業(yè)的學(xué)生數(shù)百分比最高。我校學(xué)生的成績也完全符合正態(tài)分布曲線要求。

    四、結(jié)束語

    大數(shù)據(jù)分析是一種發(fā)展趨勢,我們目前也僅僅就單項主題進行了逐個分析,如果把這些主題串起來,進行關(guān)聯(lián)分析,將會得出更有趣更有價值的結(jié)果,這也是將來我們努力的方向。

    參考文獻:

    [1]戴紅芳,馮翔,先曉兵等.商業(yè)智能在校園一卡通中的研究與實踐[J].微電子學(xué)與計算機,2012,29(7):175-179.

    [2]戴紅芳.基于多維數(shù)據(jù)模型的校園卡數(shù)據(jù)分析[D].上海:華東理工大學(xué),2011.

    篇(3)

    基本的大數(shù)據(jù)的處理流程可以分成數(shù)據(jù)采集、數(shù)據(jù)處理與集成、數(shù)據(jù)分析和數(shù)據(jù)解釋4個階段。首先獲取數(shù)據(jù)源的數(shù)據(jù),因為在數(shù)據(jù)源端的數(shù)據(jù)包含各種各樣的結(jié)構(gòu),需要使用某種方法將其進行預(yù)處理,使數(shù)據(jù)成為某種可以用一種算法分析的統(tǒng)一數(shù)據(jù)格式,接著需要找到這種數(shù)據(jù)分析的算法,將預(yù)處理過的數(shù)據(jù)進行算法特定的分析,并將分析的結(jié)果用可視化等手段呈現(xiàn)至用戶端。

    1.1數(shù)據(jù)采集

    大數(shù)據(jù)的采集是整個流程的基礎(chǔ),隨著互聯(lián)網(wǎng)技術(shù)和應(yīng)用的發(fā)展以及各種終端設(shè)備的普及,使得數(shù)據(jù)的生產(chǎn)者范圍越來越大,數(shù)據(jù)的產(chǎn)量也越來越多,數(shù)據(jù)之間的關(guān)聯(lián)也越來越復(fù)雜,這也是大數(shù)據(jù)中“大”的體現(xiàn),所以需要提高數(shù)據(jù)采集速度和精度要求。

    1.2數(shù)據(jù)處理與集成

    數(shù)據(jù)的處理與集成主要是對前一步采集到的大量數(shù)據(jù)進行適當?shù)念A(yù)處理,包括格式化、去噪以及進一步集成存儲。因為數(shù)據(jù)采集步驟采集到的數(shù)據(jù)各種各樣,其數(shù)據(jù)結(jié)構(gòu)也并不統(tǒng)一,不利于之后的數(shù)據(jù)分析,而且,一些數(shù)據(jù)屬于無效數(shù)據(jù),需要去除,否則會影響數(shù)據(jù)分析的精度和可靠性,所以,需要將數(shù)據(jù)統(tǒng)一格式并且去除無效數(shù)據(jù)。通常會設(shè)計一些過濾器來完成這一任務(wù)。

    1.3數(shù)據(jù)分析

    在完成了數(shù)據(jù)的采集和處理后,需要對數(shù)據(jù)進行分析,因為在進行數(shù)據(jù)分析后才能體現(xiàn)所有大數(shù)據(jù)的重要價值。數(shù)據(jù)分析的對象是上一步數(shù)據(jù)的處理與集成后的統(tǒng)一格式數(shù)據(jù),需要根據(jù)所需數(shù)據(jù)的應(yīng)用需求和價值體現(xiàn)方向?qū)@些原始樣本數(shù)據(jù)進一步地處理和分析。現(xiàn)有的數(shù)據(jù)分析通常指采用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘工具對集中存儲的數(shù)據(jù)進行分析,數(shù)據(jù)分析服務(wù)與傳統(tǒng)數(shù)據(jù)分析的差別在于其面向的對象不是數(shù)據(jù),而是數(shù)據(jù)服務(wù)。

    1.4數(shù)據(jù)解釋

    數(shù)據(jù)解釋是對大數(shù)據(jù)分析結(jié)果的解釋與展現(xiàn),在數(shù)據(jù)處理流程中,數(shù)據(jù)結(jié)果的解釋步驟是大數(shù)據(jù)分析的用戶直接面對成果的步驟,傳統(tǒng)的數(shù)據(jù)顯示方式是用文本形式體現(xiàn)的,但是,隨著數(shù)據(jù)量的加大,其分析結(jié)果也更復(fù)雜,傳統(tǒng)的數(shù)據(jù)顯示方法已經(jīng)不足以滿足數(shù)據(jù)分析結(jié)果輸出的需求,因此,數(shù)據(jù)分析企業(yè)會引入“數(shù)據(jù)可視化技術(shù)”作為數(shù)據(jù)解釋方式。通過可視化結(jié)果分析,可以形象地向用戶展示數(shù)據(jù)分析結(jié)果。

    2云計算與大數(shù)據(jù)分析的關(guān)系

    云計算是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴展且經(jīng)常是虛擬化的資源,是一種按使用量付費的模式。這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問,進入可配置的計算資源共享池(資源包括網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用軟件、服務(wù)),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進行很少的交互。目前,國內(nèi)外已經(jīng)有不少成熟的云計算的應(yīng)用服務(wù)。數(shù)據(jù)分析是整個大數(shù)據(jù)處理流程里最核心的部分。數(shù)據(jù)分析是以數(shù)據(jù)的價值分析為目的的活動,而基于大數(shù)據(jù)的數(shù)據(jù)分析通常表現(xiàn)為對已獲取的海量數(shù)據(jù)的分析,其數(shù)據(jù)來源可能是企業(yè)數(shù)據(jù)也可能是企業(yè)數(shù)據(jù)與互聯(lián)網(wǎng)數(shù)據(jù)的融合。從目前的趨勢來看,云計算是大數(shù)據(jù)的IT基礎(chǔ),是大數(shù)據(jù)分析的支撐平臺,不斷增長的數(shù)據(jù)量需要性能更高的數(shù)據(jù)分析平臺承載。所以,云計算技術(shù)的不斷發(fā)展可以為大數(shù)據(jù)分析提供更為靈活、迅速的部署方案,使得大數(shù)據(jù)分析的結(jié)果更加精確。另一方面,云計算的出現(xiàn)為大數(shù)據(jù)分析提供了擴展性更強,使用成本更低的存儲資源和計算資源,使得中小企業(yè)也可以通過云計算來實現(xiàn)屬于自己的大數(shù)據(jù)分析產(chǎn)品。大數(shù)據(jù)技術(shù)本身也是云計算技術(shù)的一種延伸。大數(shù)據(jù)技術(shù)涵蓋了從數(shù)據(jù)的海量存儲、處理到應(yīng)用多方面的技術(shù),包括海量分布式文件系統(tǒng)、并行計算框架、數(shù)據(jù)庫、實時流數(shù)據(jù)處理以及智能分析技術(shù),如模式識別、自然語言理解、應(yīng)用知識庫等等。但是,大數(shù)據(jù)分析要走向云計算還要賴于數(shù)據(jù)通信帶寬的提高和云資源的建設(shè),需要確保原始數(shù)據(jù)能遷移到云環(huán)境以及資源池可以隨需彈性擴展。

    3基于云計算環(huán)境的Hadoop

    為了給大數(shù)據(jù)處理分析提供一個性能更高、可靠性更好的平臺,研究者基于MapReduce開發(fā)了一個基于云計算環(huán)境的開源平臺Hadoop。Hadoop是一個以MapReduce算法為分布式計算框架,包括分布式文件系統(tǒng)(HDFS)、分布式數(shù)據(jù)庫(Hbase、Cassandra)等功能模塊在內(nèi)的完整生態(tài)系統(tǒng),已經(jīng)成為當前最流行的大數(shù)據(jù)處理平臺,并被廣泛認可和開發(fā)應(yīng)用。基于Hadoop,用戶可編寫處理海量數(shù)據(jù)的分布式并行程序,并將其運行于由成百上千個節(jié)點組成的大規(guī)模計算機集群上。

    4實例分析

    本節(jié)以電信運營商為例,說明在云計算環(huán)境中基于Hadoop的大數(shù)據(jù)分析給大數(shù)據(jù)用戶帶來的價值。當前傳統(tǒng)語音和短信業(yè)務(wù)量下滑,智能終端快速增長,移動互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展迅速,大數(shù)據(jù)分析可以為運營商帶來新的機會,幫助運營商更好地轉(zhuǎn)型。本文數(shù)據(jù)分析樣本來自于某運營商的個人語音和數(shù)據(jù)業(yè)務(wù)清單,通過Hadoop2.6.0在Ubuntu12.04系統(tǒng)中模擬了一個大數(shù)據(jù)分析平臺來處理獲得的樣本。希望通過對樣本數(shù)據(jù)的分析與挖掘,掌握樣本本身的一些信息。以上分析只是一些很基本的簡單分析,實際上樣本數(shù)據(jù)中所蘊含的價值要遠遠大于本文體現(xiàn)的。以上舉例意在說明基于云計算的大數(shù)據(jù)分析可以在數(shù)據(jù)分析上體現(xiàn)出良好的性能,為企業(yè)帶來更豐富更有效率的信息提取、分類,并從中獲益。

    5結(jié)束語

    篇(4)

    關(guān)鍵詞:數(shù)據(jù)分析;移動電子商務(wù);數(shù)據(jù)獲取;發(fā)展

    一、移動電子商務(wù)的定義

    移動電子商務(wù)(M-Commerce)是由電子商務(wù)(E-Commerce)衍生出的新生概念。隨著互聯(lián)網(wǎng)的不斷發(fā)展,移動電子商務(wù)正在全世界范圍內(nèi)的普及和發(fā)展。移動電子商務(wù)本質(zhì)上是電子商務(wù)技術(shù)的一種創(chuàng)新,基于移動無線網(wǎng)絡(luò),依托手機等個人移動通信設(shè)備,使用戶能夠減少時間和空間的限制并進行活動,是電子商務(wù)的一種新形式,并改變了電子商務(wù)的傳統(tǒng)格局。

    據(jù)艾瑞咨詢最新統(tǒng)計數(shù)據(jù)顯示,2016年移動購物市場交易規(guī)模約3.3萬億元,占網(wǎng)絡(luò)購物總交易規(guī)模的70.2%,繼2015年超過PC端之后,成為電子商務(wù)的主流渠道。同時,根據(jù)最新的一季度報告預(yù)測,2017年第三季度左右,全球移動電子用戶將達50億左右。

    二、移動電子商務(wù)中的數(shù)據(jù)分析與應(yīng)用

    數(shù)據(jù)分析是移動電子商務(wù)重要的組成部分,同時也為產(chǎn)品決策提供重要參考。針對移動產(chǎn)品,數(shù)據(jù)分析就是利用挖掘數(shù)據(jù)的分析方法與技術(shù)手段,在手機用戶大量的交易數(shù)據(jù)中總結(jié)產(chǎn)品流量和顧客轉(zhuǎn)化率之間的規(guī)律和特點,分析消費者的消費特點。具體則是通過網(wǎng)絡(luò)和交易信息提取客戶、市場、產(chǎn)品環(huán)節(jié)的數(shù)據(jù),然后建立相關(guān)模型,在更加動態(tài)化的商業(yè)環(huán)境下,能夠更有效的優(yōu)化產(chǎn)品及商業(yè)模式。

    1.數(shù)據(jù)挖掘

    通過自動化或半自動化的工具,數(shù)據(jù)挖掘可以挖掘出數(shù)據(jù)內(nèi)部隱含的模式,并從中發(fā)掘信息或知識,同時從已有的數(shù)據(jù)中提取模式,提高已有數(shù)據(jù)的內(nèi)在價值,并且把數(shù)據(jù)提煉,轉(zhuǎn)化成為知識。在移動電子商務(wù)的運營之中,針對大量繁雜的客戶消費及使用稻藎需要應(yīng)用多種數(shù)據(jù)挖掘技術(shù)來分析客戶特征,獲取用戶關(guān)注點,培養(yǎng)用戶忠誠度,并在此基礎(chǔ)上制定有效的營銷計劃來吸引優(yōu)質(zhì)用戶。

    在數(shù)據(jù)挖掘中最常使用的四種分析法:分類分析,關(guān)聯(lián)分析,序列模式分析和聚類分析:

    (1)分類分析可以定義區(qū)分數(shù)據(jù)類或概念的模型和函數(shù),以便能夠使用模型預(yù)測未知類標記的對象類。

    (2)關(guān)聯(lián)分析通常利用數(shù)據(jù)關(guān)聯(lián)規(guī)則進行數(shù)據(jù)挖掘,其目的是挖掘隱藏在數(shù)據(jù)間的相互關(guān)系。

    (3)序列模式分析同樣也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但側(cè)重于分析數(shù)據(jù)間的前后序列關(guān)系。

    (4)聚類分析,是指根據(jù)“物以類聚”的原理,將本身未有類別的樣本聚合成不同的簇,并對每一個簇進行描述的過程。

    2.數(shù)據(jù)處理

    (1)數(shù)據(jù)收集

    一款移動電子商務(wù)產(chǎn)品的分析團隊在處理數(shù)據(jù)前,首先要解決的問題是數(shù)據(jù)源的收集。數(shù)據(jù)收集可以分為二大類。第一類是直接能獲取的數(shù)據(jù),通常為內(nèi)部數(shù)據(jù)。第二類則稱為外部數(shù)據(jù),是需經(jīng)過加工整理后才能得到的數(shù)據(jù),如手機應(yīng)用平臺的下載數(shù)據(jù)。

    (2)數(shù)據(jù)清洗

    數(shù)據(jù)清洗是數(shù)據(jù)處理中的重要部分,通過工具或編程,如Excel,Python,對數(shù)據(jù)進行篩選、清除、補充、糾正,其目的是從大量雜亂無章、難以理解的數(shù)據(jù)中抽取并推導(dǎo)出對解決問題有價值、有意義的數(shù)據(jù)。清洗后保留真正有價值的數(shù)據(jù),為數(shù)據(jù)分析減少障礙。

    (3)數(shù)據(jù)對比

    對比,是數(shù)據(jù)分析的切入點。如果參照缺失,數(shù)據(jù)則無法確定定量的評估標準。分析過程通常采用二點切入法進行數(shù)據(jù)對比分析:橫向?qū)Ρ扰c縱向?qū)Ρ?/p>

    ①橫向?qū)Ρ龋桥c行業(yè)平均數(shù)據(jù),以及競爭對手的數(shù)據(jù)進行比對,以市場為軸心。

    ②縱向?qū)Ρ龋瑒t是和產(chǎn)品自身的歷史數(shù)據(jù)進行對比,以時間為軸心。

    (4)數(shù)據(jù)細分

    數(shù)據(jù)對比發(fā)現(xiàn)了問題后,需要用到數(shù)據(jù)細分來確定問題數(shù)據(jù)的范圍,根據(jù)移動產(chǎn)品的差異對數(shù)據(jù)異常的范圍和精度進行分析,隨后進行測試與修正。數(shù)據(jù)細分通常情況下先分緯度,再分粒度。

    三、數(shù)據(jù)分析

    數(shù)據(jù)分析是指用適當?shù)谋容^或統(tǒng)計方法對收集來的第一手和第二手資料進行分析,以求最大化地開發(fā)出數(shù)據(jù)資料的功能并發(fā)揮數(shù)據(jù)的作用。為了提取有效信息和形成結(jié)論,通過分析手段,可以對數(shù)據(jù)加以詳細研究和概括總結(jié)。在進行正式的數(shù)據(jù)清洗,確保了數(shù)據(jù)可靠性與完整性后,可對所獲取的數(shù)據(jù)進行多層面的具體分析。根據(jù)不同的數(shù)據(jù)分析層面和結(jié)果導(dǎo)向分類,在移動電子商務(wù)的數(shù)據(jù)分析中常應(yīng)用兩種分析類型。

    第一種,傳統(tǒng)電子商務(wù)營銷管理中的常用分析:SWOT、4P、PEST、5W2H、Userbehavior等;第二種是統(tǒng)計分析:描述統(tǒng)計、假設(shè)檢驗、相關(guān)分析、方差分析、回歸分析、主成分與因子分析、決策樹等。

    1.數(shù)據(jù)分析方法

    對于第一種類型的數(shù)據(jù)分析,常可以采用比較分析法來確定基本的分析方向以及產(chǎn)品導(dǎo)向。比較分析法分為兩種類型,同比與環(huán)比。

    為消除數(shù)據(jù)周期性波動的影響,同比將移動產(chǎn)品本周期內(nèi)的數(shù)據(jù)與之前周期中相同時間點的數(shù)據(jù)進行比較,計算同比增長率。而環(huán)比則反應(yīng)數(shù)據(jù)連續(xù)變化的趨勢,將本期的數(shù)據(jù)與上一周期的數(shù)據(jù)進行對比。同環(huán)比能為產(chǎn)品整體運營的發(fā)展狀況提供有力的參考,但必須建立在一定的基礎(chǔ)上和環(huán)境上。

    對于統(tǒng)計分析,最常用的是相關(guān)分析以及回歸分析。相關(guān)分析研究的是現(xiàn)象之間是否相關(guān)、相關(guān)的方向和密切程度,一般不區(qū)別自變量或因變量。而回歸分析則通過分析現(xiàn)象之間相關(guān)的具體形式,確定因果關(guān)系,并用數(shù)學(xué)模型來表現(xiàn)其具體關(guān)系。舉例來說,對一個移動電子團購平臺的產(chǎn)品來說,從相關(guān)分析中可知“質(zhì)量”和“用戶滿意度”變量密切相關(guān),但只有通過回歸分析方法才能確定這一對變量之間到底是哪個變量受哪個變量的影響,以及影響程度如何。

    2.數(shù)據(jù)分析應(yīng)用

    在移動端電子商務(wù)中,APP數(shù)據(jù)分析對于開發(fā)者或運營者都是十分重要的環(huán)節(jié),主要數(shù)據(jù)分為4個方面:用戶來源、用戶屬性、轉(zhuǎn)化率及用戶忠誠度。

    (1)用戶來源

    對于移動產(chǎn)品平臺來說,獲取用戶的渠道很多,如CPA廣告、交叉推廣、限時免費等等。開發(fā)者從多個維度的數(shù)據(jù)來對比不同渠道的效果,比如從活躍用戶、次日留存率、使用頻率、使用時長等角度對比不同來源的用戶。通過渠道對比,可以高效地找到最適合產(chǎn)品發(fā)展的渠道,以便不斷完善推廣策略。為了追蹤App渠道來源,可以用到兩種不同的方法:

    ①Android渠道追蹤方法

    國內(nèi)Android市場被數(shù)十家應(yīng)用商店所割據(jù),Android渠道追蹤主要圍繞其中幾種渠道展開。具體來說就是開發(fā)者為每一個渠道生成一個渠道安裝包,不同渠道包用不同的渠道ID來標識。當用戶下載了App之后,運營人員就可以通過渠道標識查看各渠道的數(shù)據(jù)。

    ②iOS渠道追蹤方法

    不同于Android的開放生態(tài),iOS是一個完全封閉的系統(tǒng)。在蘋果的唯一性原則以及嚴格的審核制度下,Android打包的做法在此則無法生效,可以通過Cookie追蹤渠道更為高效的追蹤數(shù)據(jù)。

    (2)用戶屬性分析

    在吸引用戶下載使用之后,產(chǎn)品運營及開放方要盡可能地詳細了解用戶的設(shè)備型號、網(wǎng)絡(luò)及運營商、地域、用戶性別等宏觀層面的用戶特征。這些特征數(shù)據(jù)可在產(chǎn)品改進、應(yīng)用推廣和運營策略的制定上提供有力的方向性依據(jù)。

    ①同期群分析是一種基于同期群的核心數(shù)據(jù)及行為的對比分群方式,按用戶的新增時間將用戶分群,得到的每個群就叫同期群。

    ②獲取成本分析,是指獲取到一個真實的新用戶所付出的平均成本。同時也要注意用戶回報彌補獲取成本的速度,嘗試不同的渠道并跟蹤用戶的行為,使用如K因子傳播作為降低獲取用戶成本的手段。

    ③用戶終生價值分析,是指用戶平均會在平臺、產(chǎn)品上貢獻多少價值。最大化用戶營收的方法就是根據(jù)用戶頻度制定不同的定價方案,針對高頻用戶通過廣告、精品內(nèi)容收費,對于低頻用戶則采用單次收M模式。

    (3)轉(zhuǎn)化率

    對移動電子商務(wù)來說,產(chǎn)品轉(zhuǎn)化率至關(guān)重要,直接關(guān)系到開發(fā)者的產(chǎn)品收入。如一款移動電子游戲應(yīng)用,開發(fā)者可從道具購買量、關(guān)卡和付費人群等多個維度進行交叉分析,從而查看用戶付費行為動機和特征,也可以通過漏斗模型進一步分析關(guān)鍵節(jié)點的轉(zhuǎn)化率,提高付費轉(zhuǎn)化,增加收入。

    (4)用戶忠誠度

    了解用戶在一個產(chǎn)品應(yīng)用內(nèi)做了什么,并確保用戶喜歡該產(chǎn)品,是移動產(chǎn)品優(yōu)化產(chǎn)品生命周期的根本。開發(fā)者可以從留存用戶、使用時長、使用頻率、訪問深度等維度評價用戶粘度,以及RFM(Requency,F(xiàn)requency,Monetary)來評估用戶系數(shù)。例如,通過檢測每月新增用戶在初次使用后某段特定時間內(nèi)的留存率來對用戶進行評估。

    統(tǒng)計留存用戶的時間粒度很細,主要有次日留存、7日留存、30日留存。

    四、數(shù)據(jù)分析對移動電子商務(wù)的意義

    無論是公司或個人,在這個新時代,具有數(shù)據(jù)分析思維是一種更高層次的元認知能力。由于移動互聯(lián)網(wǎng)的出現(xiàn),用戶數(shù)據(jù)大量積累,營銷方案的制定都是基于數(shù)據(jù)分析結(jié)果來決策。作為移動電子商務(wù)公司的數(shù)據(jù)分析師,必須有對繁雜枯燥的數(shù)據(jù)進行數(shù)據(jù)分析的本領(lǐng),更要有商業(yè)敏感性。

    隨著大數(shù)據(jù)時代的到來,以數(shù)據(jù)分析為思維的經(jīng)營和管理思路將成為移動電子商務(wù)市場中消費行為及市場分析的依據(jù),而在這種以數(shù)據(jù)為主體的決策制定中,企業(yè)獲取的分析數(shù)據(jù)是直觀、動態(tài)、及時的,相比咨詢公司或調(diào)研公司的滯后分析具有大數(shù)據(jù)和全樣本的優(yōu)勢。利用數(shù)據(jù)來分析用戶的行為習(xí)慣,進而揣測用戶的心理,深入挖掘用戶需求,可以精確得出產(chǎn)品定位及活動,進行決策。

    參考文獻:

    篇(5)

    關(guān)鍵詞:大數(shù)據(jù)分析方法;企業(yè)檔案管理;檔案數(shù)據(jù)資源;企業(yè)創(chuàng)新決策

    Abstract: With the gradually go deep into the research of big data, the enterprise innovation decision-makings are more and more dependent on data analysis, and the enterprise archive data resources provide the data base for enterprise’s these decisions, therefore used of big data analysis in Enterprise Archive Management has important significance. This paper detailed expounds the Data Quality Management, Visualization Analysis, Semantic Engines, Data Mining, Tendency Prediction and so on five big data analysis methods in the application of Enterprise Archive Management and problems that deserve attention.

    Keywords: Big data analysis method; Enterprise Archive Management; archives data resources; enterprise innovation decision-making

    2015年9月5日,我國政府了《促進大數(shù)據(jù)發(fā)展行動綱要》,旨在促進大數(shù)據(jù)和云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等新一代信息技術(shù)的融合,探索大數(shù)據(jù)和傳統(tǒng)產(chǎn)業(yè)發(fā)展新模式,推動傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級和新興產(chǎn)業(yè)發(fā)展。正如大數(shù)據(jù)專家舍恩伯格所說:大數(shù)據(jù)正在改變?nèi)藗兊纳詈腿藗兝斫馐澜绲姆绞剑嗟淖兓顒荽l(fā),大數(shù)據(jù)管理分析思維和方法也開始影響到我們企業(yè)檔案管理的發(fā)展趨勢。

    1 大數(shù)據(jù)分析方法在企業(yè)檔案管理中應(yīng)用的背景

    1.1 大數(shù)據(jù)研究逐漸縱深化。自從2008年science雜志推出Big Data專刊以來,國內(nèi)外對大數(shù)據(jù)的研究如火如荼。經(jīng)過一段時間的探索,“目前大數(shù)據(jù)領(lǐng)域的研究大致可以分為4個方向:大數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)、大數(shù)據(jù)應(yīng)用和大數(shù)據(jù)工程。而人們對于大數(shù)據(jù)技術(shù)和應(yīng)用兩個方面的關(guān)注比較多”[1]。正如2012年奧巴馬政府投入2億美元啟動 “大數(shù)據(jù)研究和發(fā)展計劃”的目標所顯示的那樣,目前大數(shù)據(jù)的研究逐漸向縱深化方向發(fā)展,著重從大型復(fù)雜的數(shù)據(jù)中提取知識和觀點,幫助企業(yè)實現(xiàn)從“數(shù)據(jù)分析能力”向“數(shù)據(jù)決策能力與優(yōu)勢”的轉(zhuǎn)化。

    1.2 企業(yè)創(chuàng)新決策越來越依賴于數(shù)據(jù)分析。對于企業(yè)技術(shù)創(chuàng)新者而言,目前更多的企業(yè)高層越來越依靠基于數(shù)據(jù)分析的企業(yè)技術(shù)創(chuàng)新決策。靠傳統(tǒng)的經(jīng)驗方法去決策往往是滯后的,因此,大數(shù)據(jù)分析方法作為先進的定量分析方法,目前出現(xiàn)的一些先進數(shù)據(jù)分析方法與技術(shù)勢必會對企業(yè)的運行管理、生產(chǎn)業(yè)務(wù)流程、管理決策產(chǎn)生飛躍式的影響。大數(shù)據(jù)分析方法也成為企業(yè)檔案數(shù)據(jù)分析、技術(shù)創(chuàng)新決策的有效工具。

    1.3 企業(yè)檔案為企業(yè)創(chuàng)新決策提供數(shù)據(jù)基礎(chǔ)。對于一個企業(yè)而言,使用的數(shù)據(jù)資源必須具有真實性可靠性。“企業(yè)檔案是在企業(yè)的各項活動中直接形成并保存?zhèn)洳榈母鞣N文獻載體形式的歷史記錄”[2],企業(yè)檔案是企業(yè)在生產(chǎn)、經(jīng)營、管理等活動中形成的全部有用數(shù)據(jù)的總和。除了發(fā)揮著憑證參考維護歷史真實面貌的作用之外,企業(yè)檔案更“是企業(yè)知識資產(chǎn)和信息資源的重要組成部分”[3],具有知識創(chuàng)新性、不可替代性,為企業(yè)技術(shù)創(chuàng)新決策提供數(shù)據(jù)基礎(chǔ)。“特別是在當前大數(shù)據(jù)背景下,企業(yè)檔案數(shù)據(jù)資源的開發(fā)與建設(shè)對企業(yè)經(jīng)營決策的制定與適應(yīng)市場競爭環(huán)境起到關(guān)鍵性作用。”[4]

    在上述背景下,將大數(shù)據(jù)分析方法應(yīng)用在企業(yè)檔案管理中具有重要性意義:不僅拓展企業(yè)的管理決策理論,同時幫助企業(yè)運用所擁有的檔案數(shù)據(jù)資源洞察市場環(huán)境,發(fā)現(xiàn)新的競爭對手,進行自我總結(jié),做出科學(xué)決策,使企業(yè)緊緊抓住大數(shù)據(jù)時代帶來的市場機遇。

    2 大數(shù)據(jù)分析方法在企業(yè)檔案管理中應(yīng)用的方式

    大數(shù)據(jù)分析方法在企業(yè)檔案管理中的實現(xiàn)方式即是將大數(shù)據(jù)分析方法運用在企業(yè)檔案信息分析挖掘上。它貫穿企業(yè)數(shù)據(jù)處理的整個過程,遵循數(shù)據(jù)生命周期,廣泛收集數(shù)據(jù)進行存儲,并對數(shù)據(jù)進行格式化預(yù)處理,采用數(shù)據(jù)分析模型,依托強大的運行分析算法支撐數(shù)據(jù)平臺,發(fā)掘潛在價值和規(guī)律并進行呈現(xiàn)的過程。常見的大數(shù)據(jù)分析方法“其相關(guān)內(nèi)容包括可視化分析、數(shù)據(jù)挖掘、預(yù)測分析、語義分析及數(shù)據(jù)質(zhì)量管理”[5]。

    2.1 數(shù)據(jù)質(zhì)量管理提升企業(yè)檔案數(shù)據(jù)資源品質(zhì)。大數(shù)據(jù)時代企業(yè)檔案數(shù)據(jù)資源呈現(xiàn)出4V特點,這使得企業(yè)檔案數(shù)據(jù)很容易出現(xiàn)不一致、不精確、不完整、過時等數(shù)據(jù)質(zhì)量問題。基于數(shù)據(jù)生命周期對企業(yè)檔案數(shù)據(jù)資源進行數(shù)據(jù)質(zhì)量管理分為數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲、數(shù)據(jù)使用三個階段。在數(shù)據(jù)預(yù)處理階段,通過ETL工具即數(shù)據(jù)經(jīng)過萃取(Extract)、轉(zhuǎn)換(Transform)、加載(Load)至目的端這幾個預(yù)處理過程達到數(shù)據(jù)清洗和格式化的目的。目前Oracle公司的Data Integrator和Warehouse Build、微軟的Dynamics Integration及IBM的Data Integrator都是比較常見的ETL工具。在數(shù)據(jù)存儲與使用階段,針對目前企業(yè)檔案大數(shù)據(jù)呈現(xiàn)出4V的特點,傳統(tǒng)關(guān)系型數(shù)據(jù)庫在數(shù)據(jù)存儲與數(shù)據(jù)管理方面已經(jīng)難以勝任,非關(guān)系型數(shù)據(jù)庫以其高吞吐量、可拓展性、高并發(fā)讀寫、實時性等特性能夠滿足數(shù)據(jù)存儲與管理的要求。目前應(yīng)用最廣的是并行處理系統(tǒng)MapReduce和非關(guān)系型數(shù)據(jù)庫比如谷歌的Big Table和Hadoop的HBase。將ETL工具移植入云計算平臺系統(tǒng),將會大大有助于完成數(shù)據(jù)清洗、重復(fù)對象檢測、缺失數(shù)據(jù)處理、異常數(shù)據(jù)檢測、邏輯錯誤檢測、不一致數(shù)據(jù)處理等數(shù)據(jù)質(zhì)量處理過程,從而保證企業(yè)檔案數(shù)據(jù)資源的數(shù)據(jù)質(zhì)量。

    2.2 可視化分析提升企業(yè)檔案數(shù)據(jù)資源可理解性。

    “大數(shù)據(jù)可視分析是指在大數(shù)據(jù)自動分析挖掘方法的同時,利用支持信息可視化的用戶界面以及支持分析過程的人機交互方式與技術(shù),有效融合計算機的計算能力和人的認知能力,以獲得對于大規(guī)模復(fù)雜數(shù)據(jù)集的洞察力。”[6]那么企業(yè)檔案數(shù)據(jù)資源的可視化分析可以理解為借助可視化工具把企業(yè)檔案數(shù)據(jù)資源轉(zhuǎn)化成直觀、可視、交互形式(如表格、動畫、聲音、文本、視頻、圖形等)的過程,便于企業(yè)經(jīng)營者的理解利用。

    以2015年2月15日最新版的“百度遷徙”(全稱“百度地圖春節(jié)人口遷徙大數(shù)據(jù)”)為例,該項目讓我們近距離了解到大數(shù)據(jù)可視化。它利用百度后臺每天數(shù)十億次的LBS定位獲得的數(shù)據(jù)進行計算分析,全程展現(xiàn)中國人口遷徙軌跡,為政府部門科學(xué)決策提供科學(xué)依據(jù)。受該項目啟發(fā),企業(yè)可將擁有不同類型的檔案信息進行可視化,比如進行企業(yè)檔案的網(wǎng)絡(luò)數(shù)據(jù)可視化、時空數(shù)據(jù)可視化、時間序列數(shù)據(jù)可視化、多維數(shù)據(jù)可視化、文本數(shù)據(jù)可視化等[7]。以文本數(shù)據(jù)可視化為例,目前典型的文本可視化技術(shù)標簽云,可以將檔案文本中蘊含的主題聚類、邏輯結(jié)構(gòu)、詞頻與重要度、動態(tài)演化規(guī)律直觀展示出來,為企業(yè)決策提供依據(jù)。另外,常見的信息圖表類可視化工具主要有Google chart、 IBM Many Eyes、Tableau、Spotfire、Data-Driven Documents(D3.js)等;時間線類可視化工具主要是Timetoast,、Xtimeline、Timeslide、Dipity等;數(shù)據(jù)地圖類可視化工具主要有Leaflet、Google fushion tables、Quanum GIS等。這些新技術(shù)都為企業(yè)檔案數(shù)據(jù)資源可視化提供了科學(xué)工具。

    2.3 語義引擎實現(xiàn)企業(yè)檔案數(shù)據(jù)資源的智能提取。大數(shù)據(jù)時代全球數(shù)據(jù)存儲量呈激增趨勢,傳統(tǒng)的基于人工分類目錄或關(guān)鍵詞匹配的搜索引擎(谷歌、百度等)僅僅能夠進行簡單的關(guān)鍵詞匹配,用戶無法得到非常準確的信息,檢索準確率并不高,而且檢索結(jié)果相關(guān)度較低,檢索結(jié)果缺乏引導(dǎo)性。為提供給用戶高質(zhì)量的檢索結(jié)果,改善用戶搜索體驗,提高效率,實現(xiàn)智能提取,語義搜索引擎應(yīng)運而生。“語義引擎是隨著語義網(wǎng)的發(fā)展,采用語義網(wǎng)的語義推理技術(shù)實現(xiàn)語義搜索的語義搜索引擎。”[8]它具備從語義理解的角度分析檢索者的檢索請求,能夠理解檢索者的真正意圖,實現(xiàn)信息智能提取。對語義分析可以采取自然語言處理方法進行概念匹配,提供與檢索者需求相同、相近或者相包含的詞語。目前存在基于本體的語義處理技術(shù),它以本體庫作為語義搜索引擎理解和運用語義的基礎(chǔ)。對于企業(yè)而言,將語義引擎分析方法與協(xié)同過濾關(guān)聯(lián)規(guī)則相結(jié)合,可以挖掘用戶的需求,提供個性化的服務(wù)。比如亞馬遜公司通過對用戶檢索的語義進行分析推理,結(jié)合協(xié)同過濾關(guān)聯(lián)規(guī)則,為用戶提供相近需求的產(chǎn)品,提升自己的經(jīng)濟效益。對于一份人事檔案而言,語義引擎也能分析出該份人事檔案中的某人的職務(wù)、級別,從中提取出姓名一職務(wù)一級別一時間等關(guān)鍵信息,提高檢索準確率和效率,實現(xiàn)智能提取。

    2.4 數(shù)據(jù)挖掘發(fā)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的隱性價值。“數(shù)據(jù)挖掘又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)”[9]。簡而言之,數(shù)據(jù)挖掘就是企業(yè)從數(shù)據(jù)集中發(fā)現(xiàn)知識模式,根據(jù)功能一般分為預(yù)測性模式和描述性模式,細分主要有分類與回歸模型、聚類分析模型、關(guān)聯(lián)規(guī)則模型、時間序列模型、偏差檢測模型等。主要挖掘方法有神經(jīng)網(wǎng)絡(luò)方法、機器學(xué)習(xí)方法數(shù)據(jù)庫方法和統(tǒng)計方法等。

    數(shù)據(jù)挖掘是大數(shù)據(jù)分析方法的核心。對于企業(yè)而言,數(shù)據(jù)挖掘的檔案數(shù)據(jù)資源應(yīng)該由兩部分組成:一是企業(yè)正常運行管理過程中所形成的檔案數(shù)據(jù)資源,通過運用分類、聚類、關(guān)聯(lián)規(guī)則等方法對企業(yè)內(nèi)部的數(shù)據(jù)進行挖掘,發(fā)現(xiàn)潛在模式,為企業(yè)技術(shù)創(chuàng)新人員決策提供支持。比如在2004年全球最大的零售商沃爾瑪在分析歷史記錄的顧客消費數(shù)據(jù)時,發(fā)現(xiàn)每次季節(jié)性颶風(fēng)來臨之前,手電筒和蛋撻的數(shù)量全部增加。根據(jù)這一關(guān)聯(lián)發(fā)現(xiàn),沃爾瑪公司會在颶風(fēng)用品的旁邊放上蛋撻,提升了企業(yè)的經(jīng)濟效益;二是企業(yè)在運行過程中遺存在互聯(lián)網(wǎng)上的數(shù)據(jù),通過網(wǎng)絡(luò)輿情及時跟蹤可以獲取市場最新動態(tài),為企業(yè)調(diào)整服務(wù)模式、市場策略、降低風(fēng)險提供依據(jù)。比如Farecast公司運用數(shù)據(jù)挖掘,從網(wǎng)絡(luò)抓取數(shù)據(jù)來預(yù)測機票價格以及未來發(fā)展趨勢,幫助客戶把握最佳購買時機,獲得較大成功。

    2.5 趨勢預(yù)測分析實現(xiàn)企業(yè)檔案數(shù)據(jù)資源的價值創(chuàng)造。“預(yù)測分析是利用統(tǒng)計、建模、數(shù)據(jù)挖掘工具對已有數(shù)據(jù)進行研究以完成預(yù)測。”[10]預(yù)測分析的方法分為定性與定量分析兩種方法:定性分析如德爾菲法以及近年來人工智能產(chǎn)生的Boos-ting?貝葉斯網(wǎng)絡(luò)法等;定量分析法一般從形成的歷史數(shù)據(jù)中發(fā)掘數(shù)據(jù)模型達到預(yù)測效果,如時間序列分析模型、分類與回歸分析模型等。

    企業(yè)檔案數(shù)據(jù)資源預(yù)測分析是在企業(yè)檔案數(shù)據(jù)資源數(shù)據(jù)挖掘的基礎(chǔ)之上,發(fā)現(xiàn)適合模型,將企業(yè)檔案數(shù)據(jù)輸入該模型使得企業(yè)技術(shù)創(chuàng)新人員達到預(yù)測性的判斷效果,實現(xiàn)價值的創(chuàng)造。一個典型的例子即是市場預(yù)測問題,企業(yè)技術(shù)創(chuàng)新者可以根據(jù)檔案數(shù)據(jù)預(yù)測某件產(chǎn)品在未來六個月內(nèi)的銷售趨勢走向,進而進行生產(chǎn)、物流、營銷等活動安排。具體來講企業(yè)可以通過數(shù)據(jù)時間序列分析模型預(yù)測產(chǎn)品銷售旺季和淡季顧客的需求量,從而制定針對獨特的營銷策略,減少生產(chǎn)和銷售的波動性,獲得利潤和競爭優(yōu)勢。預(yù)測分析在大數(shù)據(jù)時代彰顯出企業(yè)檔案數(shù)據(jù)資源獨特的魅力。

    3 大數(shù)據(jù)分析方法運用于企業(yè)檔案管理中應(yīng)當注意的問題

    3.1 成本問題。大數(shù)據(jù)分析需要依靠分析工具和運算時間,特別是在復(fù)雜的企業(yè)檔案數(shù)據(jù)資源中采用相關(guān)大數(shù)據(jù)分析工具的科技成本還是很高的,要以最少運算成本獲得更有價值的數(shù)據(jù)內(nèi)容。合理選擇大數(shù)據(jù)分析工具不光可以節(jié)省運算成本而且能夠更快速獲取盈利增長點,同時在大數(shù)據(jù)分析和企業(yè)檔案數(shù)據(jù)資源的存儲成本方面也要適當?shù)目刂圃诤侠淼姆秶鷥?nèi)。既要保證大數(shù)據(jù)分析質(zhì)量,又要降低企業(yè)檔案存儲成本是大數(shù)據(jù)分析方法運用到企業(yè)檔案管理中的重要原則。

    3.2 時效問題。“大數(shù)據(jù)的動態(tài)性強,要求分析處理應(yīng)快速響應(yīng),在動態(tài)變化的環(huán)境中快速完成分析過程,有些甚至必須實時分析,否則這些結(jié)果可能就是過時、無效的”。[11]由此可見,影響大數(shù)據(jù)分析的重要因素就是時效性問題。“大數(shù)據(jù)數(shù)據(jù)分析的核心內(nèi)容之一是數(shù)據(jù)建模”,[12]數(shù)據(jù)分析模型要不斷的更新適應(yīng)數(shù)據(jù)的動態(tài)變化。如果模型落后于數(shù)據(jù)的變化,那數(shù)據(jù)分析只能是失效的。同時由于經(jīng)濟環(huán)境、政治生態(tài)、社會文化等因素不斷變革,企業(yè)檔案數(shù)據(jù)的收集也會產(chǎn)生新的問題。只有不斷加強對這些數(shù)據(jù)的實時監(jiān)測和有效分析,才能更好的識別出數(shù)據(jù)變化中的細微之處,建立與之相適應(yīng)的數(shù)據(jù)分析新模型。

    3.3 情感問題。“大數(shù)據(jù)的另一個局限性在于它很難表現(xiàn)和描述用戶的感情。”大數(shù)據(jù)分析方法在處理企業(yè)檔案數(shù)據(jù)方面可以說如魚得水,大數(shù)據(jù)分析是一種科學(xué)的機器運算方法,無法去實現(xiàn)人文價值提取,比如如何從企業(yè)檔案數(shù)據(jù)資源中提取企業(yè)文化,這更需要人的情感直覺去實現(xiàn),而嚴謹?shù)目茖W(xué)數(shù)據(jù)是無法實現(xiàn)的。因此,我們在熱衷于大數(shù)據(jù)分析方法的量化結(jié)果時,同時也不要忽略在傳統(tǒng)企業(yè)檔案管理中的那份人文精神。

    篇(6)

    關(guān)鍵詞:HXN5機車;曲軸箱超壓;數(shù)據(jù)特點

    1 前言

    HXN5機車自投入運用以來,頻繁發(fā)生曲軸箱超壓故障。僅2011、2012兩年間,因各種原因引起的曲軸箱超壓報警就有220余起,嚴重影響了機車的正常運用。

    導(dǎo)致曲軸箱壓力高的原因非常多,大體上可分為機械類、電器類(傳感器、線束等)兩種。因此,快速區(qū)分原因類別,確定檢查方向,可以大幅度提高檢修效率。

    2 機車數(shù)據(jù)分析軟件

    2.1 數(shù)據(jù)背景

    由于前期GE公司技術(shù)保密,未提供分析軟件,無法進行數(shù)據(jù)分析。判斷故障時,只能憑借經(jīng)驗,進行整車檢查,費時費力。通過多次溝通后,GE同意提供數(shù)據(jù)分析軟件drconv.exe,使得運用數(shù)據(jù)分析方法來判斷故障原因成為可能。

    2.2 數(shù)據(jù)轉(zhuǎn)換

    由于下載的機車數(shù)據(jù)中,ECU的數(shù)據(jù)文件(eng文件)不能直接打開,需要使用GE提供的數(shù)據(jù)分析軟件(drconv.exe)轉(zhuǎn)換成DRA文件后,才能用EXCELL軟件打開。

    2.3 數(shù)據(jù)樣式

    文件打開后,就可以對各相關(guān)參數(shù)進行具體分析。打開后的文件模型如表1(已做相關(guān)性處理):

    3 一起典型的機械類曲軸箱超壓故障

    3.1 故障描述

    HXN50323 機車自2012年9月16日發(fā)生曲軸箱超壓以來,現(xiàn)場服務(wù)組對其進行了各項檢查,一直未能查出具體原因。10月13日,曲軸箱超壓攻關(guān)組與GE工程師一道赴段調(diào)查。

    3.2 故障處理

    首先按照曲軸箱超壓故障作業(yè)指導(dǎo)書進行相關(guān)檢查,發(fā)現(xiàn)一些異常現(xiàn)象。但這些異常現(xiàn)象程度都輕微,都不應(yīng)是超壓的真正原因。

    恢復(fù)機車后,對比拆掉機油加油口蓋前后自負荷曲軸箱壓力的變化情況,進行自負荷試驗,試驗結(jié)果拆掉機油加油口蓋后曲軸箱壓力遠低于拆除前的值,可見確實存在柴油機機械故障(如動力組竄氣))。我們建議拆動力組做進一步詳查。

    3.3 機車下載數(shù)據(jù)情況

    3.3.1 Snp日志文件:

    打開snp日志文件,可見9月16日在線上有兩次超壓(表2):

    ① 01:00:50 機車速度36.963英里/小時,柴油機檔位8檔;

    ② 04:39:24 機車速度19.179英里/小時,柴油機檔位7檔。

    最后一次10月13日19:31:02為攻關(guān)組在現(xiàn)場做數(shù)據(jù)采集時觸發(fā)。

    3.3.2 Eng數(shù)據(jù)文件:

    3是10月13日自負荷試驗曲軸箱壓力隨功率的變化曲線。可見cop數(shù)值5檔時在0.5—1之間波動,柴油機拉6檔,曲軸箱壓力上升觸發(fā)報警。柴油機停機后cop迅速回落到0附近。

    3.3.3 數(shù)據(jù)分析情況小結(jié)

    (1)8檔曲軸箱壓力從9月12日開始一直呈上升趨勢,到9月16日漲至0附近觸發(fā)報警。

    (2)在段內(nèi)檢修過程中,多次試驗報警后,cop數(shù)值均快速回落。

    (3)9月12日至16日曲軸箱壓力緩慢上升的過程中,機油壓力保持穩(wěn)定,沒有明顯的下降趨勢。

    3.4 檢查結(jié)果

    現(xiàn)場試驗數(shù)據(jù)分析結(jié)果顯示該次超壓為機械類超壓。機車后期返廠解體檢查的結(jié)果為:左5缸活塞的鋼頂?shù)谝坏罋猸h(huán)處存在裂紋,引起燃氣下竄,造成曲軸箱超壓。

    3.5 數(shù)據(jù)特點

    通過檢查結(jié)果、數(shù)據(jù)分析情況和工作原理,歸結(jié)出機械類故障的數(shù)據(jù)特點為:觸發(fā)報警停機后,曲軸箱壓力迅速(10秒內(nèi))回零(0.5英寸水柱以下)。

    4 一起典型的電器類曲軸箱超壓故障

    4.1 故障描述

    2012年9月24日50369機車擔當85310次牽引任務(wù),編組29-2295-34.6,列車23:46分因曲軸箱超壓在扎亥薩拉站1道停車,司機解鎖柴油機處理后0:09分開車,站停23分。之后在線上再次發(fā)生曲軸箱超壓報警影響本列運行晚點。

    回段后檢查柴油機各部良好,更換曲軸箱壓力傳感器,檢查并試驗正常。

    4.2 數(shù)據(jù)情況

    4.2.1 Snp文件:

    4.2.2 ENG數(shù)據(jù)文件

    圖4為23日23點42分故障時曲軸箱壓力和柴油機轉(zhuǎn)速隨時間的變化曲線。可看出從42分45秒開始cop就開始超出報警保護值(1.5 in H2O),至42分55秒觸發(fā)停機。此外,隨著柴油機轉(zhuǎn)速降為0的過程中,曲軸箱一直保持在一個較高的壓力(1.55 in H2O)。

    4.2.3 數(shù)據(jù)分析情況小結(jié):

    兩次故障曲軸箱壓力都在柴油機低檔位轉(zhuǎn)速波動不大的情況下自行上升,且在停機后仍然保持一個較高的數(shù)值。

    4.3 數(shù)據(jù)特點

    通過檢查結(jié)果、數(shù)據(jù)分析情況和工作原理,歸結(jié)出電器類故障的數(shù)據(jù)特點為:觸發(fā)報警停機后,曲軸箱壓力可能不會迅速(10秒內(nèi))回零(0.5英寸水柱以下);或者柴油機停機后曲軸箱壓力仍然保持在一個較高值。

    5 結(jié)論

    本文通過介紹HXN50323和50369機車曲軸箱超壓故障的處理經(jīng)過,對數(shù)據(jù)分析方法在故障原因判斷過程中的應(yīng)用進行了研究,由此對不同類型故障數(shù)據(jù)的特點進行了歸納。機械類故障的數(shù)據(jù)特點為:觸發(fā)報警停機后,曲軸箱壓力迅速(10秒內(nèi))回零(0.5英寸水柱以下)。電器類故障的數(shù)據(jù)特點為:觸發(fā)報警停機后,曲軸箱壓力可能不會迅速(10秒內(nèi))回零(0.5英寸水柱以下);或者柴油機停機后曲軸箱壓力仍然保持在一個較高值。

    由于之前電器的故障率太高,使得段方和現(xiàn)場服務(wù)人員在判斷此類故障原因時,有一種先入為主的觀念,容易優(yōu)先考慮反復(fù)更換傳感器、線束、ECU等電器元件,費時費力。依照不同故障類型的數(shù)據(jù)特點,通過數(shù)據(jù)分析,在查找一些疑難的超壓原因時,能快速區(qū)分原因類別,明確檢查方向,節(jié)省檢修時間,從而大幅度提高檢修效率。

    參考文獻

    [1] 主干線機車維修故障處理手冊,2011

    [2] 張松楊. GEVO16型柴油機機體的設(shè)計分析. 鐵道機車車輛,2009,(2).

    [3] 薛良君,樓狄明,張松楊. 16V280ZJB型柴油機機體應(yīng)力測試與分析. 內(nèi)燃機車,

    2003,(9).

    篇(7)

    關(guān)鍵詞:道路運輸 大數(shù)據(jù)分析 決策技術(shù)

    中圖分類號:U495 文獻標識碼:A 文章編號:1674-098X(2016)12(c)-0147-02

    交通運輸業(yè)指的是在國民經(jīng)濟的發(fā)展過程中主要負責運送貨物和旅客的社會生產(chǎn)工作,其中包括鐵路運輸、公路運輸、水路運輸以及航空運輸?shù)鹊取T撐闹饕獙⒊鞘械缆方煌ㄟ\輸作為主要切入點,分析當前大數(shù)據(jù)分析決策技術(shù)在城市道路運輸行業(yè)的應(yīng)用過程中所出現(xiàn)的問題以及所帶來的重要影響。在信息技術(shù)高速發(fā)展的今天,以數(shù)據(jù)為核心的大數(shù)據(jù)技術(shù)在交通系統(tǒng)中的應(yīng)用已經(jīng)逐漸為城市交通事業(yè)的發(fā)展提供了新的方向,并打開了新世紀的大門,城市智慧交通的時代已經(jīng)逐漸到來了。

    1 大數(shù)據(jù)分析決策技術(shù)概述

    1.1 大數(shù)據(jù)分析決策技術(shù)的概念

    大數(shù)據(jù),顧名思義是對許多大型數(shù)據(jù)進行分析、處理和管理的數(shù)據(jù)集,數(shù)據(jù)的最大可達到10 TB左右,在大數(shù)據(jù)的日常工作中具有體量大,數(shù)據(jù)類別多,數(shù)據(jù)處理速度快以及數(shù)據(jù)具有真實性的特點。

    而大數(shù)據(jù)分析決策技術(shù)正是在大數(shù)據(jù)的體量大、數(shù)據(jù)類別多、數(shù)據(jù)處理速度快以及數(shù)據(jù)具有真實性的優(yōu)勢的基礎(chǔ)上對數(shù)據(jù)進行分析和決策的一種新興技術(shù)。這種技術(shù)多應(yīng)用于公共交通服務(wù)、交通引導(dǎo)、物流調(diào)度優(yōu)化等各個方面。大數(shù)據(jù)分析決策技術(shù)能夠通過反饋的各種交通數(shù)據(jù)和各種資源進行分析、處理、整合,并能夠依托云計算服務(wù)平臺為使用者提供更加快捷、便利的出行服務(wù)。

    1.2 大數(shù)據(jù)分析決策技術(shù)的關(guān)鍵

    大數(shù)據(jù)分析決策技術(shù)的關(guān)鍵在于計算層,而計算層主要指的是利用內(nèi)存計算中的Spark,并利用R語言和框架來實現(xiàn)專業(yè)的統(tǒng)計分析功能,采用圖形的方式展現(xiàn),以保證分布式的集群和高效存儲方式來加快大數(shù)據(jù)集上的查詢速度。除此之外,Mahout是一個集數(shù)據(jù)挖掘、決策支持等算法于一身的工具,其中包含的都是基于Hadoop來實現(xiàn)的經(jīng)典算法,通常相關(guān)人員會使用其作為數(shù)據(jù)分析的核心算法集來進行參考[1]。

    利用大數(shù)據(jù)進行決策和分析,就必須通過表格和圖表圖形來展示,這樣一來,將使得數(shù)據(jù)的分類更加詳細,并提高了數(shù)據(jù)的權(quán)威性。另外,Tableau和Pentaho也是進行處理的最佳選擇。

    2 大數(shù)據(jù)分析決策技術(shù)在道路運輸業(yè)的應(yīng)用分析

    2.1 大數(shù)據(jù)分析決策技術(shù)在道路運輸業(yè)的應(yīng)用現(xiàn)狀

    伴隨著信息技術(shù)的快速發(fā)展和高新技術(shù)產(chǎn)業(yè)的高速推進,新科技、新技術(shù)已經(jīng)融入到了各行各業(yè)的生產(chǎn)活動和運營管理當中,并深入到了人們的生活中,使普通人也能看見科技,摸得著技術(shù),時時刻刻地感受著科學(xué)技術(shù)為生活帶來的美好[2]。

    當前,大數(shù)據(jù)分析決策技術(shù)在道路運輸業(yè)應(yīng)用日漸成熟,使得大數(shù)據(jù)分析決策技術(shù)已經(jīng)成為了城市智慧交通的重要發(fā)展平臺和重要的技術(shù)載體,科學(xué)穩(wěn)定的分析決策技術(shù),便捷高效的數(shù)據(jù)處理技術(shù)使得大數(shù)據(jù)分析決策技術(shù)在城市道路運輸業(yè)一經(jīng)應(yīng)用就得到了迅速的拓展。大數(shù)據(jù)分析決策技術(shù)對城市運輸業(yè)所反饋的數(shù)據(jù)包、日志、資產(chǎn)數(shù)據(jù)以及諸如漏洞信息、配置信息、身份與訪問信息、用戶行為信息、應(yīng)用信息、業(yè)務(wù)信息、外部情報信息等信息的分析、處理和決策帶來了極大的便捷。

    2.2 大數(shù)據(jù)分析決策技術(shù)應(yīng)用面臨的挑戰(zhàn)

    2.2.1 行業(yè)標準缺乏統(tǒng)一性

    行業(yè)標準缺乏統(tǒng)一性是大數(shù)據(jù)分析決策技術(shù)應(yīng)用面臨的挑戰(zhàn)之一,眾所周知,地區(qū)經(jīng)濟發(fā)展不平衡是我國經(jīng)濟發(fā)展的重要現(xiàn)狀之一,在這樣的背景下,致使我國道路運輸業(yè)發(fā)展也存在著地區(qū)發(fā)展不平衡的問題,這樣一來,很難在全國實行統(tǒng)一的行業(yè)標準,致使很多地區(qū)的城市運輸數(shù)據(jù)系統(tǒng)相對獨立,沒有在全國范圍內(nèi)形成統(tǒng)一、完整的智慧交通系統(tǒng)。

    智慧交通運輸系統(tǒng)的不完整,導(dǎo)致了各個城市之間的道路運輸?shù)男畔⒑蛿?shù)據(jù)的銜接與配合達不到一定的標準,進而嚴重影響交通數(shù)據(jù)的收集和處理,并阻礙了城市\(zhòng)輸線路的分析和統(tǒng)計。

    2.2.2 基礎(chǔ)設(shè)施缺乏穩(wěn)定性

    基礎(chǔ)設(shè)施缺乏穩(wěn)定性也是大數(shù)據(jù)分析決策技術(shù)應(yīng)用所面臨的挑戰(zhàn)之一,大數(shù)據(jù)決策分析技術(shù)在城市道路運輸業(yè)得以應(yīng)用的目的在于建立完整度和成熟度較高的智慧城市道路交通系統(tǒng),而這樣智慧交通系統(tǒng)必將是整合度和復(fù)雜度較高的系統(tǒng),如果想要建立這樣的智慧交通系統(tǒng)不僅僅需要成熟的大數(shù)據(jù)分析技術(shù),更需要完整、穩(wěn)定的基礎(chǔ)設(shè)施作為建立這一系統(tǒng)的平臺。但是,當前在建立這一系統(tǒng)的過程中卻面臨著城市運輸系統(tǒng)硬件設(shè)備功能滯后、老化的現(xiàn)狀,這些問題都可能會引起引起數(shù)據(jù)的泄露,甚至丟失,為大數(shù)據(jù)的統(tǒng)計和處理帶來了極大的威脅。

    2.2.3 數(shù)據(jù)統(tǒng)計缺乏真實性

    數(shù)據(jù)統(tǒng)計缺乏真實性同樣也是大數(shù)據(jù)分析決策技術(shù)應(yīng)用所面臨的問題和挑戰(zhàn)。作為數(shù)據(jù)統(tǒng)計和數(shù)據(jù)整合的重要技術(shù),數(shù)據(jù)的真實性和精確性是其存在的最重要的基礎(chǔ)。大數(shù)據(jù)分析決策技術(shù)在道路運輸行業(yè)得以應(yīng)用的重要標準,如果數(shù)據(jù)的真實出現(xiàn)了問題,將使得智慧交通系統(tǒng)失去其應(yīng)用價值。目前由于道路運輸設(shè)備老化等問題,致使其性能得不到根本的保證,造成了信號獲取的不穩(wěn)定,由此可能會出現(xiàn)數(shù)據(jù)統(tǒng)計缺乏真實性的問題。

    3 大數(shù)據(jù)分析決策技術(shù)在道路運輸業(yè)應(yīng)用問題的解決措施

    3.1 加強交通平臺資源整合,推進數(shù)據(jù)標準化

    為了解決行業(yè)標準缺乏統(tǒng)一性的問題,相關(guān)人員應(yīng)當加強交通大數(shù)據(jù)應(yīng)用基礎(chǔ)設(shè)施建設(shè)。正如上文所說的我國經(jīng)濟發(fā)展的不平衡導(dǎo)致了城市交通運輸業(yè)發(fā)展的不平衡,而交通運輸系統(tǒng)又是極為復(fù)雜的系統(tǒng),如果每個城市之間交通平臺不能形成很好的銜接,將會極大地影響交通運輸業(yè)的發(fā)展,問題解決措施如下。

    首先,需要相關(guān)部門建立完整的道路交通運輸標準,對各個城市的交通運輸情況進行嚴格的管理,努力建立一個統(tǒng)一度高、完整度高的現(xiàn)代化、標準化行業(yè)標準。

    其次,還需要加強對各個交通平臺資源的分配和整合,加強各個地區(qū)的兼容性。

    最后,還應(yīng)當實現(xiàn)各個地區(qū)各個交通的相互合作,相互聯(lián)系,推動交通運輸標準化、統(tǒng)一化的實現(xiàn)。

    3.2 加強交通大數(shù)據(jù)應(yīng)用基礎(chǔ)設(shè)施建設(shè)

    為了解決基礎(chǔ)設(shè)施缺乏穩(wěn)定性的問題,相關(guān)人員應(yīng)當加強交通大數(shù)據(jù)應(yīng)用基礎(chǔ)設(shè)施建設(shè)。正如上文介紹的我國道路運輸系統(tǒng)的設(shè)備因使用時間較長,設(shè)備老化度較高,這嚴重影響了大數(shù)據(jù)決策分析技術(shù)的應(yīng)用,為解決這一問題,應(yīng)當加強基礎(chǔ)設(shè)施建設(shè),及時對設(shè)備進行更新和維護,從而實現(xiàn)信息數(shù)據(jù)的安全有效。

    3.3 嚴格控制交通運輸?shù)臄?shù)據(jù)真實度

    為了解決數(shù)據(jù)統(tǒng)計缺乏真實性的問題,相關(guān)人員應(yīng)當嚴格控制交通運輸?shù)臄?shù)據(jù)真實度。

    正如上文所介紹的因種種原因大數(shù)據(jù)決策分析技術(shù)的數(shù)據(jù)真實度有待考證,為了解決這一問題,需要相關(guān)人員做到的是通過嚴格的監(jiān)控措施和測試手段保證數(shù)據(jù)的真實性和可靠性,嚴禁因人為原因而對數(shù)據(jù)的真實性造成影響。

    4 結(jié)語

    綜上所述,智慧交通時代的大門已經(jīng)逐漸向大家打開,在城市化速度不斷加快的今天,城市居民對舒適的交通環(huán)境和便捷快速的城市道路運輸有著十分迫切的渴求,而在大數(shù)據(jù)分析決策技術(shù)基礎(chǔ)上智慧交通是大的發(fā)展趨勢,將為解決城市道路運輸問題提供新的思路。智慧交通時代是高效便捷運輸?shù)臅r代,也是現(xiàn)代化的重要標志,通過大量數(shù)據(jù)匯集融合,能夠有效地解決城市交通存在的問題。現(xiàn)階段,大數(shù)據(jù)分析決策技術(shù)和智慧交通系統(tǒng)發(fā)展得還不夠成熟,需要在相關(guān)人員的不懈努力下,使城市居民能夠更早地進入便捷的現(xiàn)代生活中,期待那一天的到來。

    參考文獻

    主站蜘蛛池模板: 永定县| 年辖:市辖区| 屏边| 义乌市| 尼勒克县| 克东县| 常德市| 连州市| 万年县| 全椒县| 邯郸县| 海门市| 乳源| 循化| 甘孜| 略阳县| 原平市| 福海县| 松溪县| 抚州市| 靖西县| 华亭县| 麻栗坡县| 海淀区| 湘西| 达州市| 金溪县| 清远市| 望城县| 教育| 聊城市| 麦盖提县| 含山县| 贡嘎县| 松原市| 南华县| 德令哈市| 万源市| 剑川县| 道孚县| 高安市|