時間:2020-06-16來源:lk瀏覽數(shù):296次
在當(dāng)今的大數(shù)據(jù)時代,不僅IT行業(yè)的人們需要了解與大數(shù)據(jù)相關(guān)的知識,而且傳統(tǒng)行業(yè)的從業(yè)者和普通大學(xué)生也應(yīng)了解某些大數(shù)據(jù)知識。新的基礎(chǔ)架構(gòu)計劃未來,大數(shù)據(jù)技術(shù)將開始得到全面應(yīng)用,大數(shù)據(jù)還將重塑整個產(chǎn)業(yè)結(jié)構(gòu)。
要理解大數(shù)據(jù),我們必須首先從大數(shù)據(jù)的概念開始。與人工智能的概念不同,大數(shù)據(jù)的概念相對清晰,大數(shù)據(jù)的技術(shù)體系也已經(jīng)成熟。為了解釋大數(shù)據(jù)的概念,您可以從數(shù)據(jù)本身的特征開始,然后從方案,應(yīng)用和行業(yè)逐步擴展。
大數(shù)據(jù)本身的特點通常集中在五個方面,即數(shù)據(jù)量,數(shù)據(jù)結(jié)構(gòu)多樣性,數(shù)據(jù)價值密度,數(shù)據(jù)增長速度和可信度對這五個維度的理解和認(rèn)識是理解大數(shù)據(jù)概念的關(guān)鍵。當(dāng)然,隨著大數(shù)據(jù)技術(shù)的發(fā)展及其在行業(yè)中的應(yīng)用,數(shù)據(jù)本身的規(guī)模也在一定程度上得到了擴展,而這些擴展本身也是對大數(shù)據(jù)概念的一種豐富和改進(jìn)。而大數(shù)據(jù)分析的特點和以上五個方面也是密不可分的。
數(shù)據(jù)量本身就是聚合的概念。不是數(shù)據(jù)量大的數(shù)據(jù)被稱為大數(shù)據(jù),傳統(tǒng)信息系統(tǒng)生成的“小數(shù)據(jù)”也是大數(shù)據(jù)分析的重要組成部分,這點必須清楚。當(dāng)前,從大數(shù)據(jù)的數(shù)據(jù)源的角度來看,它主要集中在互聯(lián)網(wǎng),物聯(lián)網(wǎng)和傳統(tǒng)信息系統(tǒng)三個渠道。當(dāng)前物聯(lián)網(wǎng)數(shù)據(jù)的比例相對較大。相信在5G時代,物聯(lián)網(wǎng)仍將是大數(shù)據(jù)的主要數(shù)據(jù)源。
與創(chuàng)新信息系統(tǒng)(ERP)中的數(shù)據(jù)不同,大數(shù)據(jù)的數(shù)據(jù)類型非常復(fù)雜,包括結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),這對傳統(tǒng)數(shù)據(jù)分析技術(shù)提出了巨大挑戰(zhàn),這也是大數(shù)據(jù)技術(shù)興起的重要原因。在工業(yè)互聯(lián)網(wǎng)時代,大數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)的多樣性將得到進(jìn)一步體現(xiàn),這也給數(shù)據(jù)價值過程帶來了新的挑戰(zhàn)。
與傳統(tǒng)信息系統(tǒng)相比,大數(shù)據(jù)中的數(shù)據(jù)價值密度相對較低,這就需要更快,更方便的方式來完成數(shù)據(jù)值提取過程,這也是當(dāng)前大數(shù)據(jù)平臺所關(guān)注的核心競爭力之一。實際上,早期Hadoop和Spark平臺之所以能夠脫穎而出的重要原因是它們的數(shù)據(jù)處理(排序)速度相對較快。
通常傳統(tǒng)信息系統(tǒng)的數(shù)據(jù)增量是可以預(yù)測的,或者增長率是可控的,但是在大數(shù)據(jù)時代,數(shù)據(jù)增長率已經(jīng)大大超過了傳統(tǒng)數(shù)據(jù),處理能力已經(jīng)超過自身的極限。數(shù)據(jù)增長是一個相對的概念。與消費互聯(lián)網(wǎng)相比,工業(yè)互聯(lián)網(wǎng)帶來的數(shù)據(jù)增長可能更加客觀,因此工業(yè)互聯(lián)網(wǎng)時代將進(jìn)一步打開大數(shù)據(jù)的價值空間。
大數(shù)據(jù)時代帶來的一個重要副作用是,很難區(qū)分真假數(shù)據(jù),這也是當(dāng)前大數(shù)據(jù)技術(shù)必須重點解決的問題之一。從當(dāng)前大型Internet平臺采用的方法來看,它通常是技術(shù)和管理的結(jié)合。例如,通過對用戶進(jìn)行身份驗證,可以解決某些數(shù)據(jù)的真實性(專業(yè)性)問題。
億信華辰大數(shù)據(jù)分析平臺表明,數(shù)據(jù)價值密度通常是衡量數(shù)據(jù)價值的重要基礎(chǔ)。與傳統(tǒng)信息系統(tǒng)相比,大數(shù)據(jù)中的數(shù)據(jù)值密度較低,需要更快,更方便。完成數(shù)據(jù)的價值提取過程,這也是當(dāng)前大數(shù)據(jù)平臺的核心功能之一。
發(fā)布時間:2023-09-26瀏覽量:77次
發(fā)布時間:2022-06-28瀏覽量:964次
發(fā)布時間:2022-06-15瀏覽量:261次
發(fā)布時間:2022-06-14瀏覽量:544次
發(fā)布時間:2022-06-14瀏覽量:749次
400咨詢:4000011866
手機咨詢:137-0121-6791
技術(shù)支持QQ:400-0011-866
(工作日9:00-18:00)
產(chǎn)品建議郵箱
yixin@esensoft.com