億信華辰
時(shí)間:2020-08-27來源:瀏覽數(shù):343次
商業(yè)智能BI中有許多定義,諸如數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、OLAP等,還有一個(gè)不得不提的定義,那就是ETL。在BI工程師或相關(guān)的職位招聘中,ETL也是必不可少的一項(xiàng)技能。那么,ETL到底是什么呢?
ETL 的英文全稱叫做 Extraction(抽?。琓ransformation(轉(zhuǎn)換),Loading(加載)。
抽取主要是針對各個(gè)業(yè)務(wù)系統(tǒng)及不同服務(wù)器的分散數(shù)據(jù),充分理解數(shù)據(jù)定義后,規(guī)劃需要的數(shù)據(jù)源及數(shù)據(jù)定義,制定可操作的數(shù)據(jù)源,制定增量抽取和緩慢漸變的規(guī)則。
轉(zhuǎn)換就是指數(shù)據(jù)的清洗、合并、拆分、加工、數(shù)據(jù)邏輯計(jì)算處理的過程,通常會按照一定的業(yè)務(wù)邏輯規(guī)則進(jìn)行計(jì)算,最后轉(zhuǎn)換成符合業(yè)務(wù)模型、分析模型的規(guī)范性的數(shù)據(jù)。簡單來說,不管是大數(shù)據(jù)、小數(shù)據(jù),都是將不規(guī)范的、不可分析的轉(zhuǎn)換成規(guī)范的、可分析的數(shù)據(jù)。轉(zhuǎn)換是ETL中花費(fèi)時(shí)間最長的部分,一般情況下工作量是整個(gè)ETL的2/3。
加載主要是將經(jīng)過轉(zhuǎn)換的數(shù)據(jù)加載到數(shù)據(jù)倉庫里面,可以通過直連數(shù)據(jù)庫的方式來進(jìn)行數(shù)據(jù)加載,可以充分體現(xiàn)高效性。在應(yīng)用的時(shí)候可以隨時(shí)調(diào)整數(shù)據(jù)抽取工作的運(yùn)行方式,可以靈活的集成到其他管理系統(tǒng)中。
ETL的目的是將企業(yè)中分散、零亂、標(biāo)準(zhǔn)不統(tǒng)一的數(shù)據(jù)整合到一起,為企業(yè)的決策提供分析依據(jù)。 ETL是商業(yè)智能BI項(xiàng)目重要的一個(gè)環(huán)節(jié)。通常情況下,在BI項(xiàng)目中ETL會花掉整個(gè)項(xiàng)目的1/3的時(shí)間,ETL設(shè)計(jì)的好壞直接關(guān)系到BI項(xiàng)目的成敗。
ETL是實(shí)現(xiàn)BI的基礎(chǔ),因?yàn)楸WC了數(shù)據(jù)的質(zhì)量與正確性。如果質(zhì)量出現(xiàn)問題,最后的報(bào)表做出來也是錯的。
市面上很多商業(yè)智能BI工具并不自帶ETL,而是搭配開源ETL。這樣可能會節(jié)省一部分費(fèi)用,但是一旦出現(xiàn)問題就比較麻煩,用戶需要將問題反饋到開源社區(qū)等待處理,在等待處理的過程中可能會浪費(fèi)大量的時(shí)間,反而得不償失。億信ABI就是一款自帶ETL的商業(yè)智能BI工具。其數(shù)據(jù)整合功能充分結(jié)合了大量項(xiàng)目人員的實(shí)施習(xí)慣,在整個(gè)數(shù)據(jù)建模的過程中,可以快速創(chuàng)建ETL過程和構(gòu)建數(shù)據(jù)模型,操作簡單,敏捷易用,提高效率,降低實(shí)施難度。
發(fā)布時(shí)間:2023-09-27瀏覽量:93次
發(fā)布時(shí)間:2022-05-11瀏覽量:351次
發(fā)布時(shí)間:2022-03-28瀏覽量:240次
發(fā)布時(shí)間:2022-03-10瀏覽量:2018次
發(fā)布時(shí)間:2022-03-09瀏覽量:220次
400咨詢:4000011866
手機(jī)咨詢:137-0121-6791
技術(shù)支持QQ:400-0011-866
(工作日9:00-18:00)
產(chǎn)品建議郵箱
yixin@esensoft.com