時間:2021-02-03來源:瀏覽數(shù):289次
本文主要從Excel,sql還有Python三個數(shù)據(jù)分析神器來看看我們是如何從入門到精通數(shù)據(jù)分析。
Excel
貌似自己沒有專門讀一本Excel書籍, 都是遇到問題網(wǎng)上查詢。 如果不是特別充足的時間,也不建議買一厚本書啃,除非這本書你能花1-2天讀完,而且干貨較多我暫時整理下數(shù)據(jù)分析師常用的一部分功能,以后遇到新的需求你再google即可,舉例:我用的是Linux系統(tǒng),不能安裝MS Office,所以暫時用WPS Office代替,大同小異, 實際上我最近兩年很少用Windows了。
SQL 學習SQL,先需要熟練語法,但是想要真正精通sql,還是需要大量的實踐 書籍:《Mysql數(shù)據(jù)庫從入門到精通》,粗粗看過這本,對數(shù)據(jù)分析師來說,可能僅小部分會用上,畢竟講得是Mysql所有的操作包括權限控制,事務處理,這些一般后端開發(fā)或者DBA才會用到,所以感覺也可以不讀 針對小白同學,這里重點說明下: sql是一種語言, 它用來和數(shù)據(jù)庫進行交互,進行操作數(shù)據(jù)的增刪改查,而數(shù)據(jù)庫是有多種的,比如mysql, oracle, sql server, hive等,每種數(shù)據(jù)庫適配的sql語言基本相同,所以在學習的時候,選擇其中一種數(shù)據(jù)庫進行操作學習即可,mysql是目前也是互聯(lián)網(wǎng)采用最廣泛的數(shù)據(jù)庫,oracle/sql server銀行等傳統(tǒng)企業(yè)用的比較多,而hive是集成在分布式文件系統(tǒng)hadoop之上的數(shù)據(jù)庫,俗稱"大數(shù)據(jù)",主要用來存儲用戶訪問的行為日志。我們學習sql這個語言語法的話,選擇mysql進行學習即可,其他大同小異。 Python Python語言語法的入門, 選擇經(jīng)典, 通俗易懂,對于數(shù)據(jù)分析師,尤其是剛入門的小白,只讀到該教程的"面向對象高級編程"以前即可 Python數(shù)據(jù)分析第三方 數(shù)據(jù)分析: pandas, numpy 繪圖包: matplotlib, seaborn 機器學習: sklearn, tensorflow等 書籍:《利用Python進行數(shù)據(jù)分析》, 主要介紹如何用pandas進行數(shù)據(jù)分析,也會講到numpy,以及matplotlib和pandas繪圖, 這本書確實寫的很好,但是小白上來閱讀可能會一頭水霧,所以可以退而求其次,10 Mintutes to pandas, 當然這個10分鐘是搞不定的哈, 不過常用的pandas在里面,另外panda要精通也需要大量的練習,遇到問題google或者pandas官網(wǎng)文檔查詢即可,注意這些文檔不需要一頁頁閱讀,用到那個學習那個就中 《集體智慧編程》,講了經(jīng)典的數(shù)據(jù)挖掘算法,Python代碼,我是剛入門的時候讀過,這本書適合有一定Python基礎的同學閱讀,可能剛入門的同學,還是聚焦于pandas的熟練使用會比較好,以后入行后有空再讀,現(xiàn)在信息大爆炸,即使是好東西,我們也要選擇性的獲取,珍惜自己的時間 《機器學習》周志華, 這本太經(jīng)典了,我看了2遍,雖然并沒有進行公式推導,但也收獲蠻大,有空會再讀。這本書入門同學尤其是偏業(yè)務而非技術的分析師可以不用太著急讀,開始的精力先聚焦到數(shù)據(jù)思維,業(yè)務,excel,sql, 如果有富余精力,再學習python,一步一步來哈發(fā)布時間:2023-09-26瀏覽量:77次
發(fā)布時間:2022-06-28瀏覽量:964次
發(fā)布時間:2022-06-15瀏覽量:261次
發(fā)布時間:2022-06-14瀏覽量:544次
發(fā)布時間:2022-06-14瀏覽量:749次
400咨詢:4000011866
手機咨詢:137-0121-6791
技術支持QQ:400-0011-866
(工作日9:00-18:00)
產(chǎn)品建議郵箱
yixin@esensoft.com