一、為什么學習數據分析
1. 運營的尷尬:運營人需要一個硬技能
每個初入行的新人都會察覺到,運營是一個似乎并沒有自己的核心競爭力和安全感的工作。因為每天的工作好像都被各種瑣事所圍繞,而只有一個主題是永恒不變的,那就是——提需求,不斷地提各種需求。
運營人需要一個硬核技能,提升自己的職業價值,提高自己的職業安全感,而不是每天都在各種的等排期:數據分析排期、產品設計排期、UI排期、開發排期。
運營迫切需要通過利用SQL/Python等工具,從數據中及時發現更多的業務價值,提高自己的產出。
2. 數據分析的前景
這幾年隨著人工智能的火熱,數據分析技能也逐漸受到了更多的認可。從國外BA專業申請和國內數據分析培訓的火熱也可見一斑。但對于在職人士,從單純的技能習得角度去看,BA的能力完全是可以自學獲得的。
我認為:未來數據分析能力在運營人的能力模型中的比重仍會繼續加大,將來甚至會擠壓數據分析師的需求和生存空間。所以,對于數據分析,前景很好;而數據分析師,前景并不樂觀。
二、學習數據分析需要做的準備
1. 明確方向
數據分析有兩個方向:
業務向:如數據產品經理、數據分析師,對技術要求并不那么高;
技術向:需要懂數據挖掘、算法等,對技術的要求較高。
從自己的定位來看,并不打算做數據挖掘,因為自己的知識結構和時間上的投入產出比可能并不太高。主要希望通過數據分析技能,增強自己作為產品運營的競爭力。
2. 做好持久戰準備
于我一個沒有任何基礎的純小白而言,并不是能速成的,需要做好持續學習的準備。
三、做好數據分析需要具備哪些技能
統計學基礎知識
Excel的熟練使用
SQL
Python
分析方法和思維
對業務的充分理解
從自身來看,主要需要彌補的為:SQL+Excel+統計+Python。主要以看書為主,視頻為輔,不需要報任何的培訓班。
1. SQL
SQL大概是互聯網公司做數據分析用到的最多、最重要的工具了。在整個數據分析過程中,用SQL提取數據,可能要占到整個數據分析過程的50%-80%,以至于很多數據分析師都被戲稱為“SQL Boy/Girl”。
MySQL數據庫的功能可以用四個字概括:增刪改查。
但是對于我們來說,我們能用到的只會有數據庫查詢功能,其它權限是不可能開放給你的。
如果數據庫你覺得生澀的話,可以這么理解:
SQL? 就是一條存取數據的命令;
數據庫? 就相當于一個文件夾;
數據表? 就相當于文件夾內的一個Excel文件。
表名就是文件名;表中的每一列有一個名字,就是列名,也可以成為字段。
SQL的學習可以分為三塊:
簡單查詢
關聯查詢
函數引用
什么是查詢呢?
在數據庫建立之后,通過sql命令里最常用的語句SELECT,讓我們查看數據庫里保存的數據,并可以進行一定的分析和歸納。

(1)簡單查詢
SELECT語句的完整格式包含6個子句:
FROM 子句:查詢數據的表,指定數據的來源;
WHERE 子句:查詢數據的過濾條件;
GROUP BY 子句:對匹配 WHERE 子句的查詢結果進行分組;
HAVING 子句:對分組后的結果進行條件限制;
ORDER BY 子句:對查詢結果進行排序,后面跟 DESC 降序或 ASC 升序(默認);
LIMIT 子句:對查詢的顯示結果限制行數。
(2)關聯查詢
如果要進行多表查詢,就需要用到連接。
連接查詢是把兩個或多個表連接在一起來獲取數據,是關系型數據庫中最主要的查詢。表的連接方式主要包括內連接、外連接和交叉連接等。
from 指定查詢表名、并給出別名;
left join 左外連接,左表全部記錄及右表匹配記錄出現在查詢結果中;
inner join 內連接,左表和右表共同的記錄出現在查詢結果中;
right join 右外連接,右表全部記錄及左表匹配記錄出現在查詢結果中;
on 指定關聯條件。
表連接后的結果可以通過這個圖清晰地展示出來:

(3)函數引用
利用函數可以提高sql的效率,經常用到的函數主要有:
邏輯運算:and、or、not;
數值運算:round、floor、ceil、rand、exp、sqrt等;
日期函數:from_unixtime、unix_timestamp、year、month、day、hour、minute、second、weekofyear、detediff、date_add、date_sub等;
條件函數:if、coalesce、case when等;
字符串函數:concat、substr、trim、reverse、split等;
集合統計函數:count、sum、max、min、percentile等。
推薦書目:
Hive:
隨著數據量的不斷增加,很多時候mysql已經滿足不了數據需要,很多公司開始使用hive或者presto。其實有了SQL的基礎,HIVE學習還是比較簡單的。
推薦書目:《HIVE編程指南》。
重點看下HQL的數據操作、查詢、調優部分,與mySQL大同小異,只是一些語法需要單獨注意下即可。
2. Excel
Excel大家多少都會一些,它的功能很強大,但是絕大多數人,可能使用了它的1%功能都不到。
Excel 可以進行各種數據的處理、統計分析和輔助決策等。
作為常用的數據處理和展現工具,我們除了要熟練使用Excel 的函數和數據透視表等操作工具外,更重要的是,利用好Excel 的可視化,用圖表將結論展現出來,這樣分析和可視化能力會得到迅速提高。
SQL+Excel可以說是數據分析的必備神器。
推薦書目:《誰說菜鳥不會數據分析》。
這本書不只是介紹Excel的功能,更重要的是介紹一些實踐場景中數據分析的步驟和思路,對于初學者有很大的指導意義。
3. 統計學
統計學是數據分析的理論基礎,可以使數據分析更加系統化。
沒有統計學基礎的數據分析師的職業發展之路不會長遠,因為在工作中可能會常常遇到不知道該用什么方法找尋數據規律的瓶頸,因此掌握數據分析的統計學基礎知識是成為一名優秀數據分析師的基礎。
主要需要掌握:
用于集中趨勢分析的平均數、中數、眾數;
用于離中趨勢分析的全距、 四分差、平均差、方差、標準差;
研究現象之間是否存在某種依存關系的相關分析;
確定兩種或 兩種以上變數間相互依賴的定量關系的回歸分析;
揭示同一個變量的各個類別之間的差異,以及不同變量各個類別之間的對應關系的關聯分析、R-Q 型因子分析;
研究從變量群中提取共性因子 的因子分析;
用于兩個及以上樣本均數差別的顯著性檢驗的方差分析;
概率及分布、參數估計、 假設檢驗等等經典統計學內容。
很多人都推薦《商務與經濟統計》,說實話,這本書對小白并不友好。
我的進階路徑是:《赤裸裸的統計學》→《深入淺出統計學》→《商務與經濟統計》
前面兩本書更加有趣味性,對于小白,更容易理解,不至于讓你很快從學習到放棄。
3. Python
說實話,互聯網行業日常的數據分析中用到python的機會并不多,SQL+Excel可以說能解決95%的工作需要。另外5%主要是在數據量較大,SQL已經無法滿足工作需要時,那么Python大法就該出場了。
我們分析一般都是有了現成的公司數據,很少有從外部獲取的,所以爬蟲,可以暫時先不學,有需要的話,先找爬蟲插件搞定即可。
主要學習python基礎和數據分析的幾個包。
作為一個沒有編程、數學、統計基礎的小白,我是從《父與子的編程之旅》開始看的,這本書對我這種完全負基礎的人,真是極度友好。可以說,看了很多推薦的書和視頻,最開始學習的時候,只有這一本書是我可以看懂,而且看得下去的。
這本書看完后,又對照《笨方法學python》做了些題目,然后可以進入python數據分析的學習,主要是《利用python進行數據分析》,主要掌握numpy、pandas、Matplotlib庫等。
四、總結
最后總結下來,整個時間段,基本可以分為:
SQL:學習1個月,專門練習1個月,另加工作中持續練習;
Excel:學習2周,專門練習1周;
統計學:學習2個月;
Python:學習6個月,一直在練習。
數據分析是產品經理和產品運營都必須具備的能力之一,隨著科技的發展,不懂技術的運營和產品終將要被淘汰。
現在稀缺的技能,在未來,一定會成為必備的一項基礎素質。
我們應該面向未來去學習。
一起加油~~
(部分內容來源網絡,如有侵權請聯系刪除)