當前位置:名人名言大全網 - 名人名言 - 數據分析大師的名言是什麽?

數據分析大師的名言是什麽?

本文講解了壹些數據分析的知識,因為在數字時代,無論是開發、分析師、產品還是運營,掌握數據分析的基本概念都是必備的崗位技能。我們常說的“數據感”,也可以概括為“數據分析思維”。

本文包括以下四個部分:

1.為什麽數據分析很重要?

2.常見的分析方法有哪些?

3.壹些數據驅動的方法

4.數據分析師的高級技能

| 0x 00為什麽數據分析很重要?

第壹個層面,統計學仍然是數據分析的核心方法。

我們先來看數據分析的定義:“為了提取有用的信息,形成結論,對數據進行詳細研究和總結的過程”。數據分析是以統計方法為基礎,為社會科學問題提供嚴謹的分析方法和工具。雖然大數據技術的出現極大地拓展了統計學研究的邊界,但並沒有改變統計學通過隨機抽樣推斷人口分布特征的基本思路。最基本的統計方法,如因果推斷、充分性原則、數據歸納等。,甚至因為大數據技術的普及而得到增強。在大數據技術的加持下,可以構建很多重要的社會經濟心理變量,比如居民的幸福感、投資者的情緒等,實時技術的發展甚至讓實時預測成為可能。

第二個層面,數據分析對業務發展有指導意義。

或者引用管理學大師彼得·格魯克的名言:“無法衡量就無法想象”。只有找到業務發展的關鍵衡量指標,即“北極星指標”,才能有針對性地優化業務。網上流傳著壹句話,谷歌的分析推動者之壹Avinash Kaushik有壹句名言,“所有數據加起來都是螃蟹。段或死。”,意思是“所有的總數據都是垃圾,不是群就是死”。匯總數據會掩蓋很多問題。只有深入分析數據,才能得到趨勢的真正原因,才能明白如何優化“北極星指數”。在互聯網人口紅利逐漸消失的前提下,對業務數據的深入了解和分析可以使業務保持高質量的增長。

綜上,數據分析還是很重要的。如果妳想知道妳的工作能產生什麽價值,數據分析的知識是數據從業者必不可少的“數據感”。

| 0x001常用的分析方法有哪些?

數據分析師的崗位技能要求我們能夠有條不紊、系統地分析和解決問題。我們需要借鑒壹些常用的分析方法,快速定位問題的根源。

分析方法包括兩部分,壹是宏觀戰略分析,二是微觀數據分析。

宏觀戰略分析主要包括:

PEST分析,通過研究政治、經濟、社會、技術,分析企業面臨的宏觀經濟形勢。

SWOT分析,通過研究優勢、劣勢、機會和威脅,來動態分析企業的內外部競爭狀況;

五力模型,通過分析同行業現有競爭對手的競爭力、潛在競爭對手的進入能力、替代品的替代能力、供應商的議價能力和采購商的議價能力,分析企業的競爭策略。

雖然宏觀分析對於我們的日常工作來說太大了,但是對於壹些具體的行業,比如保險、醫療、在線教育、共同基金、物流等,其實是很有幫助的。,分析政策、法規、風險等考慮因素。

接下來說壹下比較常見的微觀數據分析方法。下面結合壹個小案例介紹幾種常用的方法。

第壹個是假設檢驗。

假設檢驗分析又稱統計假設檢驗,是壹種統計推斷方法,用於判斷樣本之間、樣本之間、樣本與總體之間的差異是由抽樣誤差引起的還是由本質差異引起的。主要分為三步:1,提出假設;2.收集證據;3.得出結論。

假設檢驗主要是基於邏輯推理來分析問題的原因,所以在歸因分析中經常使用。

比如我們的北極星指數下降了,需要找出相應的原因。最初有三種可能,用戶問題,產品問題或者競品問題。

從這三個方面,我們可以提出三個假設:

如果用戶有問題,那麽我們可以從業務鏈接圖中分析問題,或者通過多維度分析拆解問題;

如果產品有問題,可以研究近期推出的產品功能是否符合用戶需求;

如果競品有問題,可以通過外部市場信息調查競品是否有補貼,是否大規模推廣。

有了初步結論後,分析的過程通常會繼續,多問為什麽,然後繼續用數據驗證原因,直到找到問題的根源。

第二個是邏輯樹分析。

邏輯樹分析很容易理解。就是把壹個復雜的問題分解成幾個簡單的問題,然後像樹幹壹樣壹步步把問題展開。通過解決單個子問題,我們可以得到問題答案的匯總。

比如,如果我們也分析壹下利潤增長緩慢的原因,可以用邏輯樹的方式把問題分成收入、成本、毛利三個維度,然後依次分析每個維度的問題。

收入需要考慮客戶數量、客戶質量、付費率、付費意願等問題;成本需要考慮廣告成本、人力成本、推廣策略等問題;毛利需要考慮倉配、渠道質量等問題。最後通過每個子問題的總結,得出真正的原因。

邏輯樹有三個基本原則,即

因式分解:將相同的問題歸納成元素;

分幅:將所有元素組織成壹個框架,遵守無重不漏的原則;

相關性:框架中的元素保持必要的相互關系,這種關系簡單但不孤立。

第三個講群體分析。

分組分析是將數據按照某個特征,比如時間、興趣等劃分到不同的組中,通過比較組間的數據差異來比較問題。

群體分析對於產品生命周期不同階段的分析很有幫助,比如新發布版本的效果,按時間把用戶分成不同的群體,然後比較不同群體之間的留存率,分析用戶留下或者離開的原因。

比如視頻平臺的用戶需要充值成為VIP才能觀看平臺專屬的電視劇,但是用戶可以隨時取消訂閱。這樣取消訂閱的用戶就是流失用戶。為了分析用戶流失的原因,我們可以使用群體分析法。

把每組的數據畫成虛線,橫軸是時間,縱軸是留存率,然後對比每組的虛線,我們通常很容易看出不同時間的留存率差別很大,原因如下:

產品最近推出了壹些新功能,但是這些新功能並不適合新用戶;

最近市場壹直在搞促銷活動,帶來新用戶,但是公司的產品對這些新用戶沒有價值,導致用戶流失。

結合上面提到的假設檢驗,進壹步分析問題的根源,所以我們形成了壹些相對固定的分析方法:1。群體分析,尋找留存率低的群體;2.假設檢驗,提出問題,驗證為什麽留存率這麽低。

不同策略的結合形成了我們自己的分析方法。

當然,數據分析的方法有很多,需要通過日常的學習和實踐來壹點壹點的總結和完善。

|0x02數據驅動的壹些方法

數據驅動,簡單來說就是通過數字服務的數據來分析問題的原因,比如電子商務、視頻等,並提出優化的解決方案來推動業務增長或產品叠代。這是互聯網行業成長的關鍵,是數據從業者需要掌握的商業方法,也是評價壹個人工作能力的重要衡量標準。

數據驅動通常由以下過程組成:

對數據進行定性分析,發現問題;

數據的定量分析,以確定影響面;

調查公司、競爭對手和行業的常見做法;

估計解決問題後的效果;

設計相應的實驗機制;

AB檢驗得出實驗結論;

上線跟蹤策略後續變化。

下面是壹些數據分析需要涉及的知識,即定性定量分析和AB測試。其他部分通常由工程團隊實現。

定性分析是對研究對象的“定性”研究,是對內在規律的分析;定量分析是對研究對象進行定量研究,描述其相互作用和發展趨勢。

比如通過數據發現了電商場景中“訂單到支付轉化率低”的問題,需要分析問題。我們通過分組+漏鬥的方法在部分商品中發現了這個問題,然後通過抽樣看數據分析問題原因,很可能是因為虛假價格。這是定性分析。定位原因後,選取抽象商品,通過人為評估虛假價格的比例來推斷整體影響範圍,這就是定量分析。

然後,我們設置壹些策略,需要驗證這些策略對“訂單到支付轉化率低”問題的影響,所以需要做實驗對比。

AB實驗是指同壹問題有兩種或兩種以上解決方案的問題,將同壹組人隨機分為兩組。在相同的時間維度下,實驗組和對照組進行實驗,用少量相同的測量指標來衡量哪個方案的結果更好。當然,這樣做的前提是樣本量足夠,但對於數字化的互聯網業務來說,通常並不難。

通過分析AB實驗後不同策略的對比數據,可以看出我們的策略是否能帶來預期的正面效果,如果能,就可以上線了。上線後進行量化數據分析,看問題解決的程度。

這些是壹些常規的數據驅動方法。

|0xFF數據分析師的高級技能

數據分析師也需要懂算法。

很多時候,分析師被分為“向前”和“向後”的角色,就像開發壹樣。“向前”的角色跟隨業務,能夠發現業務中存在的問題,找到相應的優化點;“後向”的作用更多的是實現壹個功能,優化算法或者實驗方法,更像後端,但更智能。

雖然統計學可以給我們提供壹個非常好的分析方法,但並不是世界上所有的問題都可以用統計學來概括。很多方向的分析師還是需要掌握算法才能滿足工作的需要。

比如最典型的“供需匹配”問題,因為量變引起質變。

在互聯網過去的發展歷史中,無論在B2C、C2C、B2B、B2B2C,我們都建立了精準的畫像體系,不僅針對用戶,也針對供應商,實現了千人千面的用戶管理,更好的匹配供需管理。後來這個機制又衍生到其他方面,比如個性化視頻推薦、網約車管理等,都是供需匹配的壹部分。

但是,如何在幾千萬甚至幾十億的商品中做匹配召回,如何在海量數據中匹配線索,如何明確哪些人是我們的目標人群,如何向最適合的人推薦信息流,如何衡量這些效果……很多方案都需要綜合考慮,無論是通過統計數據分析形成規則,還是通過算法挖掘特征,都是達到目的的途徑。

因為大公司資源豐富,通常是並行運行,這在壹定程度上嚴格區分了數據分析和數據算法的責任邊界。但是,中小企業有限的資源可能會造成分析就是算法的現象。

類似的還有風控、知識圖譜等領域。除了人力的覆蓋,還需要機器的介入來優化效果。

事實上,數據分析師的成長更像是壹場馬拉松,因為他們需要接觸大量的知識,能夠合理分配自己的時間和精力,經常提醒自己的核心目標是什麽,才能把事情做好,在長跑中不掉隊。分析只是壹種技能。作為生活中的職業,需要更加貼近實際場景,貼近公司發展,做出相應合理的策略。