Python知識分享網(wǎng) - 專業(yè)的Python學(xué)習(xí)網(wǎng)站 學(xué)Python,上Python222
28道數(shù)據(jù)分析經(jīng)典面試題 DOC 下載
發(fā)布于:2023-12-10 10:58:13
(假如點擊沒反應(yīng),多刷新兩次就OK!)

28道數(shù)據(jù)分析經(jīng)典面試題 DOC 下載   圖1

 

 

資料內(nèi)容:

 

 

1. 撲克牌54張,平均分成2份,求這2份都有2A的概率。

M表示兩個牌堆各有2A的情況:M=4(25!25!)

N表示兩個牌堆完全隨機(jī)的情況:N=27!27!

所以概率為:M/N = 926/53*17


2. 男生點擊率增加,女生點擊率增加,總體為何減少?

因為男女的點擊率可能有較大差異,同時低點擊率群體的占比增大。

如原來男性20人,點擊1人;女性100人,點擊99人,總點擊率100/120

現(xiàn)在男性100人,點擊6人;女性20人,點擊20人,總點擊率26/120。

即那個段子A系中智商最低的人去讀B,同時提高了A系和B系的平均智商。”


3. 參數(shù)估計

用樣本統(tǒng)計量去估計總體的參數(shù)。

4. 假設(shè)檢驗

參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個組成部分,它們都是利用樣本對總體進(jìn)行某種推斷,但推斷的角度不同。

參數(shù)估計討論的是用樣本估計總體參數(shù)的方法,總體參數(shù)μ在估計前是未知的。

而在假設(shè)檢驗中,則是先對μ的值提出一個假設(shè),然后利用樣本信息去檢驗這個假設(shè)是否成立。


5. 置信度、置信區(qū)間

置信區(qū)間是我們所計算出的變量存在的范圍,水平就是我們對于這個數(shù)值存在于我們計算出的這個范圍的可信程度。

舉例來講,有95%的把握,真正的數(shù)值在我們所計算的范圍里。

在這里,95%是置信水平,而計算出的范圍,就是置信區(qū)間。

如果置信度為95%, 則抽取100個樣本來估計總體的均值,由100個樣本所構(gòu)造的100個區(qū)間中,約有95個區(qū)間包含總體均值。


6. 協(xié)方差與相關(guān)系數(shù)的區(qū)別和聯(lián)系

協(xié)方差:
協(xié)方差表示的是兩個變量的總體的誤差,這與只表示一個變量誤差的方差不同。如果兩個變量的變化趨勢一致,也就是說如果其中一個大于自身的期望值,另外一個也大于自身的期望值,那么兩個變量之間的協(xié)方差就是正值。如果兩個變量的變化趨勢相反,即其中一個大于自身的期望值,另外一個卻小于自身的期望值,那么兩個變量之間的協(xié)方差就是負(fù)值。

 

相關(guān)系數(shù):
研究變量之間線性相關(guān)程度的量,取值范圍是[-1,1]。相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個變量量綱影響、標(biāo)準(zhǔn)化后的特殊協(xié)方差。