資料內(nèi)容:
1. 撲克牌54張,平均分成2份,求這2份都有2張A的概率。
M表示兩個牌堆各有2個A的情況:M=4(25!25!)
N表示兩個牌堆完全隨機的情況:N=27!27!
所以概率為:M/N = 926/53*17
2. 男生點擊率增加,女生點擊率增加,總體為何減少?
因為男女的點擊率可能有較大差異,同時低點擊率群體的占比增大。
如原來男性20人,點擊1人;女性100人,點擊99人,總點擊率100/120。
現(xiàn)在男性100人,點擊6人;女性20人,點擊20人,總點擊率26/120。
即那個段子“A系中智商最低的人去讀B,同時提高了A系和B系的平均智商。”
3. 參數(shù)估計
用樣本統(tǒng)計量去估計總體的參數(shù)。
4. 假設(shè)檢驗
參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷,但推斷的角度不同。
參數(shù)估計討論的是用樣本估計總體參數(shù)的方法,總體參數(shù)μ在估計前是未知的。
而在假設(shè)檢驗中,則是先對μ的值提出一個假設(shè),然后利用樣本信息去檢驗這個假設(shè)是否成立。
5. 置信度、置信區(qū)間
置信區(qū)間是我們所計算出的變量存在的范圍,水平就是我們對于這個數(shù)值存在于我們計算出的這個范圍的可信程度。
舉例來講,有95%的把握,真正的數(shù)值在我們所計算的范圍里。
在這里,95%是置信水平,而計算出的范圍,就是置信區(qū)間。
如果置信度為95%, 則抽取100個樣本來估計總體的均值,由100個樣本所構(gòu)造的100個區(qū)間中,約有95個區(qū)間包含總體均值。
6. 協(xié)方差與相關(guān)系數(shù)的區(qū)別和聯(lián)系
協(xié)方差:
協(xié)方差表示的是兩個變量的總體的誤差,這與只表示一個變量誤差的方差不同。如果兩個變量的變化趨勢一致,也就是說如果其中一個大于自身的期望值,另外一個也大于自身的期望值,那么兩個變量之間的協(xié)方差就是正值。如果兩個變量的變化趨勢相反,即其中一個大于自身的期望值,另外一個卻小于自身的期望值,那么兩個變量之間的協(xié)方差就是負值。
相關(guān)系數(shù):
研究變量之間線性相關(guān)程度的量,取值范圍是[-1,1]。相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個變量量綱影響、標(biāo)準化后的特殊協(xié)方差。