參數估計和假設檢驗是統計推斷的兩個重要方面。參數估計以“數”為輸出結果,假設檢驗以“判斷”為輸出結果。以下描述了假設檢驗步驟。
1.建立一個假設。
假設檢驗的第一步是建立假設,這通常需要兩個假設:原始假設Ho和替代假設H1。
2.選擇檢驗統計以確定被拒絕域的形式。
如果測試總休息的平均值,那么我們將使用樣本平均值來導出測試統計量;如果正態總體的方差被檢驗,我們將從樣本方差中導出檢驗統計量。
根據統計量的值,將整個樣本空間分為拒絕域W和非拒絕域a兩部分,當樣本統計量的值落在拒絕域時,原假設將被拒絕,否則不能拒絕原假設。因此,在假設檢驗,我們必須找出被拒絕的域。
根據不同的替代假設;拒絕域可以是雙邊的或單邊的。在確定了拒絕域的類型之后,也確定了臨界值。這要根據犯錯誤的允許概率來確定。
3.在測試中給出顯著性水平A。
在判斷原假設是否成立時,由于樣本的隨機性,可能會出現兩種錯誤。第一種錯誤是當原假設為真時,由于樣本的隨機性,樣本的觀測值落入拒絕域W,從而做出拒絕原假設的決策。這種誤差稱為第一種誤差,也稱為誤拒概率。
第二種錯誤的解釋:如果鋼筋的平均抗拉強度真的比原來高,那么鋼筋的平均抗拉強度就不再是原來的2000公斤了,但是我們并沒有拒絕把Ho誤認為沒有提高,也就是把“提高了”誤認為“沒有提高”。一般來說,何鴻燊失敗的時候,我們沒有拒絕何鴻燊,這是第二種錯誤。
4.給出臨界值,確定拒絕域。
有了顯著性水平A,我們就可以根據給定的測試統計量分布,查表得到臨界值,從而確定具體的拒絕域。在不同的替代假設下,拒絕域、臨界值和顯著性水平A之間的關系是不同的。其含義見下圖。
5.根據樣品的觀察值,計算檢驗統計值。
根據樣品的觀察值,計算檢驗統計值;收集樣本數據并計算檢驗統計值。
6.根據檢驗統計值是否屬于拒收字段進行判斷。
①將檢驗統計量的值與拒絕域的臨界值進行比較,當原假設落在拒絕域時,作出拒絕原假設的結論,否則,作出不能拒絕原假設的結論。
②用檢驗統計量計算P值。所謂P值,就是原假設成立時的當前情況的概率(嚴格來說,當前情況或更不利于原假設的情況,即更有利于替代假設的情況的概率)。當這個概率很小時(例如小于0.05),在原假設成立的情況下,這個結果不應該出現在實驗中;但現在它確實出現了,所以我們有理由認為“原假設為真”的前提是錯誤的,所以我們應該拒絕原假設,接受替代假設。所以可以有一個普遍規律:如果p
③根據樣本的觀測值可以得到總體參數的置信區間。如果原假設的參數值不落入該置信區間,則作出拒絕原假設的結論,否則作出不能拒絕原假設的結論。目前大多數統計軟件都提供了相應的置信區間,不需要自己計算,所以用這種方法判斷也很方便。