舉一個實際的例子:我們需要分析影響產品合格率波動的主要原因,如何提出有效的改進措施,并且已經收集了相關的生產數據記錄(圖1)。其中,合格率代表最終質量結果,列有電流、潔凈度、厚度、設備、操作人員等。代表可能影響生產過程的變化因素。這種問題在工作中很常見,而這恰恰讓統計分析工具大展身手。現在,讓我們看看Minitab和JMP之間的分析差異。
圖1
首先用Minitab16版來分析一下。首先,確保這個問題的響應是一個連續變量,因子既有連續變量,也有離散變量。因此,我們需要使用方差分析和回歸的方法。從Minitab菜單中選擇,使用“統計>方差分析>單因素”和“統計>回歸>回歸”的方法,觀察各潛在因素對合格率的重要性,分析報告如圖2所示。從結果來看,操作員、電流和厚度可能是關鍵因素,而設備和清潔度可能不是。
圖2
而且Minitab的“統計>方差分析>一般線性模型”功能,可以對合格率與操作者、電流、厚度的關系建立多元回歸,從而確認這些因素的重要性。根據圖3的分析報告發現,真正起作用的是操作者和電流,而厚度實際上并沒有起到顯著的作用。
圖3
用JMP 9版再分析一遍。這是同樣的問題。因為我們分別研究單個變量對響應值(因子對響應)的影響,所以我們需要在JMP主菜單“分析>用X擬合Y”中分析這些因素。
然后和上面類似,通過多元回歸(同時考慮一個響應值Y和多個因子X)建立模型,可以在JMP主菜單的“分析>擬合模型”下實現。純統計層面的分析報告和Minitab里的類似,結論也是一樣的,我就不花篇幅展示了。最大的區別在于,JMP的分析報告包含許多圖形化的分析結果,這些結果對于解釋和交換分析結果并將其轉化為行動非常有用。如圖4所示,預測描述符。
圖4
從圖中可以看出,操作者和電流對合格率的影響很明顯,而厚度對合格率的影響要小得多。此外,基于該模型,JMP還提供了一個蒙特卡羅模擬器,模擬因子的波動將如何傳遞到響應值,由于篇幅限制,此處不再贅述。
除了上面提到的主菜單選項,發現在JMP還有其他適合分析這個問題的方法,比如“分析>分布”、“分析>建模>分割”、“分析>建模>神經”等等。后兩個是專業的數據挖掘數據挖掘工具,解釋起來相當冗長。以相對最簡單的“分析>分布”為例具體展開。使用“分析>分布”獲得包含所有變量直方圖的窗口。好像用Minitab多走幾步就可以搞定。然而,這只是第一步。有趣的是,JMP制作的圖形可以動態鏈接(如下圖所示,一個直方圖中高亮顯示的部分可以在其他直方圖中找到對應的位置)。這對于我認識的一些不太懂統計學,對數字不敏感的技術人員來說特別有用。例如,從圖5可以看出,大于6的電流設置和操作人員1、2的操作是保證高合格率的重要條件,操作人員3可能需要培訓。在Minitab中,每個圖形只能是獨立的,所以沒有辦法使用。
圖5
上述研究得出結論:
1.從基本統計工具的使用來看,Minitab和JMP都可以實現,它們的功能類似(這里不討論高級統計功能)。只有使用Minitab的人才需要具備一定的統計工具知識,否則可能不知道使用哪種統計方法;JMP的菜單設計更人性化(或者說“笨”),對統計一竅不通的人也能找到自己的出路。
2.JMP比Minitab更注重圖形等直觀手段的使用,圖形更靈活,應該更適合企業中對統計了解不多但需要處理數據的工程師。