查看文章
統計學(xué)中的P值,“差異具有顯著(zhù)性”和“具有顯著(zhù)差異”
2009年09月18日 星期五 14:39
P值是論文中最常用的一個(gè)統計學(xué)指標,可是其誤用、解釋錯誤的現象卻很常見(jiàn)。因此,很有必要說(shuō)明p值的意義、用法及常見(jiàn)錯誤。
P值指的是比較的兩者的差別是由機遇所致的可能性大小。P值越小,越有理由認為對比事物間存在差異。例如,P<0.05,就是說(shuō)結果顯示的差別是由機遇所致的可能性不足5%,或者說(shuō),別人在同樣的條件下重復同樣的研究,得出相反結論的可能性不足5%。P>0.05稱(chēng)“不顯著(zhù)”;P<=0.05稱(chēng)“顯著(zhù)”,P<=0.01稱(chēng)“非常顯著(zhù)”。
由于常用“顯著(zhù)”來(lái)表示P值大小,所以P值最常見(jiàn)的誤用是把統計學(xué)上的顯著(zhù)與臨床或實(shí)際中的顯著(zhù)差異相混淆,即混淆“差異具有顯著(zhù)性”和“具有顯著(zhù)差異”二者的意思。其實(shí),前者指的是p<=0.05,即說(shuō)明有充分的理由認為比較的二者來(lái)自同一總體的可能性不足5%,因而認為二者確實(shí)有差異,下這個(gè)結論出錯的可能性<=5%。而后者的意思是二者的差別確實(shí)很大。舉例來(lái)說(shuō),4和40的差別很大,因而可以說(shuō)是“有顯著(zhù)差異”,而4和4.2差別不大,但如果計算得到的P值<=0.05,則認為二者“差別有顯著(zhù)性”,但是不能說(shuō)“有顯著(zhù)差異”。
由于“有顯著(zhù)差異”和“差異具有顯著(zhù)性”容易混淆,因而現在有些期刊提倡用“差異有統計意義”來(lái)代替“差異有顯著(zhù)性”,用“差異無(wú)統計意義”、“差異有高度統計意義”來(lái)代替“差異不顯著(zhù)”和“差異有高度顯著(zhù)性”。例如《中華胃腸外科學(xué)》即是如此。
如果P>5%,是否我們就可以下結論說(shuō)比較的二者沒(méi)有差別呢?不能。P>5%只能說(shuō)明沒(méi)有充分的證據說(shuō)明二者確有差別,但是也不能說(shuō)二者沒(méi)有差別或差別很小。在這兩個(gè)極端之間還有一個(gè)過(guò)渡區間,即無(wú)論下有差別還是沒(méi)有差別或差別很小的證據都不足。要推斷二者沒(méi)有差別或差別很小,需要采用等效檢驗的統計推斷方法。
統計縮略詞的含義:
ND not determined; NS not significant
.
統計學(xué)中的P值與顯著(zhù)性的意義
轉載自
SPSS中文社區,作者:xiaowenzi2
統計學(xué)意義(p值)
結果的統計學(xué)意義是結果真實(shí)程度(能夠代表總體)的一種估計方法。專(zhuān)業(yè)上,p值為結果可信程度的一個(gè)遞減指標,p值越大,我們越不能認為樣本中變量的關(guān)聯(lián)是總體中各變量關(guān)聯(lián)的可靠指標。p值是將觀(guān)察結果認為有效即具有總體代表性的犯錯概率。如p=0.05提示樣本中變量關(guān)聯(lián)有5%的可能是由于偶然性造成的。即假設總體中任意變量間均無(wú)關(guān)聯(lián),我們重復類(lèi)似實(shí)驗,會(huì )發(fā)現約20個(gè)實(shí)驗中有一個(gè)實(shí)驗,我們所研究的變量關(guān)聯(lián)將等于或強于我們的實(shí)驗結果。(這并不是說(shuō)如果變量間存在關(guān)聯(lián),我們可得到5%或95%次數的相同結果,當總體中的變量存在關(guān)聯(lián),重復研究和發(fā)現關(guān)聯(lián)的可能性與設計的統計學(xué)效力有關(guān)。)在許多研究領(lǐng)域,0.05的p值通常被認為是可接受錯誤的邊界水平。
如何判定結果具有真實(shí)的顯著(zhù)性
在最后結論中判斷什么樣的顯著(zhù)性水平具有統計學(xué)意義,不可避免地帶有武斷性。換句話(huà)說(shuō),認為結果無(wú)效而被拒絕接受的水平的選擇具有武斷性。實(shí)踐中,最后的決定通常依賴(lài)于數據集比較和分析過(guò)程中結果是先驗性還是僅僅為均數之間的兩兩>比較,依賴(lài)于總體數據集里結論一致的支持性證據的數量,依賴(lài)于以往該研究領(lǐng)域的慣例。通常,許多的科學(xué)領(lǐng)域中產(chǎn)生p值的結果≤0.05被認為是統計學(xué)意義的邊界線(xiàn),但是這顯著(zhù)性水平還包含了相當高的犯錯可能性。結果0.05≥p>0.01被認為是具有統計學(xué)意義,而0.01≥p≥0.001被認為具有高度統計學(xué)意義。但要注意這種分類(lèi)僅僅是研究基礎上非正規的判斷常規。
所有的檢驗統計都是正態(tài)分布的嗎
并不完全如此,但大多數檢驗都直接或間接與之有關(guān),可以從正態(tài)分布中推導出來(lái),如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變量在總體中呈正態(tài)分布,即滿(mǎn)足所謂的正態(tài)假設。許多觀(guān)察變量的確是呈正態(tài)分布的,這也是正態(tài)分布是現實(shí)世界的基本特征的原因。當人們用在正態(tài)分布基礎上建立的檢驗分析非正態(tài)分布變量的數據時(shí)問(wèn)題就產(chǎn)生了,(參閱非參數和方差分析的正態(tài)性檢驗)。這種條件下有兩種方法:一是用替代的非參數檢驗(即無(wú)分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基于正態(tài)分布前提下的檢驗。后一種方法是基于一個(gè)相當重要的原則產(chǎn)生的,該原則對正態(tài)方程基礎上的總體檢驗有極其重要的作用。即,隨著(zhù)樣本量的增加,樣本分布形狀趨于正態(tài),即使所研究的變量分布并不呈正態(tài)。
========================顯著(zhù)性差異 維基百科,自由的百科全書(shū)============
顯著(zhù)性差異(significance level),是一個(gè)統計學(xué)名詞。它是
統計學(xué)(Statistics)上對數據差異性的評價(jià)。當數據之間具有了顯著(zhù)性差異,就說(shuō)明參與比對的數據不是來(lái)自于同一
總體(Population),而是來(lái)自于具有差異的兩個(gè)不同總體,這種差異可能因參與比對的數據是來(lái)自不同實(shí)驗對象的,如
比-西一般能力測驗中,大學(xué)學(xué)歷被試組的成績(jì)與小學(xué)學(xué)歷被試組會(huì )有顯著(zhù)性差異。也可能來(lái)自于
實(shí)驗處理對實(shí)驗對象造成了根本性狀改變,因而前測后測的數據會(huì )有顯著(zhù)性差異。例如,記憶術(shù)研究發(fā)現,被試學(xué)習某記憶法前的成績(jì)和學(xué)習記憶法后的記憶成績(jì)會(huì )有顯著(zhù)性差異,這一差異很可能來(lái)自于學(xué)××記憶法對被試記憶能力的改變。
顯著(zhù)性差異是一種有量度的或然性評價(jià)。比如,我們說(shuō)A、B兩數據在
.05水平上具備顯著(zhù)性差異,這是說(shuō)兩組數據具備顯著(zhù)性差異的可能性為95%。兩個(gè)數據所代表的樣本還有5%的可能性是沒(méi)有差異的。這5%的差異是由于隨機誤差造成的。
通常情況下,實(shí)驗結果達到
.05水平或
.01水平,才可以說(shuō)數據之間具備了顯著(zhù)性差異。在作結論時(shí),應確實(shí)描述方向性(例如顯著(zhù)大于或顯著(zhù)小于)。
如果我們是檢驗某實(shí)驗(Hypothesis Test)中測得的數據,那么當數據之間具備了顯著(zhù)性差異,實(shí)驗的
虛無(wú)假設(Null Hypothesis)就可被推翻,
對立假設(Alternative Hypothesis)得到支持;反之若數據之間不具備顯著(zhù)性差異,則實(shí)驗的備則假設可以被推翻,虛無(wú)假設得到支持。
假設檢定