隨著(zhù)科技的發(fā)展、社會(huì )的進(jìn)步,人類(lèi)認識世界的方法與技術(shù)也在不斷發(fā)展.在人們的認知過(guò)程中,借助已知信息推斷未知事物、在已知與未知之間架起橋梁是解決問(wèn)題的基本思想,是構建方法與技術(shù)的理論基礎.統計推斷是根據收集到的各種數據,運用統計推理,推斷未知事件、預測將來(lái)事件的一門(mén)科學(xué).
抽樣調查是一種應用廣泛、行之有效的統計推斷方法,它源于人們通過(guò)對部分的分析認識,進(jìn)而推廣到對整體的認識,即用樣本估計總體.用樣本估計總體的方法是不完全歸納法在統計中的一種運用,其基本要素是抽樣調查.因此我們說(shuō),抽樣調查的核心在于估計,對“估計什么、如何估計、估計的效果如何”等問(wèn)題的認識,涉及到總體、個(gè)體、樣本、如何抽樣、誤差分析等一系列問(wèn)題,這些問(wèn)題的解決、拓展、形成統計的一門(mén)專(zhuān)業(yè)課程,是統計專(zhuān)業(yè)學(xué)生后繼課程的必修內容.
根據義務(wù)教育數學(xué)課程標準的闡述,初中階段統計教學(xué)的定位是:“要求學(xué)生體會(huì )抽樣的必要性以及用樣本估計總體的思想,進(jìn)一步學(xué)習描述數據的方法.能從事收集、整理、描述和分析數據的活動(dòng),能用計算器處理較為復雜的統計數據”.因此,用樣本估計總體是初中統計教學(xué)的核心思想.作為“用樣本估計總體”思想的具體產(chǎn)物──抽樣調查,即成為初中統計學(xué)習的核心方法.
一、 對抽樣調查適用范圍的認識
統計調查包括全面調查與抽樣調查兩種,兩種方法各有優(yōu)劣,如何結合生活經(jīng)驗,讓學(xué)生在分析具體事例的過(guò)程中理解抽樣調查的必要性、了解抽樣調查的適用范圍,需要教師給予正確引導.
【案例1】
在初步介紹了抽樣調查是用部分推斷全體后,教師問(wèn):“你在生活中有沒(méi)有用抽樣調查的方法來(lái)解決問(wèn)題的經(jīng)歷呢?請你舉例說(shuō)明.”
學(xué)生答:“買(mǎi)水果時(shí),先嘗一個(gè)”、“煲湯后,嘗一勺看看咸淡”、“查血型時(shí),抽一滴血檢驗”、“抽查幾個(gè)同學(xué)的作業(yè),了解全班同學(xué)的作業(yè)情況”、“老師點(diǎn)我回答問(wèn)題,通過(guò)我的回答了解全班同學(xué)對這個(gè)問(wèn)題的掌握情況”……
教師接著(zhù)補充:“除了大家的親身經(jīng)歷外,抽樣調查在更大的領(lǐng)域里有著(zhù)廣泛的應用,如學(xué)校通過(guò)考試了解同學(xué)們的學(xué)習情況,食品中‘放心奶、放心肉、放心雞蛋’等的檢測,工業(yè)中各種產(chǎn)品質(zhì)量的監測,醫學(xué)中各種藥品的研制與治療效果的檢驗,經(jīng)濟中各種指標數據的獲得,…….”
分析:每個(gè)學(xué)生都有使用抽樣調查解決問(wèn)題的生活經(jīng)驗,但是絕大多數學(xué)生并沒(méi)有意識到自己在使用抽樣調查方法解決問(wèn)題.由于教材上給出的案例大多數都是基于開(kāi)展研究收集數據時(shí)構造出的事例,比較單一,因此,教師實(shí)施“對抽樣調查適用范圍的認識”這一環(huán)節的教學(xué)時(shí),案例先由學(xué)生給出,教師再加以補充,從學(xué)生的親身經(jīng)歷拓展到教育、社會(huì )、工業(yè)、醫學(xué)、經(jīng)濟等多個(gè)領(lǐng)域,很好地體現出抽樣調查適用范圍的廣闊性.事實(shí)上,抽樣調查方法與基本讀寫(xiě)能力一樣,應成為每個(gè)公民應掌握的基本技能.
【案例2】
教師:“下面我們看1個(gè)具體的例子,‘某中學(xué)共有2000名學(xué)生,現在想了解全校學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況’,請大家選擇用什么方法開(kāi)展調查,怎樣調查.”
學(xué)生甲:“因為全校有2000名學(xué)生,人數較多,全面調查比較麻煩,所以我用抽樣調查”.
學(xué)生乙:“現在學(xué)校都有校訊通,給每個(gè)學(xué)生發(fā)個(gè)短信,每人回復一條短信,用統計軟件一下子就算出結果了,非常簡(jiǎn)單,所以,我選擇用全面調查;如果用抽樣調查,還要確定抽哪些人,反而麻煩.”
教師:“學(xué)生乙的意見(jiàn)非常好!現代科技的發(fā)展的確給我們的調查研究帶來(lái)了方法上的革命!是否麻煩與使用的數據處理方法有關(guān),過(guò)去有些麻煩的數據處理問(wèn)題,現在使用現代的通訊、電腦技術(shù),就不成問(wèn)題了.”.
接著(zhù),教師補充:“現在,假設要在課堂上對全校2000名學(xué)生的選擇情況作全面調查,就難以實(shí)施.所以,下面要用我們全班56個(gè)同學(xué)作為總體,進(jìn)行模擬抽樣試驗……”
分析:學(xué)生乙對該問(wèn)題的認識體現出社會(huì )教育與學(xué)校教育對學(xué)生的共同影響.一方面,學(xué)生在課堂上接受常規知識與方法的系統學(xué)習,另一方面,學(xué)生通過(guò)家庭、社會(huì )、媒體、網(wǎng)絡(luò )等多種渠道獲取多種信息與技術(shù),加深對學(xué)校教育獲得知識方法的理解與運用.由于問(wèn)題“某中學(xué)共有2000名學(xué)生,現在想了解全校學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況”比較單一,在已有技術(shù)支撐基礎上(如:廣州城市學(xué)校與中國移動(dòng)聯(lián)合,開(kāi)通校訊通業(yè)務(wù)),抽樣調查的優(yōu)越性蕩然無(wú)存,學(xué)生乙選擇全面調查的理由和可行性都顯得十分充分,也讓教師與其他學(xué)生的思路得到了開(kāi)拓.
這里,教師的處理方式也值得肯定.全面調查與抽樣調查的方法選擇依賴(lài)于具體環(huán)境、具體背景,由于技術(shù)的使用不是學(xué)生自己能夠掌控的,因此在課堂學(xué)習的具體活動(dòng)中就必須具體問(wèn)題具體分析,教師用“假設在課堂上對全校學(xué)生的選擇情況作全面調查,就難以實(shí)施”把學(xué)生的學(xué)習導引到用抽樣調查的方法來(lái)收集數據、表示數據、估計總體、進(jìn)而解決問(wèn)題的思路上,較好地體現出教師對知識的理解與駕馭能力.
另外,有些情況下,全面調查的結論并不一定比抽樣調查的結論更真實(shí)反映總體的狀況與特征.由于任何調查都存在調查的誤差和偏誤問(wèn)題,因此,在總體中包含的個(gè)體數量非常大的情況下,使用全面調查得到的數據中存在的隨機誤差要比相應抽樣調查得到數據存在的隨機誤差大,而抽樣調查可以通過(guò)抽樣設計把系統誤差控制在允許的范圍內,因此,有時(shí)候也會(huì )出現抽樣調查的結果比全面調查的結果更能反映總體狀況的現象.這一點(diǎn),教師需要了解,但是不必在課堂上向學(xué)生講解.
二、對總體、個(gè)體、樣本、樣本容量的理解
統計學(xué)也是一門(mén)新興學(xué)科,它用特殊的詞或術(shù)語(yǔ)向他人傳遞特定的概念和信息,形成了特定的交流平臺.在使用抽樣調查方法解決問(wèn)題時(shí),就必須掌握與之相關(guān)的統計概念(如:總體、個(gè)體、樣本、樣本容量等),以方便溝通與交流.
【案例3】某中學(xué)共有2000名學(xué)生,現在想了解全校學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況,現隨機抽出100名學(xué)生進(jìn)行調查.請指明這個(gè)問(wèn)題的總體、個(gè)體、樣本與樣本容量.
教師引導學(xué)生回答并板書(shū):總體是“全校2000名學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況”;個(gè)體是“全校每個(gè)學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況”;樣本是“抽出的100名學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況”;樣本容量是100.
分析:統計研究的是一批數據的數值特征,研究對象是數據,通過(guò)數據特征來(lái)揭示數據代表的現象或事物.因此,在教學(xué)中,教師把“新聞、體育、動(dòng)畫(huà)、綜藝、電視劇”五類(lèi)電視節目喜愛(ài)情況用定類(lèi)尺度數據(如:用A、B、C、D、E分別代表新聞、體育、動(dòng)畫(huà)、綜藝、電視劇,統計學(xué)生選擇每類(lèi)的個(gè)數)表示,并引導學(xué)生理解總體、個(gè)體、樣本表示的都是數據,所有的推理都是基于數據之上,因此,出現了案例中的表述.
然而,統計語(yǔ)言也是用于交流與溝通的,如果每次都使用案例中給出的那種表述,那么師生關(guān)于這個(gè)問(wèn)題的交流就顯得非常繁瑣,溝通也很不便利,這也違背了語(yǔ)言表達的簡(jiǎn)潔性原則.
在這個(gè)問(wèn)題上,統計學(xué)達成了共識:當研究對象與對象的具體數字特征之間形成同構映射關(guān)系,即在明確研究對象的具體數字特征的前提下,我們往往從交流方便的角度把研究對象等同于研究對象的具體數字特征.例如,在本案例中調查的是“全校2000名學(xué)生對新聞、體育、動(dòng)畫(huà)、綜藝、電視劇五類(lèi)電視節目的喜愛(ài)情況”,那么總體、個(gè)體、樣本既可以說(shuō)成是相應的2000名學(xué)生、每個(gè)學(xué)生、抽出的100名學(xué)生,也可以說(shuō)成對應的他們對五類(lèi)電視節目的喜愛(ài)情況,因為所指的都是同一個(gè)含義.在實(shí)際教學(xué)中,建議用研究對象來(lái)表示總體、樣本等進(jìn)行交流,這樣簡(jiǎn)單、方便.
三、對樣本代表性的理解
在研究具體問(wèn)題時(shí),由于很多案例都無(wú)法直接研究總體(例如我們無(wú)法研究所有患癌癥的病人,也無(wú)法研究所有的中小學(xué)生,因為這些總體或者是潛在的,或者可以看成是無(wú)限多的),只能用樣本來(lái)概括總體,因此,我們往往假定,由樣本分析得到的結論可以正確地用于總體.
為了保證基于抽樣調查獲得的樣本數據所進(jìn)行的分析是有效且可靠的,需要對抽樣調查的方法進(jìn)行界定,如在抽取樣本時(shí),樣本必須具有代表性.在抽樣調查實(shí)踐中,人們常問(wèn):“這個(gè)樣本的代表性有多大?”,這里,既涉及到如何理解樣本代表性的問(wèn)題,也涉及到怎樣才能獲得對總體有代表性的樣本的問(wèn)題.
關(guān)于如何理解樣本代表性.判斷一個(gè)樣本是否具有代表性關(guān)鍵不在于樣本是否與總體具有相似的結構,而在于具體抽取這個(gè)樣本的過(guò)程是否能夠滿(mǎn)足隨機性,是否存在人為干擾.由于概率抽樣可以完全避免人為干擾,人們認為概率抽樣下抽得的樣本都具有良好的代表性,因此在抽樣調查中凡是運用概率抽樣抽得的樣本,不存在對它進(jìn)行代表性檢驗的問(wèn)題.
關(guān)于如何獲得對總體有代表性的樣本.初中統計主要學(xué)習簡(jiǎn)單隨機抽樣和分層抽樣兩種抽樣方法,這兩種抽樣都遵循概率的隨機性要求,因此,用這兩種方法均可獲得對總體有代表性的樣本.在教學(xué)中,應該把主要精力放在如何體現抽樣的隨機性,而不是如何體驗、感受樣本的代表性.
【案例4】某中學(xué)共有2000名學(xué)生,要想用抽樣調查的方法了解全校學(xué)生對新聞、體育、動(dòng)畫(huà)、娛樂(lè )、戲曲五類(lèi)電視節目的喜愛(ài)情況.
教學(xué)處理1:
教師:“請思考:(1)抽樣調查的流程是什么?(2)在調查流程中確定樣本容量很重要,請大家討論一下,調查多少名同學(xué)比較合適?你考慮了那些因素?(3)你有什么好的選取方法嗎? ”
學(xué)生1:抽樣調查時(shí),首先確定調查對象,再設計問(wèn)卷,收集數據,統計數據.
學(xué)生2:還需要知道樣本與樣本容量,才能抽取樣本.
學(xué)生3:統計完,還要描述數據.
教師:怎樣描述數據呢?
學(xué)生4:用統計圖表描述.
教師:學(xué)過(guò)哪些統計圖表?
學(xué)生5:學(xué)過(guò)的圖表有條形圖、扇形圖……
教師:調查多少名同學(xué)比較合適?
學(xué)生6:我選擇樣本容量為50.
學(xué)生7:我選擇調查200個(gè)學(xué)生,這樣每個(gè)被調查的學(xué)生大約代表10個(gè)學(xué)生的意見(jiàn).
學(xué)生8:因為學(xué)校的年級與班級數都是3或6的倍數,因此抽取的學(xué)生數應該是3或6的倍數,這樣比較好操作些.
教師:大家有什么好的選取方法?
學(xué)生9:應該每個(gè)年級都抽取一些.
學(xué)生10:應該每個(gè)班都抽取一些.
最后教師給出了已經(jīng)完成的統計表(略),然后引導學(xué)生體會(huì )、領(lǐng)悟抽樣調查中樣本估計總體的思想、隨機的思想等.
教學(xué)處理2:
教師:進(jìn)行抽樣調查前,首先要明確總體是什么,個(gè)體是什么,然后制定抽樣調查的方法.由于在課堂上對全校學(xué)生的選擇情況作調查比較困難.所以,用我們班56個(gè)同學(xué)作為總體,進(jìn)行模擬抽樣試驗.
請每個(gè)學(xué)生在相同的紙片上寫(xiě)好自己的學(xué)號、并折疊好,然后派兩個(gè)學(xué)生把全班學(xué)生的學(xué)號紙收集放在一個(gè)透明的瓶子里.為了保證每個(gè)學(xué)生的學(xué)號都有相等的機會(huì )被抽中,當著(zhù)全班學(xué)生的面把瓶中所有紙片攪拌均勻.
教師:下面請學(xué)生A負責攪勻,學(xué)生B負責抽簽.抽出哪位同學(xué)的學(xué)號,哪位同學(xué)就回答問(wèn)題,同時(shí),大家用記正字法把有關(guān)回答填在表格中進(jìn)行統計.
(1)用學(xué)號隨機抽5人進(jìn)行調查;(2)用學(xué)號隨機抽20人進(jìn)行調查.
然后,教師運用EXCEL軟件,把學(xué)生的統計結果填在表中,同時(shí)展現條形圖與扇形圖,并把兩組數據與上一節課全面調查得出的數據進(jìn)行對比.學(xué)生經(jīng)歷數據的收集、整理、表示的全過(guò)程,并體驗隨著(zhù)樣本容量的增大,樣本越來(lái)越接近總體.
分析:案例4中的教學(xué)處理1體現出先整體、后具體的設計思路,教師首先引導學(xué)生分析實(shí)施抽樣調查的完整過(guò)程包括哪些步驟與要素,然后給出一個(gè)具體的調查結果,讓學(xué)生來(lái)加以對比與驗證.但是,學(xué)生的討論中涉及的確定樣本容量問(wèn)題、選擇適當抽樣方法問(wèn)題,教師在本節課都難以展開(kāi)論述、難以給予學(xué)生合適的解釋?zhuān)瑢е滤季S發(fā)散后,缺少歸納與總結,學(xué)生的思維沒(méi)有得到有效提升.另外,由于抽樣的結果是直接呈現的,因此簡(jiǎn)單隨機抽樣中樣本抽取的隨機性此處沒(méi)有得到有效體現.
在教學(xué)處理2中,教師直接點(diǎn)明,開(kāi)展抽樣調查首先需要明確總體與個(gè)體.然后,教師組織開(kāi)展抽樣調查的具體活動(dòng):既有總體中每個(gè)個(gè)體的編號(每個(gè)學(xué)生寫(xiě)自己的學(xué)號),又有抽樣的隨機性保證(學(xué)生A負責攪勻),還有抽樣樣本容量的確定(教師先要求抽取5個(gè)學(xué)號,然后又抽取20個(gè)學(xué)號),并要求每個(gè)學(xué)生記錄調查數據,最后用EXCEL軟件實(shí)現統計圖表表示數據的便捷性和直觀(guān)性,并引導學(xué)生體驗“隨著(zhù)樣本容量的增大,樣本越來(lái)越接近總體”(接近的方式有多種,可能是單向的,也可能在擺動(dòng)中接近).教學(xué)處理2讓學(xué)生親身經(jīng)歷了統計活動(dòng)的基本過(guò)程,在收集、整理、描述和分析數據的統計活動(dòng)中,體驗抽樣的具體步驟,感受樣本抽取的隨機性以及如何用樣本抽取的隨機性來(lái)保證樣本的代表性,逐步學(xué)會(huì )如何用數據說(shuō)話(huà).
四、關(guān)于樣本容量適當性的確定
抽樣調查是以少量的樣本數據信息推斷大量的總體數量特征,因此必然存在著(zhù)誤差問(wèn)題.抽樣調查的數據存在著(zhù)誤差是絕對的,而誤差的大小是相對的,其相對性取決于研究的問(wèn)題和需要的決策.因此,在抽樣方案設計時(shí),需要確定樣本的抽樣誤差應滿(mǎn)足的條件(樣本值與總體真值間的誤差范圍,即確定置信區間).置信區間越小,數據精度越高,則樣本容量的需求量就越大,調查費用就越高;置信區間越大,數據精度越低,則用樣本數據估計總體的誤差就越大,可能數據不能采用,也會(huì )造成數據資源的浪費.
在具體操作時(shí),除了受置信區間精確度的影響外,樣本容量的確定還受到另外三個(gè)方面因素的制約.一是總體的規模.一般情況下,總體規模越大,往往需要抽取的樣本容量也越大.二是總體的異質(zhì)性程度.在異質(zhì)性程度高的總體中抽取的樣本容量要大些,而在同質(zhì)性程度高的總體中要達到同樣的精度,所需要的樣本容量要小些.三是研究者所擁有的精力、經(jīng)費和時(shí)間.樣本容量越大,需要投入的精力、經(jīng)費和時(shí)間越多,意味著(zhù)調查可能受到更多更大的限制,因此需要量力而行.
在初中統計教學(xué)中,只需要結合具體事例,讓學(xué)生感知“總體規模、總體異質(zhì)性程度、研究經(jīng)費等背景要求”等方面的因素對樣本容量確定的影響即可,同時(shí),學(xué)生需要知道“隨著(zhù)樣本容量的增大,樣本的估計值越來(lái)越接近總體真值”.至于置信區間的問(wèn)題,則無(wú)需向學(xué)生提及,而且這也超出了初中生學(xué)習的能力要求.
參考文獻
[1] 許世紅、張崇歧,對初中統計概念與思想方法的認識與教學(xué)處理,中國數學(xué)教育(初中版),2009年第7期(?需要落實(shí)).
[2] 張唯一,總體和個(gè)體,中國數學(xué)教育(初中版),2008年第10期.
[3] 林群主編,義務(wù)教育課程標準實(shí)驗教科書(shū)數學(xué)(七年級下冊),人民教育出版社2007年10月版.
[4] 馬德峰,抽樣調查面臨的困境思考,調研世界,2006年第5期.
[5] 俞純權,關(guān)于樣本代表性的理解,江蘇統計,2000年第10期.
聯(lián)系客服