新課程改革實(shí)施以來,各地中考數(shù)學(xué)試題中有關(guān)統(tǒng)計知識的試題,問題情景琳瑯滿目,內(nèi)容豐富多變,題型不斷翻新,無論是教師教還是學(xué)習(xí)統(tǒng)計知識,均感“形散”難以把握統(tǒng)計知識的“靈魂”。 新課程標(biāo)準(zhǔn)要求學(xué)生掌握初步的統(tǒng)計知識。統(tǒng)計知識教學(xué)的“靈魂”是什么呢?統(tǒng)計知識教學(xué)的“靈魂”是用樣本估計總體。 一、用樣本估計總體的基本思想、合理性與關(guān)鍵 1、用樣本估計總體的基本思想 用樣本估計總體是指根據(jù)樣本情況對總體情況做出一種推斷,包括用“形”與用“數(shù)”兩個方面來估計。用“形”估計就是用樣本數(shù)據(jù),列出頻數(shù)(頻率)分布表,畫出頻數(shù)分布直方圖、頻率分布直方圖和頻數(shù)(率)折線圖,這“一表三圖”是同一組數(shù)據(jù)分布的不同表現(xiàn)形式;用“數(shù)”估計就是用樣本數(shù)據(jù)的特征數(shù)字來估計總體的特征數(shù)字,最常用的特征數(shù)字是平均數(shù)、中位數(shù)、眾數(shù)、方差(標(biāo)準(zhǔn)差)。平均數(shù)表示一組數(shù)據(jù)的平均水平,中位數(shù)表示一組數(shù)據(jù)的中等水平,眾數(shù)表示一組數(shù)據(jù)的多數(shù)水平。借助平均數(shù)、中位數(shù)、眾數(shù)、方差(標(biāo)準(zhǔn)差)來估計一組數(shù)據(jù)的平均水平、中等水平、多數(shù)水平和估計一組數(shù)據(jù)離散性、波動性、穩(wěn)定性。這就是用樣本估計總體基本思想,它是研究數(shù)理統(tǒng)計問題的一個核心思想。 2、用樣本估計總體的合理性 樣本的信息與總體的信息總還存在著一定的差異,樣本所提供的信息只是總體的部分信息,在一定程度上反映了總體的有關(guān)特征,但不完全確定。也就是說,即使按照同一個規(guī)則進(jìn)行抽樣,抽取的樣本容量相同,也不能保證每次抽樣所獲取的信息都是完全一樣的。雖然不同的人根據(jù)不同的樣本數(shù)據(jù),最后得到的結(jié)果互不相同,但是由于隨機(jī)事件頻率具有規(guī)律性、穩(wěn)定性,故許多問題的最終結(jié)果差別一般也不會太大,因此可以用樣本的特性來估計總體的特性,即用樣本估計總體具有合理性,通過對表面隨機(jī)的樣本數(shù)據(jù)進(jìn)行統(tǒng)計分析,實(shí)現(xiàn)對隨機(jī)性事件的規(guī)律性的研究,從而揭示出事物內(nèi)在的規(guī)律。 3、用樣本估計總體的關(guān)鍵 根據(jù)具體問題,合理選取樣本是統(tǒng)計決策的一個基本前提。只有合理地選取樣本,才能對決策提供可靠的依據(jù)。怎樣的方法才是既科學(xué)、合理又可靠的呢?隨機(jī)抽樣調(diào)查的方法是既科學(xué)、合理而又可靠的。抽樣是手段,是前提,對總體進(jìn)行估計是目的,是結(jié)果。抽樣時所抽取的樣本容量越大,樣本的特性就越接近于總體的特性,用樣本估計總體就越接近真實(shí),越有意義。用隨機(jī)抽樣方法,確定合適的樣本容量進(jìn)行抽樣調(diào)查,用樣本的特征數(shù)字估計總體的特征數(shù)字,用樣本的分布規(guī)律來估計總體的分布規(guī)律,是用樣本估計總體的關(guān)鍵。 二、用樣本估計總體的適用范圍及方法舉例 (一)、估計平均水平、中等水平、多數(shù)水平 平均數(shù)、中位數(shù)、眾數(shù)是反映數(shù)據(jù)集中程度的統(tǒng)計量。在利用平均數(shù)、中位數(shù)、眾數(shù)參與決策時,如果依據(jù)不同,結(jié)果可能也不同,而且三個統(tǒng)計量不總是合適的,它們都有各自的適用范圍,在解決實(shí)際問題時應(yīng)合理選用平均數(shù)、中位數(shù)和眾數(shù)解決問題,用樣本平均數(shù)、樣本中位數(shù)和樣本眾數(shù),來估計總體平均數(shù)、總體中位數(shù)和總體眾數(shù),參與決策。 1、用樣本平均數(shù)估計總體平均數(shù) 例1:重慶市是一座美麗的城市,為增強(qiáng)市民的環(huán)保意識,某校家住縉云花園小區(qū)的30名九年級學(xué)生調(diào)查了某一天各自家庭丟棄廢塑料袋的情況,統(tǒng)計結(jié)果如下:
根據(jù)以上數(shù)據(jù),若縉云花園小區(qū)有500戶居民,則該小區(qū)所有家庭每天丟棄的廢塑料袋總數(shù)約為____萬個. 解:小區(qū)30戶居民平均每戶每天丟棄的廢塑料袋的只數(shù),即樣本平均數(shù) ,估計小區(qū)500戶居民平均每戶每天丟棄的廢塑料袋的只數(shù)的平均數(shù) ,則小區(qū)所有家庭每天丟棄的廢塑料袋總數(shù)約為: 只,即0.15萬個。 2、用樣本中位數(shù)估計總體中位數(shù) 例2:在一次馬拉松長跑比賽中,抽得12名選手得成績?nèi)缦?單位:分) 136,140,129,180,124,154,146,145,158,175,165,148 假如你的成績是142分,你的成績?nèi)绾危?/div> 解:對樣本數(shù)排序:124,129,136,140,145,146,148,154,158,165,175,180 則中位數(shù)為147,估計總體中位數(shù)也是147分,故若我的成績是142分,則處于馬拉松長跑比賽中所有參賽者的成績的中等偏下水平。 3、用樣本眾數(shù)估計總體眾數(shù) 例3:一家鞋店在一段時間內(nèi)銷售了某種運(yùn)動鞋30雙,各種尺碼的鞋的銷售量如下:
假如你是老板,你最關(guān)心哪一個統(tǒng)計量?你會如何進(jìn)貨? 解:樣本眾數(shù)是23.5,在眾數(shù)兩側(cè)與眾數(shù)最近的兩數(shù)是23、24,假如我是老板,我最關(guān)心眾數(shù)23.5,若把一次進(jìn)貨數(shù)量x視作一個總體,則在進(jìn)貨時,可用樣本眾數(shù)當(dāng)作總體眾數(shù),尺碼23.5厘米鞋進(jìn)貨數(shù)量約為 雙,尺碼23厘米鞋進(jìn)貨量約為 雙,尺碼24厘米鞋進(jìn)貨量約為 雙,其余類推計算確定。 (二)、估計頻數(shù)分布或頻率分布 用隨機(jī)抽樣方法,選取樣本容量合適的數(shù)據(jù),制作頻數(shù)分布表(頻率分布表)、頻數(shù)分布直方圖(頻率分布直方圖)或頻數(shù)(率)分布折線圖等“一表三圖”,來描述樣本的頻數(shù)分布或頻率分布情況,從而估計總體的頻數(shù)分布(頻率分布)情況。 4、用樣本頻數(shù)分布估計總體頻數(shù)分布 例4:2009年中考結(jié)束后,某市從參加中考的12000名學(xué)生中抽取200名學(xué)生的數(shù)學(xué)成績(考生得分均為整數(shù),滿分120分)進(jìn)行統(tǒng)計,評估數(shù)學(xué)考試情況,經(jīng)過整理得到如下頻數(shù)分布直方圖, 請回答下列問題: (1)此次抽樣調(diào)查的樣本容量是_____ (2)補(bǔ)全頻數(shù)分布直方圖 (3)若成績在72分以上(含72分)為及格, 請你評估該市考生數(shù)學(xué)成績的及格率與數(shù)學(xué)考試及格人數(shù)。 解:(1)此次抽樣調(diào)查的樣本容量是200。 (2)由樣本容量和樣本頻數(shù)分布直方圖可知,樣本中 分?jǐn)?shù)在84~95分之間的直方圖高度是40,即有40人。 (3)由樣本頻數(shù)分布直方圖知,樣本中及格人數(shù)是 樣本及格率是 =0.71,即71﹪,估計總體及格率也是71﹪,故該市考生數(shù)學(xué)成績的及格率為71﹪,數(shù)學(xué)考試及格人數(shù)為12000×71﹪=8520(人)。 頻數(shù)分布直方圖的特點(diǎn):①能夠顯示各組頻數(shù)的分布情況。②易于顯示各組間的頻數(shù)的差別。③各小長方形的高與該組的頻數(shù)成正比。④各組頻數(shù)之和等于樣本容量。 5、用樣本頻率分布估計總體頻率分布 例5:某鋼鐵加工廠生產(chǎn)內(nèi)徑為25.40mm的鋼管,為了掌握產(chǎn)品的生產(chǎn)狀況,需要定期對產(chǎn)品進(jìn)行檢測。又由于產(chǎn)品的數(shù)量巨大,不可能一一檢測所有的鋼管,因而通常采用隨機(jī)抽樣的辦法。如果把這些鋼管的內(nèi)徑看成總體,我們可以從中隨機(jī)抽取的100件鋼管進(jìn)行檢測,把這100件鋼管的質(zhì)量分布情況作為總體的質(zhì)量分布情況來看待。根據(jù)規(guī)定,鋼管內(nèi)徑的尺寸在區(qū)間25.325~25.475內(nèi)為優(yōu)等品,我們特別希望知道所有生產(chǎn)的鋼管中優(yōu)等品所占的比例,這時就可以用樣本的分布情況估計總體的分布情況。 下面的數(shù)據(jù)是一次抽樣中的100件鋼管的內(nèi)徑尺寸:
解:上面的100個數(shù)據(jù)有點(diǎn)散亂,從中很難看出產(chǎn)品質(zhì)量的分布情況,必須對樣本數(shù)據(jù)加以整理。列出這組樣本數(shù)據(jù)的頻率分布表、繪制頻率分布直方圖。
結(jié)論:從樣本頻率分布表或頻率分布直方圖容易看出,優(yōu)等品所占的比例等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估計出所有生產(chǎn)的鋼管中有84%的優(yōu)等品。 頻率分布直方圖的特點(diǎn):①小長方形的面積=組距×頻率/組距=頻率。②各小長方形的面積等于相應(yīng)各組的頻率, 即各個長方形面積的大小反映該組數(shù)據(jù)出現(xiàn)的頻率的大小。③各組的頻率之和等于1,故各小長方形的面積之和等于1。 (三)、估計離散程度、波動性或穩(wěn)定性 方差或標(biāo)準(zhǔn)差是反映一組數(shù)據(jù)的離散程度的統(tǒng)計量。用隨機(jī)抽樣方法,取得樣本數(shù)據(jù),通過計算樣本方差或標(biāo)準(zhǔn)差,來估計總體方差或標(biāo)準(zhǔn)差,進(jìn)而估計總體的離散程度、波動性或穩(wěn)定性。 6、用樣本方差(標(biāo)準(zhǔn)差)估計總體方差(標(biāo)準(zhǔn)差) 例6:甲、乙、丙三臺機(jī)床生產(chǎn)直徑為60mm的螺絲,為了檢驗(yàn)產(chǎn)品質(zhì)量,從三臺機(jī)床生產(chǎn)的螺絲中各抽查了20個測量其直徑,進(jìn)行數(shù)據(jù)處理后,發(fā)現(xiàn)這三組數(shù)據(jù)的平均數(shù)都是60mm,它們的方差依次為 =0.162, =0.058, =0.149.根據(jù)以上提供的信息,你認(rèn)為生產(chǎn)螺絲質(zhì)量最好的是____機(jī)床. 解:方差表示一組數(shù)據(jù)的穩(wěn)定性程度,方差越小,一組數(shù)據(jù)的穩(wěn)定性越好。從甲、乙、丙三臺機(jī)床生產(chǎn)的零件中,每臺機(jī)床分別抽查的20個零件的直徑分別是三個樣本,甲、乙、丙三臺機(jī)床每臺機(jī)床生產(chǎn)的全部零件的直徑分別是三個總體。本題有三個樣本方差 、 、 ,三個總體方差。∵ =0.162, =0.058, =0.149,∴ < < ,表明機(jī)床乙生產(chǎn)的零件的樣本方差最小,零件質(zhì)量穩(wěn)定性最好。由此推斷機(jī)床乙生產(chǎn)的全部零件質(zhì)量(總體)穩(wěn)定性最好。 (四)、估計概率 用隨機(jī)抽樣方法,統(tǒng)計樣本頻率估計總體頻率,進(jìn)而用總體頻率來估計總體的概率。 7、用樣本頻率估計總體頻率(概率) 例7:某養(yǎng)魚場為了要估計魚塘中魚的總數(shù)量,第一次從中網(wǎng)出100條,把這100條帶有標(biāo)志后全部放回.過1~2天,估計這群帶標(biāo)志的魚已完全混雜到塘中,再從中網(wǎng)出200條,假定在第二次網(wǎng)出的200條中,帶有第一次做標(biāo)志的20條,估計魚塘中有魚多少條? 解:設(shè)魚塘中魚的總數(shù)量是x條,帶標(biāo)志的魚的數(shù)量是100條,總體頻率是 ,樣本是200條,樣本中帶標(biāo)志的魚的數(shù)量是20條,樣本頻率是 ,用樣本估計總體,得方程式: 解方程得,x=1000(條) 答:估計魚塘中有魚1000條。 例8:某水果公司以 元/千克的成本新進(jìn)了10000千克的柑橘,如果公司希望這種柑橘能夠獲得利潤5000元,那么在出售柑橘(已經(jīng)去掉損壞的柑橘)時,每千克大約定價為多少元比較合適? 銷售人員首先從所有的柑橘總隨機(jī)地抽取若干柑橘,進(jìn)行了“柑橘損壞表”統(tǒng)計,并把獲得的數(shù)據(jù)記錄在下表中,請你幫忙完成下表。
解:填表:
填完表格,計算出10個樣本頻率的平均數(shù) ,估計柑橘損壞的頻率為 ,則柑橘完好的頻率為 ,因此柑橘完好的概率為 ,因此:在10000千克柑橘中完好柑橘的質(zhì)量為 千克。完好柑橘的實(shí)際成本為: (元/千克) 因此,出售柑橘時每千克大約定價為2.8元可獲利潤5000元。 結(jié)論:一次抽樣得到一個樣本頻率,可用這個樣本頻率估計總體頻率;多次抽樣得到多個樣本頻率,可用這多個樣本頻率的平均值估計總體頻率,后者比前者更接近實(shí)際。 曹玉平 (江蘇省海門市三星初級中學(xué) 226114) 中國教育學(xué)會中學(xué)數(shù)學(xué)教學(xué)專業(yè)委員會2等獎 |
|