“資料分析觀念”的內涵及教學建議

來源:果殼範文吧 2.73W

“資料分析觀念”的內涵及教學建議數學教育熱點問題系列訪談錄

“資料分析觀念”的內涵及教學建議

摘要:統計是資料分析的科學和藝術,統計課程的核心是發展學生的資料分析觀念。準確把握資料分析觀念的內涵是進行統計課程設計、教科書編寫和教學實施的必要前提和重要基礎。體會資料中蘊涵著資訊、認識到需要根據問題的背景選擇合適的方法、通過資料分析體驗隨機性是資料分析觀念的重要方面。義務教育階段統計教學關鍵是使學生想到用資料,願意“親近”資料,能從資料中提取資訊。

關鍵詞:資料分析觀念;教學建議

我國在基礎教育階段將統計作為重要的學習內容,隨著大家對統計教學的不斷探索和實踐,人們逐漸認識到對於統計學習而言,重要的不是畫統計圖、求平均數等技能的學習,而是發展學生的資料分析觀念。那麼,資料分析觀念到底體現在哪些方面呢?如何設計課程和實施教學,才能更好地發展學生的資料分析觀念呢?本文訪談了東北師範大學著名統計學家史寧中教授,並輔助於資料查詢等形式就這些問題提出了一些思考。

一、發展學生的資料分析觀念

問:您在多種場合不斷強調,無論哪一部分內容的學習,都應該抓住這部分的核心內容,那麼統計學習的核心內容是什麼呢?

▲史教授:首先必須明確的是,我們希望在課程中給出一些關鍵詞。關鍵詞是某部分學習的核心內容。核心內容不是指具體的知識點,甚至不是指具體的知識本身,而是概括很多知識的共性所反映出來的思想和思維方式,這個就叫做核心詞,或者叫做核心內容。統計最核心的就是資料分析,統計是處理資料的一門科學和藝術。在這部分內容中,我們提出了資料分析觀念的核心詞,就跟代數學習裡的數感、符號意識、模型等都是核心內容。

▲問:統計的核心是資料分析,那麼到底是什麼是資料呢,資料與數有什麼關係呢?

▲史教授:我們在義務教育階段處理的資料主要是用數來表達的,當然這些數都是有實際背景的。脫離實際問題的單純地數的研究是數與代數的內容,不是統計的內容。但是,這些年隨著資訊的迅速增長,我們需要擴大對資料的認識。事實上,現在的資料不僅僅是數,圖是資料、語句也是資料。比如,人們在網上經常用GOOGLE來進行檢索,GOOGLE是用統計的方法來進行語句檢索,此時統計處理的是語句,我們把這些都叫做資料。

▲問:能不能這樣理解,只要蘊含著一定資訊,無論是什麼表現形式,就是資料,統計能幫助人們從這些資料中提取出大量的資訊?

▲史教授:是這樣的。人們在實際生活和各行各業中面臨的資料越來越多,必須樹立利用資料的意識,掌握一些分析資料的方法和模型。所以,資料分析觀念是非常重要的。資料分析觀念主要體現在三個方面:第一,瞭解在現實生活中有許多問題應當先做調查研究,收集資料,通過分析做出判斷,體會資料中是蘊涵著資訊的。第二,瞭解對於同樣的資料可以有多種分析的方法,需要根據問題的背景選擇合適的方法。第三,通過資料分析體驗隨機性。

二、資料隨機性的內涵和教學

(一)數學隨機性的內涵

問:對於很多人而言,對第三點“通過資料分析體驗隨機性”都比較陌生。首先遇到的一個困難是,資料隨機性的涵義是什麼呢?

▲史教授:簡單而言,資料的隨機主要有兩層涵義:一方面對於同樣的事情每次收集到的資料可能會是不同的;另一方面只要有足夠的資料就可能從中發現規律。舉一個例子,袋中裝有若干個紅球和白球,一方面,每次摸出的球的顏色可能是不一樣的,事先無法確定;另一方面,有放回重複摸多次(摸完後將球放回袋中,搖晃均勻後再摸),從摸到的球的顏色的資料中就能發現一些規律,比如紅球多還是白球多、紅球和白球的比例等。

問:那麼,構成資料隨機性的原因主要有哪些呢?

▲史教授:一般來說,產生隨機有兩方面的原因。

一方面,是運用部分來推斷總體,我們知道這是統計的一個基本思想。這裡首先假設每一次實驗取得的資料是來源於一個總體的,這是很重要的一個假設。比如上面提到的摸球例子,第一需要假設摸的是同一個袋子裡的球,而且是有放回的摸;第二,摸之前需要晃一晃,搖晃均勻了。為什麼要強調這些呢,就是要保證每一次要處理的事情都是一樣的,資料是來源於一個總體的。有了這個假設後就去做重複實驗,每一次在摸之前,你不可能知道這次摸的是什麼結果,但是摸的次數多了,就能估計出來摸到各種結果的可能性是多大,由此推斷總體的情況。比如在上面的例子中,可以推斷袋子中什麼顏色的球多,各種顏色球的比例,如果知道了袋中球的總數,我們還可以推斷出各種球的數量。但是,由於是用部分來推斷總體,就不能擔保推斷一定是準確無誤的,而是允許結論可能出錯。好的統計方法的主要標誌就是出錯的可能性較小。

另一方面,是重複測量中的誤差。對一些資料,特別是連續型資料總是有測量誤差的,而產生誤差的原因是多方面的。比如多次測量同一人的身高,由於測量工具、觀察者的角度、測量時間等各種各樣的原因,每次測量的結果可能都是不一樣的,測量資料是隨機的。但是如果出現隨機誤差的平均是零,也就是有時候比真實結果大一點,有時候比真實結果小一點,平均下來零,這個時候就能研究了,如何進行研究這裡就不細談了。主要是以上兩方面原因構成了我們研究問題的隨機性。

(二)資料隨機性的教學

問:說到這裡,我感覺您非常強調運用統計(資料分析)來幫助學生體會隨機。不少老師有這樣的一個困惑,概率也是研究隨機現象的,在概率中教師也組織學生做了很多摸球、擲硬幣等遊戲。那麼為什麼又提出資料的隨機性呢?

▲史教授:我聽了一些課,老師們經常這樣處理:比如對於擲一枚均勻的.硬幣,先得到出現正面或反面的概率是二分之一,然後讓學生通過反覆擲硬幣去驗證這個結果(二分之一)。這裡有兩個問題。第一,一個硬幣,先假定它出現正面和反面的可能性是二分之一,這是數學(或者稱為概率)。這個二分之一是通過概率的定義得到的,不是依靠擲硬幣驗證出來的。實際上,學生做了很多次實驗也得不到二分之一,反而更加糊塗了。第二,運用定義的方式教學隨機,不能很好的培養學生的隨機觀念。

需要指出的是,我們贊成做實驗,贊成運用統計的思想來做實驗。統計是通過資料來獲取一些資訊,來幫助人們做出一些判斷。同樣是擲硬幣的問題,在統計上就會這樣設計實驗:先讓學生多次擲硬幣,計算出現正面的比例(頻率),然後用頻率來估計一下出現正面的可能性是多大。如果這個可能性接近二分之一的話,就推斷這個硬幣大概是均勻的,這是統計的思想。

對於先給出定義,教師往往比較習慣,而對於“逆過來”通過資料來進行推斷,教師往往比較陌生。為了幫助大家理解,再闡述一下上面的摸球的例子。同樣是一個袋子裡有5個球,4個白球、1個紅球,如果讓學生通過摸來驗證出現白球的可能性是五分之四、出現紅球的可能性是五分之一,這不是統計。統計是這樣的,告訴學生們袋子裡有很多球,有白顏色的和紅顏色的。讓孩子們去摸,摸到一定程度的時候,學生髮現摸出白球的次數比紅球的次數多,由此推斷袋子裡白球可能比紅球多。進一步的話,能推斷出白球和紅球的比例大概是多少。再告訴球的總數的時候,能夠估計出來幾個白球和幾個紅球,這個是統計的過程。

我並不是反對前一種教法本身,而是說如果這麼教,蘊含的隨機思想並不強,學生也不感興趣,都知道了概率為什麼還要做實驗。而後來的這種教法,學生體會到每一次摸的結果事先都不知道,但是摸多了能夠幫助我們做一些判斷。這樣一來,學生既體會了隨機,又感受到了資料中蘊含著資訊,我想這種類似於“猜謎”的活動學生也會很有興趣。

問:實際上,並不是簡單地贊成或反對做實驗,而是做實驗的目的。不是通過實驗去驗證概率是多少,而是通過實驗從資料中獲取資訊,對總體做一些推斷。說到做推斷,老師們還有一個困惑,因為資料是隨機的,用部分的資料進行估計有時可能會估計得準一些,有時會偏差很大。那麼這種推斷是不是有點“瞎猜”的味道,能不能保證這種估計是合理的。

▲史教授:這裡絕不是“瞎猜”。還是上面摸球的例子(袋子裡有5個球,4個白球,1個紅球),我們知道如果真是隨機摸球的話,那麼出現白球的概率是五分之四。而實驗中,要使摸球的頻率剛好是 五分之四(十分之八)的可能性並不大。但是如果取一個範圍,比如在十分之七和十分之九之間,此時頻率落在這個範圍內,用它去進行估計是可以接受的。如果要使摸出白球的頻率落在這個範圍之間的可能性達到80%的話,通過計算只要做27次左右的實驗;如果要使95%的可能性落在這個範圍內的話,摸球的次數要增加,大概是60次左右。所以,實際上有相當多的科學依據在後邊支撐著我們做類似摸球的試驗。也就是雖然不能保證估計得完全一致,但能保證在一定實驗次數下,估計值與實際情況相差不大的可能性是很大的。

問:聽了您的解釋挺有啟發的。是不是雖然不能達到100%的精確,但無論實際情況需要多高的精確度,都可以計算出需要做多少次實驗來保證達到這個精確度?

▲史教授:是這樣的。因此,我們可以提供一些資料,如果想達到95%的可能性,你至少要摸多少次球。再比如社會上通過打電話做民意調查,不可能給所有擁有電話的人都打,如果調查允許在一定的誤差範圍內,通過計算可以提供至少需要打電話的數量。當然計算中需要概率的知識,從這些例子中我們也能看到統計與概率的聯絡。

問:通過上面的兩種教法和您的分析,我們可以感覺到概率是定義出來的,它的推理方式是主要是演繹;而統計是用資料來進行推斷,它的推理方式主要是歸納。兩種思維方式是不一樣的。

▲史教授:是這樣的。統計體現了與傳統數學不一樣的思路,而這種思路是培養學生歸納能力的最好方法之一。在義務教育階段,也有一些素材可以讓學生經歷歸納的過程,比如歸納一些公式和規律,但這些公式和規律往往都是準備好了的。很難找到讓學生真正通過歸納自己得到結論的素材,但是通過統計可以讓學生做一些,所以說,運用

熱門標籤