心理測量的幾個基本概念
來 源:網(wǎng)絡(luò)發(fā)表日期:2012-04-13
心理測量是一門科學(xué)。它有自己的一套嚴(yán)謹(jǐn)、系統(tǒng)和科學(xué)的研究方法。心理測量(psychological measurement)是通過科學(xué)、客觀、標(biāo)準(zhǔn)的測量手段對人的特定素質(zhì)進(jìn)行測量、分析、評價。這里的所謂素質(zhì),是指那些完成特定工作或活動所需要或與之相關(guān)的感知、技能、能力、性格、興趣、動機(jī)等個人特征,它們是以一定的質(zhì)量和速度完成工作或活動的必要基礎(chǔ)。而心理測驗(yàn)(psychological test)是心理測量的一種具體方法和手段,它是結(jié)合行為科學(xué)和數(shù)學(xué)方法,對某一特定個體在特定素質(zhì)上相對于特定群體所處的水平,進(jìn)行測量的一種手段。
為了使大家能夠在較短的時間內(nèi)對心理測量這門科學(xué)有一個大概的了解,這里我們來介紹一下心理測量中的幾個最基本的重要概念。
信度
心理測量中所指的信度主要是指測量結(jié)果的可靠性或一致性。信度中比較常用的是重測信度,重測信度是指,用同一測驗(yàn),在不同時間對同一群體施測兩次,這兩次測驗(yàn)分?jǐn)?shù)的一致性(通常用相關(guān)系數(shù)來表示)。重測信度是衡量一個測驗(yàn)的結(jié)果是否可靠的標(biāo)準(zhǔn)之一。比如,我們選用A測驗(yàn)測查某一名被試的智商,第一次結(jié)果智商是100,而一個星期以后,我們用同樣的測驗(yàn)對他進(jìn)行第二次測驗(yàn),結(jié)果發(fā)現(xiàn)他的智商變成了140。若沒有極特殊的原因,一個人的智商是不可能在一周之內(nèi)發(fā)生如此大的變化的,由于兩次測量結(jié)果很不一致,我們就很難下結(jié)論說這名被試的智商究竟是多少。所以,在一般情況下,我們會認(rèn)為這個測驗(yàn)的重測信度很低,是不可信的。
信度是衡量任何測驗(yàn)質(zhì)量的基本指標(biāo),一個測驗(yàn)的信度較高,則說明它的分?jǐn)?shù)是穩(wěn)定的、一致的,它的測量結(jié)果是可靠的。那么,信度多高才算合適呢?一般來說,當(dāng)信度大于0.7時,可以將測驗(yàn)結(jié)果進(jìn)行不同團(tuán)體間的比較;當(dāng)信度大于0.85時,測驗(yàn)結(jié)果才能應(yīng)用于個人之間的比較和評價,總得來說信度是越高越好。
效度
一個測驗(yàn)光有信度還不夠,測驗(yàn)分?jǐn)?shù)是穩(wěn)定的,并不能說明它就能夠準(zhǔn)確的測量想要測的特質(zhì)。比如一臺磅秤,長期使用,彈簧早已疲勞,一個100斤的人站上去,顯示的卻是110斤,一天稱10次,顯示的都是110斤,“信度”足夠好,但測得卻并一點(diǎn)都不準(zhǔn)。由此,效度的概念應(yīng)運(yùn)而生。
通俗的說,測量的效度就是指測量的有效性。一個測驗(yàn)的效度越高,表明它所測得的結(jié)果就越能代表欲測特質(zhì)的真正水平。比如,一個智力測驗(yàn)的效度比較高,我們就可以認(rèn)為由這個測驗(yàn)得出的分?jǐn)?shù)可以比較準(zhǔn)確的反映出完成測驗(yàn)的人的真實(shí)的智力水平。
舉例來說,在人才招聘和選拔等管理實(shí)踐中,我們使用心理測驗(yàn)的目的是希望它能預(yù)測被試將來的一些重要的外在行為(如工作業(yè)績),也就是說,我們關(guān)心的是:應(yīng)聘者在心理測驗(yàn)中的得分能否有效的預(yù)測他在將來工作中的表現(xiàn),高分者是否一定將來表現(xiàn)優(yōu)異,低分者是否一定就表現(xiàn)糟糕,這就需要測驗(yàn)具有較高的效度。
效度的種類有很多,有效標(biāo)效度、內(nèi)容效度、構(gòu)想效度等等,限于篇幅,這里不一一介紹,感興趣的讀者可以查閱心理測量學(xué)的專業(yè)書籍。
測驗(yàn)的標(biāo)準(zhǔn)化
一個人在心理測驗(yàn)中的表現(xiàn),不僅決定于自身固有的素質(zhì),有時還會受到許多與測驗(yàn)無關(guān)的因素的影響。比如考場環(huán)境、主考官的指導(dǎo)語、評分者的水平等等。為了使測驗(yàn)的結(jié)果更加準(zhǔn)確、可靠,減少誤差,我們就要在測驗(yàn)實(shí)施的過程中盡量控制無關(guān)因素對測驗(yàn)的影響,使測驗(yàn)分?jǐn)?shù)能夠真正反映一個人真實(shí)的能力水平。這個控制的過程,稱作標(biāo)準(zhǔn)化。測驗(yàn)的標(biāo)準(zhǔn)化包括以下幾個方面:
內(nèi)容標(biāo)準(zhǔn)化:即對所有被試施測相同的題目。測驗(yàn)的內(nèi)容不同,所得的測驗(yàn)分?jǐn)?shù)是無法相互比較的。
施測過程標(biāo)準(zhǔn)化:首先,無論在何時何地給何人施測,主考官宣讀的測驗(yàn)指導(dǎo)語必須完全一致。第二,測驗(yàn)的時間要統(tǒng)一、嚴(yán)格控制,這一點(diǎn)對能力測驗(yàn)尤為重要。在本章稍后給出的案例中,對施測過程的標(biāo)準(zhǔn)化將有更加具體、詳細(xì)的介紹。
評分標(biāo)準(zhǔn)化:即客觀評分。對于那些需要主觀評分的測驗(yàn),要求至少有兩個以上受過專業(yè)訓(xùn)練的評分者同時評分,而且他們的分?jǐn)?shù)必須具有一致性。
常模:一個標(biāo)準(zhǔn)化的測驗(yàn),不但內(nèi)容、施測和評分要標(biāo)準(zhǔn)化,對分?jǐn)?shù)的解釋也必須標(biāo)準(zhǔn)化。一個測驗(yàn)的原始分?jǐn)?shù)本身并不具有任何可比性。在傳統(tǒng)的心理測驗(yàn)中,把個人所得的分?jǐn)?shù)與代表一般人同類行為水平的分?jǐn)?shù)分布情況相比較,以判別其所得分?jǐn)?shù)的高低。此處所指的“代表一般人同類行為的分?jǐn)?shù)的分布情況”,即稱為“常模”。
建立常模的方法是,在將來要使用測驗(yàn)的全體對象中,選擇有代表性的一部分人(稱標(biāo)準(zhǔn)化樣本),對此樣本施測并將所得的分?jǐn)?shù)加以統(tǒng)計(jì)整理,得出一個具有代表性的分?jǐn)?shù)分布,這個分布就被稱為常模。常??梢驑?biāo)準(zhǔn)化時選取樣本的不同而有不同的類別,形成不同的亞常模。常見的亞常模有年齡常模、年級常模、性別常模、地域常模、民族常模、職業(yè)常模等。
- 相關(guān)文章
-