国产18禁黄网站免费观看,99爱在线精品免费观看,粉嫩metart人体欣赏,99久久99精品久久久久久,6080亚洲人久久精品

《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》研制報(bào)告

時(shí)間:2008-06-24 19:45:00   來(lái)源:中國(guó)語(yǔ)言文字工作網(wǎng)     [字體: ]
《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》研制報(bào)告


“漢字應(yīng)用水平測(cè)試研究”課題組

提要 漢字應(yīng)用水平測(cè)試的目的是衡量中等以上受教育程度人群在以規(guī)范漢字為媒介的閱讀或書面表達(dá)等活動(dòng)中,使用漢字所達(dá)到的水平。這項(xiàng)測(cè)試既遵循國(guó)家通用語(yǔ)言文字的相關(guān)規(guī)范和標(biāo)準(zhǔn),也遵循漢語(yǔ)漢字的約定俗成和使用規(guī)律,同時(shí)還采用了教育測(cè)量學(xué)的理論與方法構(gòu)建測(cè)評(píng)體系。在確定測(cè)試范圍及內(nèi)容、測(cè)試形式、評(píng)分依據(jù)及標(biāo)準(zhǔn)、分?jǐn)?shù)體系等過(guò)程中,廣泛運(yùn)用了語(yǔ)料庫(kù)語(yǔ)言學(xué)、計(jì)算語(yǔ)言學(xué)、教育測(cè)量學(xué)等理論成果及操作方法,達(dá)到了理論與實(shí)踐的有機(jī)結(jié)合。
關(guān)鍵詞 漢字 應(yīng)用水平 等級(jí) 測(cè)試大綱 研制報(bào)告

《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》是國(guó)家語(yǔ)言文字應(yīng)用“十五”科研規(guī)劃重點(diǎn)項(xiàng)目“漢字應(yīng)用水平測(cè)試研究”的終成果,經(jīng)專家鑒定委員會(huì)鑒定和國(guó)家語(yǔ)言文字工作委員會(huì)語(yǔ)言文字規(guī)范(標(biāo)準(zhǔn))審定委員會(huì)審定后,2006年8月28日由中華人民共和國(guó)教育部和國(guó)家語(yǔ)言文字工作委員會(huì)作為語(yǔ)言文字規(guī)范(GF2002—2006)向社會(huì)正式發(fā)布,2007年2月1日起試行。

該項(xiàng)目由教育部語(yǔ)言文字應(yīng)用管理司和語(yǔ)言文字信息管理司提出,批準(zhǔn)立項(xiàng)時(shí)間是2002年11月,項(xiàng)目批準(zhǔn)號(hào)WT105-31。項(xiàng)目研制任務(wù)由教育部語(yǔ)言文字應(yīng)用研究所普通話和語(yǔ)言教學(xué)研究室承擔(dān)。該項(xiàng)目是國(guó)家語(yǔ)委重點(diǎn)科研項(xiàng)目“漢字應(yīng)用水平等級(jí)標(biāo)準(zhǔn)及測(cè)試大綱研究”的延續(xù)項(xiàng)目,前一項(xiàng)目屬于調(diào)研性項(xiàng)目,工作重點(diǎn)是了解社會(huì)上有關(guān)行業(yè)漢字應(yīng)用的現(xiàn)狀和需求,特別是用于評(píng)核相關(guān)人員漢字應(yīng)用水平的需求,為開(kāi)展課題研究和將來(lái)開(kāi)展測(cè)評(píng)工作提供依據(jù)和參考。

2002年延續(xù)立項(xiàng)后,明確了后續(xù)項(xiàng)目為標(biāo)準(zhǔn)研制項(xiàng)目,主要任務(wù)是在前一項(xiàng)目調(diào)查的基礎(chǔ)上建立一整套科學(xué)的、標(biāo)準(zhǔn)化的測(cè)評(píng)系統(tǒng)和測(cè)量工具,用來(lái)衡量有關(guān)行業(yè)從業(yè)人員及高等院校學(xué)生等人群應(yīng)用漢字的能力和水平。研制的主要內(nèi)容包括作為標(biāo)準(zhǔn)頒布的漢字應(yīng)用水平等級(jí)、漢字應(yīng)用水平測(cè)試大綱,以及作為標(biāo)準(zhǔn)附件的漢字應(yīng)用水平測(cè)試字表和作為測(cè)評(píng)系統(tǒng)輔助部分的漢字應(yīng)用水平測(cè)試詞語(yǔ)表、試題、試卷和題庫(kù)等。

從2002年至2004年,課題組先后三次進(jìn)行了相關(guān)行業(yè)人群和在校大學(xué)生識(shí)字情況調(diào)查,涉及的調(diào)查對(duì)象主要有新聞出版行業(yè)的編輯、記者,高等院校學(xué)生,中小學(xué)教師等,總計(jì)3600余人;然后整理、分析了調(diào)查數(shù)據(jù);同時(shí)還對(duì)上述人群進(jìn)行了試題、試卷方面的預(yù)測(cè)和試測(cè)。調(diào)研的省市有北京、天津、上海、河北、黑龍江、廣東等?蒲泻献鲉挝幌群笥袕V東教育出版社、山西大學(xué)、北京師范大學(xué)、北京教育學(xué)院等。在研制過(guò)程中,課題組還就漢字應(yīng)用水平等級(jí)、漢字應(yīng)用水平測(cè)試大綱和漢字應(yīng)用水平測(cè)試字表反復(fù)征求了海內(nèi)外30多位語(yǔ)言文字學(xué)、語(yǔ)言教學(xué)和教育測(cè)量學(xué)等領(lǐng)域?qū)<业囊庖?jiàn),并召開(kāi)了10余次專家咨詢、研討和評(píng)審會(huì)。2005年還征求了全國(guó)15個(gè)地方語(yǔ)委辦的意見(jiàn)。課題組對(duì)專家和各地語(yǔ)委辦的意見(jiàn)做了深入、細(xì)致的分析和討論,吸收了其中絕大多數(shù)意見(jiàn)和建議,進(jìn)一步完善了測(cè)評(píng)系統(tǒng)。

下面就《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》一些主要內(nèi)容的研制情況分別做一點(diǎn)說(shuō)明。

一、研制《漢字應(yīng)用水平測(cè)試字表》


《漢字應(yīng)用水平測(cè)試字表》(以下簡(jiǎn)稱《字表》)是這項(xiàng)課題的重點(diǎn)之一,因?yàn)榻y(cè)評(píng)系統(tǒng)很重要的一點(diǎn)就是測(cè)評(píng)的內(nèi)容范圍,對(duì)這項(xiàng)課題而言,就是確定測(cè)試用字的數(shù)量和范圍,以便據(jù)此逐步建立漢字應(yīng)用水平等級(jí)及測(cè)試大綱,并建設(shè)相應(yīng)的測(cè)試題庫(kù),為等級(jí)的劃分、測(cè)試大綱的編寫及題庫(kù)的建設(shè)等提供基本的內(nèi)容和大致的范圍。

研制《字表》,首先要考慮幾個(gè)方面的問(wèn)題:第一,《字表》與國(guó)家已經(jīng)頒布過(guò)的有關(guān)漢字的規(guī)范或標(biāo)準(zhǔn),特別是幾種字表之間的關(guān)系;第二,《字表》與漢語(yǔ)真實(shí)文本中漢字使用情況的關(guān)系;第三,《字表》與相關(guān)人群掌握漢字情況的關(guān)系;第四,《字表》與現(xiàn)代漢語(yǔ)通用詞語(yǔ)用字情況的關(guān)系;第五,《字表》與漢字自身系統(tǒng)性之間的關(guān)系。這幾種關(guān)系是研制《字表》的根本問(wèn)題,既涉及到國(guó)家法律、政策層面的規(guī)范和標(biāo)準(zhǔn),也涉及到現(xiàn)實(shí)社會(huì)語(yǔ)言生活的狀況,比如漢字的使用頻率、覆蓋率、構(gòu)詞情況以及人們掌握漢字的平均數(shù)量和集中情況等,同時(shí)還涉及到漢字字形、讀音、意義等方面的系統(tǒng)性,比如天干地支、節(jié)氣等特定表義范疇的系列用字等。

按照上述思路,課題組以《現(xiàn)代漢語(yǔ)常用字表》所收3500常用字為測(cè)試用字的基本內(nèi)容,在《現(xiàn)代漢語(yǔ)通用字表》所收7000通用字范圍內(nèi),對(duì)社會(huì)上經(jīng)常使用文字的人群先后三次進(jìn)行了識(shí)字情況測(cè)查,并根據(jù)所獲得的數(shù)據(jù)初步篩選了測(cè)試用字;同時(shí),依據(jù)國(guó)家語(yǔ)委“現(xiàn)代漢語(yǔ)大型通用語(yǔ)料庫(kù)”和國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)《智能化中文信息處理平臺(tái)》課題的子課題“超大規(guī)模通用平衡語(yǔ)料庫(kù)”的漢字頻率統(tǒng)計(jì)數(shù)據(jù),對(duì)經(jīng)測(cè)查而篩選出來(lái)的漢字進(jìn)行了必要的對(duì)比分析和調(diào)整;隨后,通過(guò)和測(cè)試詞語(yǔ)表用字情況的對(duì)比,并著重考察了低頻字的分布、構(gòu)詞能力、意義范疇等,對(duì)《字表》又做了部分微調(diào);終確定了測(cè)試用字的大致框架。

在研制《字表》過(guò)程中,我們所遵循的選字原則主要有以下幾條:

1)規(guī)范性原則:測(cè)試用字均為規(guī)范的現(xiàn)代漢字字形,不規(guī)范的字形不收,如異體字;另外,屬于方言語(yǔ)詞范圍的用字也一律不收,如:囡、伢、嬤、甭、摜、矬、擼等。

2)應(yīng)用性原則:篩選測(cè)試用字均以抽樣人群識(shí)字情況測(cè)查數(shù)據(jù)和語(yǔ)料庫(kù)中字頻的統(tǒng)計(jì)數(shù)據(jù)為重要參數(shù),選取高識(shí)別率和高頻率的字。同時(shí)依據(jù)頻率統(tǒng)計(jì)原理,測(cè)試用字還要考慮到其在語(yǔ)料庫(kù)中的覆蓋率,盡量選取分布廣泛、覆蓋率大的字。另外,充分考慮現(xiàn)代漢字的實(shí)際使用情況,對(duì)于一些常用的口語(yǔ)用字,如:洇、焯、磴、硌、蕻、痄、搽等,雖然這些字在書面語(yǔ)中較少使用,字頻統(tǒng)計(jì)或統(tǒng)計(jì)不到或頻率很低,但在日常生活中卻較常用,因此也適當(dāng)選取了一些;對(duì)于現(xiàn)代通用漢字之外的文言用字,如:筮、笏、耜、騍等,一般不收。

3)系統(tǒng)性原則:對(duì)一些成系列的字要進(jìn)行縱橫相關(guān)的多種聯(lián)想,綜合考慮其取舍。如:天干地支、節(jié)氣用字,數(shù)字的漢字大寫用字,民族名稱,省、自治區(qū)、直轄市的簡(jiǎn)稱和別稱,地、縣級(jí)以上的地名用字以及連綿字等,我們都綜合考慮,平等對(duì)待,成系列收取;其中為保持地縣級(jí)以上的地名用字的完整性,我們收入了琊、埗、埇、猇等4個(gè)7000通用字以外的縣級(jí)地名用字。對(duì)動(dòng)植物名稱,金屬、化學(xué)元素名稱以及姓氏、人名用字等則根據(jù)常用程度和頻率的高低決定取舍。

在研制過(guò)程中,以上3條原則都不是孤立的,而是綜合運(yùn)用以決定字的取舍。終,《字表》確定為5500字,并分成三個(gè)子表,其中甲表4000字;乙表500字;丙表1000字,成為《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》的附錄A(規(guī)范性附錄)。

《字表》的具體研制過(guò)程詳見(jiàn)《語(yǔ)言文字應(yīng)用》2004年第1期63-70頁(yè)《漢字應(yīng)用水平測(cè)試用字的統(tǒng)計(jì)與分級(jí)》。

二、研制《漢字應(yīng)用水平等級(jí)》


研制《漢字應(yīng)用水平等級(jí)》,實(shí)際上就是建立漢字應(yīng)用水平的評(píng)價(jià)體系。與此同時(shí),再依照一定的方法確定測(cè)量工具和測(cè)量方法。

建立一種特定的評(píng)價(jià)體系,實(shí)際上就相當(dāng)于對(duì)人的身高、體重等指標(biāo)或數(shù)據(jù)按照一定的參考值給予判斷一樣,例如是正常,還是偏高、偏矮,等等。進(jìn)行這樣的判斷,大致又需要若干前提。其中主要有目標(biāo)參照或常摸參照,也就是絕對(duì)標(biāo)準(zhǔn)或相對(duì)標(biāo)準(zhǔn)。前者是以要達(dá)到的目標(biāo)為參照,重點(diǎn)考察、衡量所收集到的評(píng)價(jià)客體的數(shù)據(jù)與目標(biāo)之間距離的大小,例如一個(gè)健身計(jì)劃,目標(biāo)是每位參與者都要將當(dāng)前體重減少20千克,那么,計(jì)劃結(jié)束時(shí),評(píng)價(jià)健身效果就是考察每位參與者所減少的體重與20千克這個(gè)目標(biāo)之間的差距。后者則是以常模數(shù)據(jù)為參照,重點(diǎn)考察、衡量所收集到的評(píng)價(jià)客體的數(shù)據(jù)與常模數(shù)據(jù)之間的差異,例如判斷一名中國(guó)城市12歲男童身高方面的發(fā)育情況,就可以將他的身高數(shù)據(jù)與中國(guó)城市12歲男童身高方面的常模數(shù)據(jù)進(jìn)行比較,然后對(duì)其發(fā)育情況進(jìn)行推斷和評(píng)估。

漢字應(yīng)用水平等級(jí)一方面要明確使用漢字的目標(biāo),即絕對(duì)標(biāo)準(zhǔn),例如關(guān)于漢字字形、讀音、意義及用法方面的規(guī)范及依據(jù);另一方面,也要以相關(guān)人群識(shí)字量調(diào)查、語(yǔ)料庫(kù)的字頻統(tǒng)計(jì)等數(shù)據(jù)為基礎(chǔ),整理出可供參照的相對(duì)標(biāo)準(zhǔn)。

在漢字應(yīng)用水平等級(jí)中,目標(biāo)和參照標(biāo)準(zhǔn)都要十分明確。首先,使用者在以規(guī)范漢字為媒介的閱讀和書寫活動(dòng)中,辨別和使用法定的國(guó)家通用文字,必須遵循國(guó)家頒布的漢字字形規(guī)范、讀音規(guī)范,而且還要了解和掌握漢字在權(quán)威工具書中的普通話讀音和現(xiàn)代漢語(yǔ)義項(xiàng)及用法,并在應(yīng)用過(guò)程中與其保持一致。評(píng)價(jià)使用者水平的高低,主要考察他們辨別和使用漢字時(shí),在字形、讀音、意義及用法幾方面的表現(xiàn)與目標(biāo)之間的差異程度。其次,源自一些實(shí)際調(diào)查、試測(cè)的客觀數(shù)據(jù),經(jīng)嚴(yán)格的整理、分析后,也可以形成評(píng)價(jià)的參照標(biāo)準(zhǔn)。在能夠掌握和使用的漢字?jǐn)?shù)量方面,按照相關(guān)人群識(shí)字量調(diào)查收集到的平均識(shí)字量、集中識(shí)字量(眾數(shù))以及現(xiàn)代漢語(yǔ)真實(shí)文本中漢字的使用頻度、分布情況等數(shù)據(jù),三個(gè)等級(jí)的參照標(biāo)準(zhǔn)由低到高依次確定為3500-4000、4000-4500和4500-5500個(gè)漢字。與此同時(shí),漢字應(yīng)用水平測(cè)試并不是識(shí)字量的競(jìng)賽,因此能夠掌握和使用的漢字?jǐn)?shù)量也不是衡量水平高低的參照標(biāo)準(zhǔn)。根據(jù)4000→4500→5500三級(jí)字量以及具體的漢字,考察它們?cè)诓煌悇e現(xiàn)代漢語(yǔ)真實(shí)文本中的使用頻度、分布情況等數(shù)據(jù),就可以從一個(gè)側(cè)面建立起使用者閱讀、書寫綜合表現(xiàn)的參照標(biāo)準(zhǔn),因?yàn)椴煌瑪?shù)量、不同范圍的漢字在不同類別文本中的覆蓋率也是不同的,如果使用者所能駕御的漢字在數(shù)量和范圍方面都是確定的,那么就可以推斷他在應(yīng)對(duì)不同類別漢語(yǔ)文獻(xiàn)時(shí)可能具有的表現(xiàn),例如他在閱讀不同類別漢語(yǔ)文獻(xiàn)時(shí),碰到生字的概率肯定是不統(tǒng)一的,而這一點(diǎn)將直接影響到閱讀的順暢性。另外,不同人群在識(shí)字量調(diào)查和試測(cè)中的表現(xiàn)明顯具有群體性特征,這些特征就可以固化為漢字應(yīng)用水平不同等級(jí)的參照標(biāo)準(zhǔn),例如是否具備了接受不同程度教育的漢字基礎(chǔ);是否具備了接受某種與漢字應(yīng)用密切相關(guān)的工作任務(wù)的基本條件;在漢字應(yīng)用水平測(cè)試中的基本表現(xiàn),等等。作為漢字應(yīng)用水平的評(píng)價(jià)體系,漢字應(yīng)用水平等級(jí)主要由使用漢字時(shí)的規(guī)范性、準(zhǔn)確性目標(biāo)和基于實(shí)際調(diào)查、試測(cè)數(shù)據(jù)而構(gòu)建的參照標(biāo)準(zhǔn)兩部分組合而成。

在漢字應(yīng)用水平等級(jí)中,還應(yīng)當(dāng)明確不同等級(jí)所對(duì)應(yīng)的答對(duì)率、導(dǎo)出分?jǐn)?shù)等基本的測(cè)試表現(xiàn),從而使評(píng)價(jià)體系與具體的測(cè)量工具和測(cè)量方法能夠有明確的對(duì)應(yīng)關(guān)系。

關(guān)于《漢字應(yīng)用水平等級(jí)》的具體研制過(guò)程,詳見(jiàn)《語(yǔ)言文字應(yīng)用》2004年第1期56-62頁(yè)“《漢字應(yīng)用水平等級(jí)標(biāo)準(zhǔn)》研制報(bào)告”。

三、研制《漢字應(yīng)用水平測(cè)試大綱》


研制測(cè)試大綱,要解決的問(wèn)題主要有:測(cè)試的目的、性質(zhì)和用途;測(cè)試的對(duì)象;測(cè)試的內(nèi)容范圍和形式;試題類型和試卷構(gòu)成;評(píng)分依據(jù);分?jǐn)?shù)體系,等等。

關(guān)于測(cè)試目的,有測(cè)試本身的目的和由測(cè)試影響所及而預(yù)期的目的。前一個(gè)目的非常明確,就是通過(guò)測(cè)試的方法衡量應(yīng)試者在閱讀、書面表達(dá)以及其他與漢字應(yīng)用有關(guān)的活動(dòng)中,掌握漢字形、音、義以及使用漢字的正確程度和準(zhǔn)確程度。后一個(gè)目的指的是測(cè)試本身并不是終目的,而是通過(guò)測(cè)試提高使用者掌握漢字、應(yīng)用漢字的能力和水平,其重要性更體現(xiàn)在貫徹《中華人民共和國(guó)國(guó)家通用語(yǔ)言文字法》,提高我國(guó)國(guó)民的語(yǔ)言文字規(guī)范意識(shí),提倡準(zhǔn)確、健康地使用國(guó)家通用語(yǔ)言文字,完善漢字應(yīng)用環(huán)境,弘揚(yáng)中華文化。

就測(cè)試本身的目的而言,這是衡量測(cè)試效度的重要依據(jù)。一個(gè)測(cè)試的有效性如何,關(guān)鍵在于是否實(shí)現(xiàn)了測(cè)試目的。這個(gè)問(wèn)題主要涉及試題、試卷的質(zhì)量。如果試題的內(nèi)容、形式和試卷的結(jié)構(gòu)能夠反映漢字應(yīng)用的實(shí)際情況;試題的難度、鑒別度等指標(biāo)適當(dāng),拼合試卷的程序規(guī)范,能夠反映出不同能力水平的差異,那么,這樣的測(cè)試就達(dá)到了預(yù)期目的。

在研制測(cè)試大綱過(guò)程中,課題組在逐步明確測(cè)試目的的同時(shí),圍繞測(cè)試內(nèi)容、試題、試卷等相關(guān)問(wèn)題進(jìn)行了大量的數(shù)據(jù)采集、研究分析等工作,從收集到的數(shù)據(jù)和分析結(jié)果看,試卷的有效性非常顯著。

測(cè)試的性質(zhì)往往取決于測(cè)試的規(guī)模和標(biāo)準(zhǔn)化程度,反過(guò)來(lái)它也影響測(cè)試的規(guī)模和標(biāo)準(zhǔn)化程度。漢字應(yīng)用水平測(cè)試是由教育部和國(guó)家語(yǔ)委組織研制并組織實(shí)施的一項(xiàng)語(yǔ)言類標(biāo)準(zhǔn)化測(cè)試。它的信度、效度、施測(cè)程序、評(píng)分程序、題庫(kù)的容量等都要符合和滿足大規(guī)模標(biāo)準(zhǔn)化測(cè)試的要求。

測(cè)試的用途主要涉及預(yù)期的測(cè)驗(yàn)使用者,這里既有個(gè)人,也包括團(tuán)體;既包括應(yīng)試者,也包括希望測(cè)驗(yàn)結(jié)果能夠?yàn)槟撤N決策提供參考的單位或部門等。為滿足這些潛在的需求,漢字應(yīng)用水平測(cè)試須要盡可能準(zhǔn)確、明確地向使用者提供測(cè)試結(jié)果,并合理地解釋這些結(jié)果,而且這種解釋必須具有穩(wěn)定性和一致性。
測(cè)試對(duì)象與測(cè)試用途密切相關(guān),它要解決的主要是誰(shuí)來(lái)參加測(cè)試;或者說(shuō)測(cè)試更適用于哪些應(yīng)試者;測(cè)試分?jǐn)?shù)和分?jǐn)?shù)解釋能提供什么信息;這些信息能夠用于什么目的,等等。這些問(wèn)題將直接影響到確定測(cè)試內(nèi)容、編制試題、設(shè)定測(cè)試時(shí)限,等等。漢字應(yīng)用水平測(cè)試是一項(xiàng)體現(xiàn)國(guó)家語(yǔ)言文字方針政策的舉措,被賦予了衡量并間接提高有關(guān)行業(yè)從業(yè)人員和學(xué)生漢字應(yīng)用水平的功能,因此,測(cè)試用途就必須體現(xiàn)這種功能。通過(guò)實(shí)際調(diào)查與試測(cè),這項(xiàng)測(cè)試定位于“適用于公務(wù)員,編輯、記者、校對(duì)和文字錄入人員,各級(jí)各類學(xué)校教師,文秘及辦公室工作人員,廣告業(yè)從業(yè)人員,中文字幕機(jī)操作人員,高等學(xué)校和?祁愔械葘W(xué)校學(xué)生以及日常工作與漢字應(yīng)用緊密相關(guān)的其他人員;同時(shí)也適用于想要了解自己漢字應(yīng)用水平和能力的其他人士!边@些由測(cè)試用途而界定的測(cè)試對(duì)象,是一種可供操作的界定,而對(duì)于測(cè)試對(duì)象的概括性表述,則應(yīng)當(dāng)具有明確測(cè)試對(duì)象背景資格的作用,因此,在《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》中,與此相關(guān)的表述為“本規(guī)范規(guī)定了具有中等以上受教育程度人群使用漢字應(yīng)當(dāng)達(dá)到的水平”。

關(guān)于測(cè)試形式,漢字應(yīng)用水平測(cè)試選擇了集體作答的紙筆測(cè)驗(yàn),試題卷和答題紙分開(kāi),以便機(jī)器閱卷。從將來(lái)的發(fā)展趨勢(shì)看,計(jì)算機(jī)化無(wú)紙測(cè)驗(yàn)、計(jì)算機(jī)輔助自適應(yīng)測(cè)驗(yàn)、基于網(wǎng)絡(luò)技術(shù)支持的網(wǎng)上測(cè)驗(yàn)等,都是需要進(jìn)一步研究的問(wèn)題。

此外,由于考慮到機(jī)器閱卷,試題類型必須滿足客觀性要求,避免主觀判斷,因此,絕大部分試題都采用了四選一形式的選擇題;另外還有一部分需要閱卷者依據(jù)統(tǒng)一標(biāo)準(zhǔn)判斷的書寫題。另外,根據(jù)漢字應(yīng)用水平測(cè)試的目的,試卷構(gòu)成要比較全面地反映應(yīng)試者的漢字應(yīng)用水平,因此,漢字的識(shí)別和書寫、漢字形音義各要素的均衡等,都要反映在每一套試卷中。后還有測(cè)試時(shí)間,應(yīng)當(dāng)充分考慮獲得信息大化所需的試題量以及與此相關(guān)的合理時(shí)限。

關(guān)于評(píng)分標(biāo)準(zhǔn),也就是漢字形音義的正確與否如何判定,這里面存在著兩種情況:一種是國(guó)家已經(jīng)頒布了標(biāo)準(zhǔn)或規(guī)范的,比如規(guī)范漢字及其字形;另一種是國(guó)家還沒(méi)有制定、頒布規(guī)范或標(biāo)準(zhǔn),而是見(jiàn)于各權(quán)威工具書、并被廣泛認(rèn)可的研究成果,比如除《普通話異讀詞審音表》所涉及的漢字及讀音之外的其他漢字的讀音。課題組終確定的評(píng)分依據(jù)為:字形指漢字的規(guī)范字形,規(guī)范字形的依據(jù)是《現(xiàn)代漢語(yǔ)通用字表》;字音指漢字的普通話讀音,其依據(jù)是《普通話異讀詞審音表》和權(quán)威工具書中漢字的普通話讀音;字義指權(quán)威工具書中漢字在現(xiàn)代漢語(yǔ)中的義項(xiàng),以及某些字在部分詞語(yǔ)中的特殊用法。

依照評(píng)分標(biāo)準(zhǔn)判斷應(yīng)試者在每一道試題以及整套試卷上的作答情況,就初步形成了應(yīng)試者在特定試卷上所獲得的原始分?jǐn)?shù),而對(duì)于標(biāo)準(zhǔn)化測(cè)試,原始分?jǐn)?shù)并不是足以形成評(píng)價(jià)的終分?jǐn)?shù),因此需要對(duì)原始分?jǐn)?shù)按一定規(guī)則進(jìn)行處理,從而產(chǎn)生導(dǎo)出分?jǐn)?shù)。漢字應(yīng)用水平測(cè)試采用的導(dǎo)出分?jǐn)?shù)是500分為平均分,滿分為800分。導(dǎo)出分?jǐn)?shù)稱HZC分?jǐn)?shù)。

HZC分?jǐn)?shù)是評(píng)價(jià)應(yīng)試者漢字應(yīng)用水平的主要依據(jù)。此外,考慮到漢字應(yīng)用的現(xiàn)實(shí)狀況、常用漢字的數(shù)量及范圍、不同應(yīng)試者個(gè)人的語(yǔ)言生活環(huán)境及經(jīng)驗(yàn)等,為了更切近使用漢字的實(shí)際情況,并減少和避免由于個(gè)人因素的不確定性對(duì)測(cè)試結(jié)果產(chǎn)生誤差影響,在用HZC分?jǐn)?shù)確定應(yīng)試者的漢字應(yīng)用水平等級(jí)之前,測(cè)試大綱又規(guī)定了進(jìn)入等級(jí)的標(biāo)準(zhǔn)。這個(gè)標(biāo)準(zhǔn)定為:對(duì)涉及測(cè)試字表甲表范圍的試題,由于所涉及的漢字都是識(shí)別率和使用頻率比較高的漢字,作答正確率必須達(dá)到80%(含)以上。滿足此條件后,HZC分?jǐn)?shù)在200分(含)至500分(不含)之間的,漢字應(yīng)用水平評(píng)定為三級(jí);HZC分?jǐn)?shù)在500分(含)至600分(不含)之間的,漢字應(yīng)用水平評(píng)定為二級(jí);HZC分?jǐn)?shù)達(dá)到600分(含)以上的,漢字應(yīng)用水平評(píng)定為一級(jí)。

這里需要說(shuō)明的是,80%的作答正確率指的是如果把涉及測(cè)試字表甲表的所有內(nèi)容都編制成試題,那么作答正確率應(yīng)當(dāng)達(dá)到80%,但是具體到每一套試卷,都是在全部測(cè)試內(nèi)容中進(jìn)行抽樣的結(jié)果,是一個(gè)具有一定代表性的樣本,這個(gè)樣本與全部測(cè)試內(nèi)容的總體存在著一定的對(duì)應(yīng)關(guān)系,因此首先要控制不同試卷之間總體質(zhì)量的平衡,其次也要按照每一套試卷的特殊性,對(duì)測(cè)試結(jié)果進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換的目的是求出每套試卷的作答正確率和總體作答正確率之間的對(duì)應(yīng)關(guān)系,確定試卷作答正確率中的哪一點(diǎn),投射到總體作答正確率中相當(dāng)于80%。所以說(shuō)80%的作答正確率是一種轉(zhuǎn)換后的結(jié)果。

后,測(cè)試大綱還明確了測(cè)試的操作流程及備考要點(diǎn),以便測(cè)試的使用者了解這項(xiàng)測(cè)試的相關(guān)信息。

四、研制漢字應(yīng)用水平測(cè)試詞語(yǔ)表、試題、試卷和題庫(kù)等


漢字測(cè)試既針對(duì)漢字本身的屬性,也針對(duì)漢字的使用情況,比如字形問(wèn)題,既有筆畫、偏旁和結(jié)構(gòu)等方面的對(duì)錯(cuò)問(wèn)題,也有具體使用中的正誤問(wèn)題,明顯的例子就是錯(cuò)字和別字。因此,衡量人使用漢字的正確程度和準(zhǔn)確程度,既要針對(duì)單個(gè)的漢字,也要針對(duì)具體使用環(huán)境中的用字。課題組根據(jù)測(cè)試的目的、性質(zhì)、需求等,同時(shí)參照詞頻統(tǒng)計(jì)數(shù)據(jù)和若干種權(quán)威工具書,以及一些關(guān)于成語(yǔ)、固定表達(dá)形式等材料,按照規(guī)范性、系統(tǒng)性原則,經(jīng)過(guò)反復(fù)篩選、整理,確定了作為漢字使用環(huán)境及試題范圍的參考詞語(yǔ)46000余條,編制成《漢字應(yīng)用水平測(cè)試詞語(yǔ)表》列為附錄B(資料性附錄)。

除了使用環(huán)境的依托問(wèn)題,漢字測(cè)試的本質(zhì)還是要圍繞漢字本身的形音義等屬性。因此,課題組對(duì)漢字的形、音、義做了適用于測(cè)試的梳理,比如易錯(cuò)易混的筆畫、部件、結(jié)構(gòu)及整字,多音字的若干讀音,漢字的現(xiàn)代漢語(yǔ)義項(xiàng)等。以漢字的讀音為例,經(jīng)過(guò)反復(fù)討論修改,考核的要點(diǎn)終落實(shí)為由于多音混淆而產(chǎn)生的錯(cuò)誤,如揣度、提防、屏棄等;常見(jiàn)的讀音錯(cuò)誤,如緘、訕、熾等;不常用字的讀音錯(cuò)誤,如秈、膪、莠,等等。

在編制試題過(guò)程中,課題組逐漸認(rèn)識(shí)到,漢字測(cè)試具有非常明顯的特殊性,其中突出的例子是相同類型、同一內(nèi)容范疇的試題,其答案具有可組合性,例如:在詞語(yǔ)中判斷用字是否正確的四選一試題,如果確定在一份試卷中可以容納10個(gè)題目,那么40個(gè)答案則可組合出91390道試題;而這些試題再以10個(gè)一組滿足試卷需求,則會(huì)形成一個(gè)更可觀的數(shù)量。當(dāng)然,這里面還有兩個(gè)問(wèn)題需要解決:第一,因?yàn)橛行┫嗤拇鸢赋霈F(xiàn)在不同的試題中,從而可能導(dǎo)致同一份試卷中出現(xiàn)相同的項(xiàng)目,這就需要有查重的篩選機(jī)制,當(dāng)然這類篩選性程序就涉及到試題的指標(biāo)標(biāo)注、題庫(kù)管理及拼卷程序等問(wèn)題了;第二,這40個(gè)答案所有可能的組合雖然能夠生成數(shù)量巨大的試題,但是,對(duì)標(biāo)準(zhǔn)化測(cè)試來(lái)說(shuō),每一道試題都是獨(dú)立的,在正式使用前都要經(jīng)過(guò)試測(cè)的檢驗(yàn),都需要標(biāo)注相關(guān)的指標(biāo),以備拼合試卷時(shí)使用。

為檢驗(yàn)試題試卷的質(zhì)量,獲取有關(guān)數(shù)據(jù),課題組先后兩次抽取具有一定代表性的樣本數(shù)千名,進(jìn)行了模擬實(shí)測(cè)。試測(cè)數(shù)據(jù)提供了非常必要的和重要的信息,其中一些主要信息如下:第一,根據(jù)預(yù)期分別代表漢字應(yīng)用水平初、中、高三種程度的受測(cè)群體,在識(shí)字量調(diào)查(在字表上標(biāo)出認(rèn)識(shí)的字)和試測(cè)中的表現(xiàn)相關(guān)程度很高,三種人群識(shí)字量和試測(cè)得分的排序完全一致,調(diào)查結(jié)果進(jìn)一步驗(yàn)證了此前做過(guò)的同類調(diào)查,試測(cè)得分組間差異顯著,表明測(cè)驗(yàn)的效度較高;第二,整份試卷難易度適中,總體上稍稍偏低;第三,占總題量93%強(qiáng)的試題,鑒別度參數(shù)在可接受范圍,表明絕大多數(shù)試題具有較好的鑒別作用;第四,選擇判斷試題與書寫試題經(jīng)因素分析,表明所考查的不是同一種能力,這也證實(shí)了漢字應(yīng)用的綜合性,要求各項(xiàng)能力均衡發(fā)展,不可偏廢,特別是漢字應(yīng)用水平測(cè)試更不能顧此失彼;第五,根據(jù)試題貢獻(xiàn)率指標(biāo),可以看出題量不必太大,這個(gè)結(jié)果與此前一些專家的建議基本吻合,因此,兩次試測(cè)題量雖然分別為200和170,但實(shí)測(cè)題量終確定為130。

實(shí)測(cè)結(jié)果也為等級(jí)標(biāo)準(zhǔn)和應(yīng)試人測(cè)驗(yàn)得分的對(duì)應(yīng)關(guān)系提供了重要參考。實(shí)測(cè)結(jié)果表明:根據(jù)預(yù)期分別代表漢字應(yīng)用水平初、中、高三種程度的受測(cè)群體,對(duì)占總題量70%涉及測(cè)試字表甲表內(nèi)容的試題,按照試題的能力參數(shù)和特征參數(shù),經(jīng)轉(zhuǎn)換后,作答正確率達(dá)到或超過(guò)80%的人分別占該受測(cè)人群總體的80.1%、82.5%和84.3%;三種程度的受測(cè)群體在這部分測(cè)試內(nèi)容上的平均答對(duì)率分別為80.5%、81.7%和89.6%。代表漢字應(yīng)用水平初、中程度的受測(cè)群體,雖然在平均答對(duì)率上差異不顯著,但是所答對(duì)的試題質(zhì)量上卻有顯著差異,因此獲得的HZC分?jǐn)?shù)也有顯著差異。

實(shí)測(cè)結(jié)果除了滿足試題、試卷的需求外,對(duì)于題庫(kù)建設(shè)更具有非常重要的作用,因?yàn)楦鶕?jù)實(shí)測(cè)數(shù)據(jù),可以量化試題的各項(xiàng)指標(biāo),而這些指標(biāo)是判斷試題是否可以進(jìn)入題庫(kù)的重要依據(jù),同時(shí)也是計(jì)算機(jī)生成試卷的必要條件。

給試題標(biāo)注各項(xiàng)指標(biāo),涉及到題庫(kù)的管理系統(tǒng)和運(yùn)行系統(tǒng)。根據(jù)漢字應(yīng)用水平測(cè)試的特殊性和題庫(kù)建設(shè)的新研究成果及其發(fā)展趨勢(shì),課題組采用項(xiàng)目反應(yīng)理論(IRT)作試題分析和題庫(kù)建設(shè)的基礎(chǔ);與此同時(shí),題庫(kù)還劃分字形、字音、字義和綜合運(yùn)用幾個(gè)部分,構(gòu)建板塊框架,進(jìn)行板塊管理,每一個(gè)進(jìn)入題庫(kù)的試題都要標(biāo)注所要考查的方面,并且標(biāo)注作為考點(diǎn)的字屬于測(cè)試字表中的哪一級(jí),以此滿足試卷各部分按一定比例進(jìn)行拼合的需求;后,題庫(kù)的運(yùn)行系統(tǒng)中,還要包括查重、篩選的過(guò)濾程序,避免考點(diǎn)重復(fù),尤其是涉及字形判斷、書寫方面的試題,不能在考查其他任何方面的試題中出現(xiàn)。

五、有待進(jìn)一步研究解決的幾個(gè)主要問(wèn)題


從2002年底到現(xiàn)在,漢字應(yīng)用水平測(cè)試的主體框架已經(jīng)初現(xiàn)端倪,基本上能夠滿足實(shí)測(cè)的需求了,課題組感謝各方面的專家和同行在項(xiàng)目進(jìn)行過(guò)程中所給予的支持和幫助,并將不斷改進(jìn)和完善測(cè)試框架和系統(tǒng),以滿足社會(huì)的需求。

在今后幾年時(shí)間里,還有一些問(wèn)題需要繼續(xù)探索和研究。第一是根據(jù)國(guó)家語(yǔ)言文字政策、語(yǔ)言文字規(guī)范和標(biāo)準(zhǔn)的發(fā)展對(duì)測(cè)試的有關(guān)內(nèi)容適時(shí)進(jìn)行調(diào)整。第二是適應(yīng)社會(huì)語(yǔ)文生活發(fā)展、變化的現(xiàn)實(shí),處理好漢字應(yīng)用水平測(cè)試的相關(guān)內(nèi)容。第三是測(cè)試手段的現(xiàn)代化和多樣化,比如計(jì)算機(jī)輔助測(cè)試、計(jì)算機(jī)化自適應(yīng)測(cè)試等。第四是研究針對(duì)特定人群的等級(jí)標(biāo)準(zhǔn)和HZC分?jǐn)?shù)對(duì)應(yīng),以至開(kāi)發(fā)專門用于特定人群的測(cè)評(píng)子系統(tǒng)。第五是針對(duì)社會(huì)上整理傳統(tǒng)文獻(xiàn)等需求,以及臺(tái)、港、澳和海外漢字應(yīng)用的現(xiàn)狀,研究涉及繁體字的測(cè)評(píng)方案問(wèn)題。

參考文獻(xiàn)

1.教育部 國(guó)家語(yǔ)委 2006 《漢字應(yīng)用水平等級(jí)及測(cè)試大綱》,廣州:廣東教育出版社

2.國(guó)家對(duì)外漢語(yǔ)教學(xué)領(lǐng)導(dǎo)小組辦公室漢語(yǔ)水平考試部 1992 《漢語(yǔ)水平詞匯與漢字等級(jí)大綱》,北京:北京語(yǔ)言學(xué)院出版社

3.張敏強(qiáng) 1998 《教育測(cè)量學(xué)》,北京:人民教育出版社

4.田萬(wàn)海 1995 《數(shù)學(xué)教學(xué)測(cè)量與評(píng)估》,上海:上海教育出版社

5.許嘉璐 1999 《語(yǔ)言文字學(xué)及其應(yīng)用研究》,廣州:廣東教育出版社

6.張一清 2004 《漢字應(yīng)用水平等級(jí)標(biāo)準(zhǔn)》研制報(bào)告,《語(yǔ)言文字應(yīng)用》第1期,56-62頁(yè)

7.孫曼均 2004 漢字應(yīng)用水平測(cè)試用字的統(tǒng)計(jì)與分級(jí),《語(yǔ)言文字應(yīng)用》第1期,63-70頁(yè)

8.Bernard Spolsky 1999 《Measured Words》,上海:上海外語(yǔ)教育出版社

9.Lyle F.Bachman & Adrian S.Palmer 1999 《Language Testing in Practice》,上海:上海外語(yǔ)教育出版社

10.J.Charles Alderson,Caroline Clapham,Dianne Wall 2000 《Language Test Construction and Evaluation》,北京:外語(yǔ)教學(xué)與研究出版社,劍橋大學(xué)出版社

11.Lyle F.Bachman 1999 《Fundamental Considerations in Language Testing》,上海:上海外語(yǔ)教育出版社