一、计算机在语言测试中的应用(论文文献综述)
李颖[1](2021)在《iWrite自动评分与人工评分一致性研究 ——以国才考试撰写邮件为例》文中进行了进一步梳理iWrite是一款针对中国英语学习者设计的自动作文评分系统。根据《中国大学生英语写作能力报告2020》,该系统使用分析型评分(Analytical Scoring)方法对考生作文语言、内容、篇章结构及技术规范进行全面分析。在自动评分和语法纠错两个领域,iWrite关键评测指标处于国内同行产品中的先进水平。然而,iWrite在大规模考试中的自动评分应用尚不多见。本研究旨在以国才考试“撰写邮件”任务为例,使用解释/使用论证模式(Interpretation/Use Argument,简称IUA)模型探讨iWrite自动评分与人工评分在内容、结构和语言维度的一致性,为iWrite在大规模考试自动评分可靠性方面提供证据支持。研究数据来自初、中、高级“撰写邮件”任务评分结果各200份。运用多面拉西模型从多个角度对评分结果进行统计分析,并结合两名国才考试评分员的访谈结果,初步分析自动评分和人工评分不一致的成因。研究结果表明iWrite评分与人工评分一致性较差。初级考试中,iWrite评分与人工评分在内容维度具备一致性,在结构维度打分宽松,语言维度打分严格。中级考试中,iWrite在结构维度和内容维度打分宽松,语言维度打分严格。高级考试中,iWrite在结构维度打分宽松,语言、内容维度打分严格。结合访谈内容分析,产生差异的原因和iWrite在不同应用情景中判断内容是否切题、格式是否规范的能力有关。此外,iWrite和国才考试在内容、结构、语言三个评分维度中得分权重、严厉度的不同也对一致性造成影响。研究结果对iWrite评阅类似测试任务有一定参考意义。
姜秀娟[2](2021)在《英语教师证书考试文学素养测试任务效度研究》文中进行了进一步梳理本研究中的文学素养测试任务是中国外语测评中心正在研发的“英语教师证书考试”的一部分,拟测量职前中学英语教师用于理解与赏析英语故事类文学作品的文学素养。本研究旨在验证该测试任务的效度,以确保其开发质量。基于论证的模式是当今语言测试效度验证的前沿模式,能够较好地保证效度验证结论的说服力。但现有效度论证框架均用以指导整项测试效度验证,不适合直接用于开发阶段测试任务效度验证。因此,本研究以Bachman&Palmer(2010)的AUA框架为理论指导,立足测试任务开发阶段构念界定、任务设计和评分标准制定三大核心环节,聚焦分数解释有意义性、概括性和评分一致性,构建语言测试任务开发与效度论证框架。根据该框架中测试任务设计和评分标准制定推理证据收集的需要,确定研究方法。本研究采用探究性次序式混合研究设计,通过质性和量化研究相结合的方法获取效度证据。质性研究方面,分析6名专家参与的焦点小组访谈录音转写文本,探究测试内容的相关性、取样的充分性以及任务特征的恰当性;分析59名试测对象的作答文本,判断测试任务充分考查拟测文学素养以及试测对象的作答反映评分标准各等级关键特征的程度;分析5名评分员的反馈信息,考察评分标准的可靠性和可操作性。量化研究方面,对5名评分员评阅出的30份答卷的分数进行多面Rasch模型分析,判断测试任务的区分性、评分标准等级划分的恰当性以及评分一致性;就上述分数进行Pearson相关分析,进一步检验评分员间的一致性;将5名评分员对不同水平组试测对象的测试表现打出的分数进行K多个独立样本检验,验证试测对象的测试表现与评分结果间的一致性。研究结果表明,测试任务具有代表性和区分性,说明测试任务设计恰当;评分标准具有较好的可靠性和可操作性,各等级难度设置恰当、区分性较好,评分员自身以及评分员之间的一致性达到理想水平,不同水平组试测对象的测试表现与其分数之间存在显着高度正相关关系,说明评分标准制定得当。上述证据均用于支撑效度论证框架内的相应主张及其理由,形成自上而下从“测试任务构念界定”到“分数”、自下而上从“分数”到“分数解释有意义性”的双向闭合推理链,测试任务效度得以验证。本研究提出的语言测试任务开发与效度论证框架,可在一定程度上弥补现有效度验证框架的不足,为开发阶段的语言测试任务效度论证提供一些启示和指导;采用读、写、说相结合的综合型测试任务形式,全面考查职前中学英语教师理解与赏析英语故事类文学作品应具备的文学素养,对我国现行英语教师资格考试设计的完善以及职前英语教师教育中相关能力的培养与评价均具有一定参考价值和启示意义。
刘美美[3](2020)在《计算机适应性在语言测试中的应用及其流程》文中提出计算机适应性测验是现代测量理论与计算机技术相结合的产物,作为一种新型测验逐渐应用于教育测验中。它能通过计算机中项目反应理论对个体进行能力估计,自动选择出最适合的题目来测量和估计个体的能力水平。本文将对计算机适应性测验的六个基本组成:项目反应理论模型、题库建设、初始项目的选择、选题策略、能力估计方法和测验终止规则进行阐述并介绍其在语言测试中的应用。计算机适应性测验在语言测试中的应用对语言测试的理论、教学实践等都有重要意义。
教育部[4](2020)在《教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知》文中研究说明教材[2020]3号各省、自治区、直辖市教育厅(教委),新疆生产建设兵团教育局:为深入贯彻党的十九届四中全会精神和全国教育大会精神,落实立德树人根本任务,完善中小学课程体系,我部组织对普通高中课程方案和语文等学科课程标准(2017年版)进行了修订。普通高中课程方案以及思想政治、语文、
曾琴[5](2020)在《泰国初中汉语综合课成绩测试现状调查与研究》文中研究指明作为汉语教学中不可缺少的部分,成绩测试是评估学生汉语能力的重要手段。高质量、有效的成绩测试能在教学中发挥积极作用,促进教学的发展。综合课作为泰国初中汉语教学中开设最多的课型,教学过程中的成绩测试环节值得关注。本文首先通过问卷调查收集了泰国初中汉语综合课成绩测试从研发到实施整个过程的情况,对测试现状进行一个整体描述。之后以三所学校为具体案例,收集了学校初一至初三的汉语综合课期末试卷,对试卷内容和质量进行分析研究。调查和研究结果显示,泰国初中的汉语教学目前在成绩测试环节存在较多问题:第一,参与测试的主体对成绩测试不重视,很多泰国学校规定汉语课程的最低分,成绩测试的分量不足;第二,编制试题的教师缺乏测试相关理论,导致试题的有效性不高;第三,测试的各个主体对测试结果的使用不够,未能发挥出成绩测试的后效作用。针对以上问题,本文从几个方面给出了相应的对策,期望提高大家对成绩测试的重视程度,解决其中的问题,使得成绩测试更加科学有效,从而推动汉语教学在泰国的进一步发展。
梁鹏程[6](2020)在《汉英翻译学习电子词典场景融合设计研究》文中研究说明随着“一带一路”倡议和中国文化“走出去”战略的实施,学习者翻译能力的培养成为我国新时期大学英语教学的重要内容之一。当今,在大学英语教学改革过程中,翻译能力等级量表已被纳入《中国英语能力等级量表》,作为评估学习者英语语言能力的一项重要指标。然而,长期以来,我国大学英语翻译教学一直存在师资短缺、课程设置不够合理、教学和学习资源不足等问题,这些现实问题在很大程度上制约了大学英语翻译教学质量的有效提升。这其中,面向翻译学习者的学习资源建设亟待加强。双语学习词典是二语学习的重要辅助工具,而翻译学习词典对翻译学习者的帮助更具针对性。为更好地满足翻译学习者的需求,双语翻译学习词典应具备辅助翻译过程中的语言理解与产出的双重功能。然而,就国内外双语词典编纂情况而言,专门面向翻译学习者设计的专项类汉英翻译学习词典并不多见。因此,我国翻译学习者大多使用的是通用型汉英语文词典,而它们在适用性方面存在诸多不足。首先,我国汉英词典编纂实践大多是依据汉语单语词典为蓝本,以汉英词汇单位之间的语义译释为主,未能充分考虑用户翻译学习的特殊需求。其次,我国汉英词典编纂与出版多限于传统纸质媒介,未能充分对接当下信息时代学习者词典使用电子化的新需求。这些问题的背后是双语电子词典相关理论与实践研究的滞后。事实上,国内有关汉英电子词典或汉英词典电子化的研究几乎处于空白状态,更不用说是面向翻译学习者的汉英翻译电子词典方面的研究。因此,研究如何设计一款汉英翻译学习电子词典,对于翻译学习者的能力发展和双语词典编纂设计模式创新,都具有相当的必要性和重要性。本研究就面向中国大学英语学习者的汉英翻译学习电子词典的创新编纂设计做初步探索,旨在探索目标词典的设计原则,具体包括三个研究问题,设计什么样的词典?这样的词典如何设计?词典设计效用如何?针对研究问题,本研究采用了理论研究和实证研究相结合的路径。理论研究法主要用来厘清目标词典的设计特征,构建目标词典的设计框架及设计原则,实证研究主要用来测试词典设计效用。本研究的主要研究发现为汉英翻译学习电子词典的设计特征、设计框架及设计原则,和设计效用的测试方法。汉英翻译学习电子词典设计特征主要体现在其编纂设计的关键要素,主要涉及词典类型定位、媒介功能和用户需求三个方面。其中,类型定位明确了词典类型特征,媒介分析有助于确定词典媒介在存储和呈现信息方面的特殊性,用户需求探讨可帮助确定词典内容选择和结构设计特征。我们的探讨结论是目标词典在类型上属于专项类学习词典,服务于非英语专业翻译学习者,应具备翻译学习过程中的解码与编码双重功能。作为电子词典,该类词典具有储存空间大、呈现界面灵活、交互性强的特点,以及便于其他学习工具进行集成的特性,能够形成一部集成多类词典的翻译学习系统或学习工具箱。汉英翻译学习电子词典场景融合设计框架及原则是本研究的最主要研究发现,这方面的探讨主要基于设计学的场景化设计理论,词典功能论和词典交际论。本研究的结论是汉英翻译学习电子词典必须采用场景融合设计路径,即词典使用场景和设计场景进行融合的设计路径。具体而言,本研究认为,目标词典设计要以词典应有设计特征和现有类型相近的词典为起点,设计一个初始词典并对该词典在翻译过程中的使用场景进行调查和分析。在分析词典使用场景的基础上,归纳翻译学习场景中的词典使用过程模型。由此,结合词典设计视角和词典使用视角提炼出汉英翻译学习电子词典的场景使用特征,即该类词典功能的过程复杂性和词典交际的人机交互性。目标词典的场景使用特征则进一步催生了词典内容设计和结构设计中的基本原则,即词典内容设计方面的可学性、适用性和系统性原则,以及词典结构设计方面的灵活性、层次性和交互性原则。在这个设计框架中,词典设计始于翻译学习场景中目标用户词典使用过程之初,词典使用场景观察阶段就有了设计的介入,是一种过程性融合设计。在词典设计效用测试过程中,设计场景和使用场景的融合保证了词典设计评价的完整性。词典效用测试方法是本研究的第三个研究发现。根据场景融合设计框架,本研究提出词典原型的形成及词典设计可用性细则的确定要采用迭代设计方法,即设计-测试-再设计-再测试的过程。因此,效用测试包括了词典使用过程和结果的观察与分析,来自用户的外部评价与来自编者的词典设计主体知识,这就保证了效用评价的完整性和准确性。本研究的多重启示体现在理论、实践和研究方法三个方面。在理论方面,本研究引进了设计学中的场景化设计理论,对词典用户研究、词典功能理论和交际理论进行了有机整合,提出了一个基于词典设计场景和词典使用场景融合的创新设计框架,对于丰富(双语)词典设计研究理论有积极贡献。在实践方面,本研究确立了汉英翻译学习电子词典的场景融合设计原则,具有鲜明的应用指向。本研究针对设计原则的效用测试为词典编纂实践应用提供了一种可操作路径,而代表性样条设计则对电子词典编纂实践中的词典结构和内容设计也有直接的参考价值。在研究方法方面,本研究将基于设计者视角的“自上而下”的设计路径和基于词典使用场景的“自下而上”的设计路径相结合,两种设计路径扬长避短、有效互补,具有设计方法创新优势。本研究还借鉴了设计学、词典学和翻译教学等跨学科研究方法。这种跨学科和综合性的研究方法将对其他类型词典设计研究也有一定的借鉴意义。
李慧敏[7](2020)在《基于IRT的来华留学生CAT分级测试研究》文中研究表明在“一带一路”倡议的深入推进下,世界汉语教学蓬勃发展,来华留学人数稳步增长。分级测试作为教学开展前的前瞻性测试,对后续教学的顺利开展有着举足轻重的作用。当前互联网技术发展迅速,计算机自适应性测验有了实现的可能。基于IRT的来华留学生CAT分级测试的研究对于提高分班的信度和效度,减轻分班的工作量,增强对不同汉语能力及水平的留学生的教学针对性,以提升老师的教学效果以及学生的学习效率具有理论和实践意义。本文的研究工作主要分为三个阶段,第一阶段对语言测试、第二语言分级测试以及计算机自适应性分级测试的国内外研究现状进行了总结和分析,在此基础上通过对国内外语言标准化测验的试卷结构、题型结构和题型频次的统计和分析,确定了成分和技能相结合的试卷结构,具体包括词汇、语法、听力理解和阅读理解四个部分。第二阶段的工作为试题开发,首先通过对比分析,建立了《目标汉语基础篇》系列教材和新HSK各等级语言能力水平对照表,接着在教材和新HSK共有词及语法点的基础上,确定了试题的测试点范围,在此基础之上,根据CAT测试的特性确定了具体题型并进行了具体试题的开发。第三阶段的工作为题库建设,首先通过汉语国际教育云平台进行试题库录入、组卷、试题发布以及试卷的回收和批阅等工作,再综合运用EXCEL、SPSS、BILOGMG3.0等软件进行数据统计、项目反应理论的假设检验、试题的参数估计和题目质量分析等工作,从而剔除劣质试题,建立题库。本文的研究工作表明:基于项目反应理论、依托计算机云计算的线上测试方式是当前最适合来华留学生分级测试的考试形式。首先,就测试形式而言,只需具备手机/电脑、网络两个条件,就能随时随地进行分级测试;其次,就试卷结构而言,成分和技能相结合的分立式笔试形式,能够精确评定语言能力水平;第三,就题型设置而言,四选一题型在作答时具有方便、快捷的特点,可实现自动阅卷评分;最后,就分班工作而言,基于IRT的CAT分级测试形式能够实现人力物力资源的节约,而且教学机构有更充足的时间合理安排班级和师资、制定教学计划。本文的创新之处在于:首先,构建了国内外语言标准化测验的试卷结构、题型结构和题型频次的对比表;其次,建立了《目标汉语基础篇》系列教材和新HSK各等级语言能力水平对照表;第三,开发了480道适用于计算机自适应性测试的试题;第四,依托云平台开展线上预测试工作;第五,运用项目反应理论的方法筛选试题,构建了可应用于计算机自适应性测验的题库。本文的不足之处包括两方面,首先没有构建基于网络的自动分题系统;其次,部分题型的设置需要进一步斟酌。
李玲蔚[8](2020)在《高考语文测试对国民汉语能力测试系统建构的启示》文中指出汉语是世界上使用人口最多的语言,迄今为止,国民汉语能力测试问题还未有专门、系统的研究。基于此,本文分三个部分讨论高考语文测试对国民汉语能力测试系统构拟的启示:其一,文章界定了国民汉语能力专指国民的现代汉语通用语能力。其次,文章对比分析了现有的汉语能力标准,认为汉语能力标准分为六个等级,A级-学前水平;B级-小学毕业水平;C级-医生等职业汉语水平;D级-行政管理等职业汉语水平;E级-资深语文教师等职业汉语水平;F级-专业主持人等职业汉语水平。然后,笔者阐释了国民汉语能力测试的性质与用途、测试目的与对象等内容,认为国民汉语能力测试的核心目的是检测国民的汉语言能力,试题应以语言为主,淡化文学文化内容。其二,文章结合高考真题及高考文件分析了高考语文测试在测试内容、测试题型与分值、试题命制、评分标准以及测试对象方面对国民汉语能力测试的启示。在测试内容方面,需要测试语言基础知识和运用知识;测试理解能力、信息处理能力以及思维认知能力。在测试题型与分值方面,书面理解倾向于客观题,书面表达倾向于主观题,还可以引入新题型,测试应该回归语言作为信息工具这一根本。在试题命制方面,应该设计典型的、多样的、综合的、创新的、实用的语言任务,以情境为载体,注重命题材料的真实性和丰富性,以测试对象特征为导向。其三,文章构拟了国民汉语能力测试系统,大致从测试的知识点与能力层级、分项设计与总体结构等方面展开。测试的知识点包括语言基础知识和语言运用知识;按年龄将测试对象划分为儿童、青少年、中青年、老年四类,每一类分布不同的能力层级。在分项设计部分,从测试内容和测试方法两方面分别阐释了各项技能的测试内容、题型结构、命题思路等内容,根据测试对象的不同特点区分了Ⅰ、Ⅱ、Ⅲ、Ⅳ卷,每类试卷的命题材料以测试对象群体特点为导向,Ⅰ卷与Ⅱ、Ⅲ、Ⅳ卷的题型结构有所区别;在总体结构部分,进一步阐释了国民汉语能力测试的整体面貌。
代佳旭[9](2019)在《针对高校汉语进修生的安置性测试设计 ——以辽宁大学为例》文中研究说明随着“中国热”和“汉语热”在世界范围内的升温,每年都有数以十万计的留学生来到中国高校进行汉语进修。为了更好地针对这些汉语水平参差不齐的汉语进修生开展个性化的汉语教学活动,各学校应结合实际情况,实施科学的安置性测试,进行合理地分班安置。绪论部分首先结合目前高校来华汉语进修生的现状对安置性测试在汉语作为第二语言教学的意义进行了简要分析,对语言测试的发展脉络进行了梳理,并对语言测试、语言能力标准及语言学能的定义进行了概述。第一部分对于语言测试,汉语测试和汉语作为第二语言教学的安置性测试的相关研究进行了文献综述。第二部分针对高校汉语作为第二语言教学的安置性测试现状进行了网上问卷调查,根据调查对安置性测试性质、形式、试卷构建现状进行了分析。第三部分根据调查问卷分析结果并结合语言测试理论,从测试设计的针对性、能力考察的综合性、命题评分的科学性三个方面总结了针对高校来华汉语进修生的安置性测试的设计原则。第四部分则根据设计原则制定了针对辽宁大学汉语进修生的安置性测试设计方案,包括命题范围、测试过程、测试形式、题型选择及题库建设的具体设想并据此设计了四套样卷。第五部分对样卷中的试题类型和评分标准进行了分析和描述。主要结合测试的设计原则、测试理论及测试目的进行分析。第六部分是反思与展望。对测试研究中存在的问题和研究的局限性进行了总结,对未来研究的方向进行了展望。最后在结语部分对安置性测试的研究结论进行了总结。
童扬芬[10](2018)在《语言测试公平性研究:理念构建与检测应用》文中研究指明测试作为一种实践活动,“是实现人的社会化和人的社会价值的重要手段,也是人类社会演进发展不可或缺的机制”(廖平胜,2003:1)。追求公平是各种测试的重要目标之一,人们通过实施科学、公正、严格的测试以实现这一重要目标。随着人们对测试评估标准认识的扩展,测试公平性的研究受到越来越多的关注和重视。作为教育测试中的一员,语言测试是用来检测语言学习者的语言水平、语言能力和学习效果的一种测量工具,由于语言既是测试的内容,同时亦是测试的媒介,其测试公平所涉及的因素较之其它测试更为复杂,可以说语言测试既是一门社会科学,又是一门实践活动。教育评估领域早在上世纪60年代已经出现对公平性的关注(Angoff,1993),语言测试界对于公平性的讨论始于上世纪90年代(Kunnan,2000),国际语言测试协会(LTRC)1997年年会因其以此为主题而被普遍认为是语言测试公平性研究开始的标志。在我国,把考试作为一门学科来进行研究始于上世纪80年代,对于测试公平性的研究大致从上世纪90年代后期开始(戴家干,2010:27),语言测试领域关注公平性大致也是始于彼时。在相关的研究中,从教育制度和政策角度对教育测试的公平性所进行的讨论最多(详见第二章);在国内所有关于教育测试公平性的探讨中,针对语言测试公平性的系统理论研究尚缺,外语测试界对公平问题进行的研究亦非常少,语言测试的社会性和伦理问题方面的研究等在国内几乎是空白或者处于起步阶段(谢赛、陈贺文,2016:143)。目前,教育界均认可公平性检验的重要性和必要性,但是在很多方面仍难达成共识,例如:公平性检测的有效实践性和公众感知度如何得到体现?其核心体现的问题仍在于:公平性究竟可不可以被检验?应该如何检验?本研究的目的是为了构建一套适用于我国语言环境和测试特点的公平性评价标准。世界上很多专业的测试机构已经出台和使用了较为成熟的测试评估标准用以指导测试实践,在这些评估标准中均涉及公平性审查和质量控制准则,然而我国截至目前尚未见类似文件出现。本研究将在现有研究成果的基础上,对公平性研究中的核心问题进行讨论,并尝试提出中国测试环境下语言测试公平性的检验框架。本研究拟对以下问题进行研究:1)世界上已经出台和使用的语言测试标准中有关公平性审查和质量控制的标准有哪些?这些标准对于我们开发适合我国国情和考试特点的标准有何借鉴?本研究将对公平性概念进行较为全面的评述,旨在为测试公平性验证提供一个理论和方法的框架,构建中国语境下测试公平性研究的理论模型。2)语言测试的利益相关群体对公平性的认识如何?这些认识对于我们确定公平性检验的具体标准有何启发?我们将对语言测试最重要的利益相关群体,即考生对公平性的认识和评价进行调查,通过调查进一步明确公平性应当涵盖的因素。3)语言测试公平性检验的模型应当如何构建?具体审查的细则应当包含什么内容?模型将如何在测试的开发和实施中践行并具有良好的可操作性?本研究将探索构建符合中国考试特点的公平性检测应用框架。为了对以上问题进行回答,本研究将分四步进行设计。首先,本研究将搜集并系统回顾语言测试标准中涉及到公平性审查和检测的文献或者具体条款,并对当前存在的公平性框架进行分析、解读和评述,通过对这些文献细致和系统的回顾,梳理目前公平性研究和实践的整体状况,拟探讨这些理论或者标准对于我国测试公平性实践的指导价值。在第二阶段对语言测试最重要的利益相关群体,即考生对公平性的认识和评价进行调查,通过调查进一步明确公平性应当涵盖的因素,为下一步分析公平性的影响因素和构建公平性检验的具体项目提供客观的参考依据,调查发现:学生总体上对公平性审查和检测的看法较为积极,认为测试任务设计的公平性很重要,制定公平性原则对于确保测试质量和公正是必要的和必须的。在第三阶段,根据前两个阶段的研究成果,我们将查阅国内外各类语言考试的试题,如:雅思(IELTS)、托福(TOEFL)、赛达(SAT)、大学英语四六级考试(CET4&6)、汉福(HSK)、各级各类学业课程考试等,查找相关题目对公平性影响因素进行分析,详细解读导致不公平性的原因,并在此基础上构建了公平性模型,并尝试构建适合于操作的公平性审查的参考条目及具体方法。由于在现阶段我国测试环境下,相关利益群体各方的责、权、利等无法真正做到有效兼顾,因此公平性标准无法形成相对统一的表述,这决定了我们拟构建的准则不可能是强制性的,而只能是启发性的,构建公平性审查准则的主要目的在于提高专业群体和公众群体的公平性意识以及传播可践行的保障措施。笔者认为:测试的公平性是指在测试流程中确保受试群体和个体同等测试机会的构念相关因素,它既包括测量技术检验的公平性,也包括社会价值判断的公平性;语言测试的公平性检验理应贯穿于测试的整个流程之中,在我国现实测试环境下,语言测试公平性的检测框架应当涵盖对测试开发者、使用者和应试者责权利的界定,在应用实践中需要同时考虑技术公平性需求和社会公平性需求,进行测量技术检验和人工价值判断,并将检验的结果对社会公布并接受监督。建立完善的公平性检测报告制度不仅是提高测试质量的必要举措,亦是保障社会公正的重要措施。第四步,采用构建的模型尝试对一份测试试卷的公平性进行了检验。研究过程中,本文采用了以下研究方法:1)文献分析法。研究梳理了当前国内外的研究成果及最新动态,重点分析了以ETS等世界知名教育考试机构已出台并实施的测试评估指导文件,从中吸取可资借鉴的成分,并由此提炼影响测试公平性的主要因素。2)问卷调查法。研究采用了调查问卷,对初步形成的公平性影响因素进行广泛的征求意见,以对其进行修订和补充。问卷以语言测试公平性标准和评估检验办法为主要内容,调查考生作为测试利益最高相关群体对标准和检验方案的态度、意见和建议。调查采取随机抽样方案,样本量200人以上,采用里克特5点量表设计问卷,回收后由课题组人员进行统计分析。3)案例分析法。在本研究中,对试题公平性进行分析的过程中列举了大量例题,并按照不同影响因素类别产生不公平的结果予以解析,清晰地展示了解公平性影响因素是如何对测试结果差异产生影响的过程。4)深度访谈法。该方法用于了解测试流程各个环节中的可能导致的不公平因素,一对一深度访谈对象为3人,采取半结构性访谈;研究者现场记录,事后对文字数据进行了分析。通过以上方法的研究,笔者认为:测试的公平指在测试流程中确保受试群体和个体同等测试机会的构念相关因素,它既包括测量技术检验的公平性,也包括社会价值判断的公平性。测试公平性理论原则探讨的重要内容应包括用于规范所有测试者伦理道德的职业规范,而实践准则是指用于指导具体测试行为的实施准则。语言测试应当区分不同阶段的公平性,每一个阶段的公平性的具体内涵应当有侧重点的不同。测试前,开发者对测试内容的公平负完全责任,他们需要在材料选取和试题命制上保障对于所有考生的公平,而测试实施阶段的公平主要责任在于测试的实施者,测试之后对于结果使用的公平决断权在于测试结果的使用者。在应用实践中,需要同时考虑技术公平性需求和社会公平性需求,对主要方面进行测量技术检验和人工价值判断。本研究最重要的尝试在于构建了一个适用于目前国内语言测试环境的检验框架,并将公平性检验的要素细化、制成校对量表,克服了测试质量检测依靠技术检验不易操作和普及的问题。毕竟对于一线的测试践行者们而言,这样的指导细则能够将抽象的公平具体为可评估的细则,能够降低公平性审查过程中的主观性(Zieky,2006)。
二、计算机在语言测试中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、计算机在语言测试中的应用(论文提纲范文)
(1)iWrite自动评分与人工评分一致性研究 ——以国才考试撰写邮件为例(论文提纲范文)
摘要 |
Abstract |
致谢 |
1 引言 |
1.1 选题背景和研究意义 |
1.2 现有研究和本研究创新之处 |
1.3 研究内容、研究方法及文章框架 |
2 研究回顾 |
2.1 自动作文评分系统(AES)的研究情况 |
2.1.1 自动作文评分系统应用于国外写作任务的研究 |
2.1.2 自动作文评分系统应用于国内写作任务的研究 |
2.2 iWrite自动作文评分系统的研究情况 |
2.2.1 iWrite自动作文评分系统 |
2.2.2 现阶段关于iWrite评分的研究 |
2.3 iWrite评价国才考试(ETIC)的研究情况 |
2.3.1 国才考试 |
2.3.2 现阶段iWrite应用于国才考试写作任务的研究 |
2.3.3 现阶段iWrite评价国才考试研究的局限性和解决办法 |
2.4 总结 |
3 研究设计 |
3.1 研究目的 |
3.2 研究问题 |
3.3 被试与评分员 |
3.4 研究方法 |
3.4.1 访谈 |
3.4.2 多面拉西模型 |
3.5 数据搜集 |
3.5.1 人工评分 |
3.5.2 机器评分 |
3.6 数据分析 |
4 研究结果 |
4.1 初级撰写邮件任务iWrite评分与人工评分在各维度上一致性 |
4.1.1 iWrite和人工评分在内容、结构、语言维度上一致性情况 |
4.1.2 评分员与被试情况 |
4.2 中级撰写邮件任务iWrite评分与人工评分在各维度上一致性 |
4.2.1 iWrite和人工评分在内容、结构、语言维度上一致性情况 |
4.2.2 评分员与被试情况 |
4.3 高级撰写邮件任务iWrite评分与人工评分在各维度上一致性 |
4.4 访谈结果 |
5 讨论 |
6 结语 |
参引文献 |
附录 |
附录1 2019年国才考试撰写邮件写作任务题目 |
附录2 访谈 |
(2)英语教师证书考试文学素养测试任务效度研究(论文提纲范文)
致谢 |
提要 |
Abstract |
缩略语表 |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的 |
1.3 研究问题 |
1.4 研究意义 |
1.5 论文结构 |
第二章 文献综述 |
2.1 中学英语教师的典型文学素养 |
2.1.1 文学素养 |
2.1.2 中学英语教师典型文学素养的界定及其内涵 |
2.1.3 中学英语教师典型文学素养的构成要素 |
2.2 文学素养测试 |
2.2.1 文学科目考试中的文学素养测试 |
2.2.2 英语教师证书考试中的文学素养测试 |
2.3 综合型测试任务研究 |
2.4 文学素养测试任务效度研究 |
2.5 效度及效度验证框架 |
2.5.1 效度及其内涵的演变 |
2.5.2 效度验证框架 |
2.6 本章小结 |
第三章 研究方法 |
3.1 研究对象 |
3.1.1 英语教师证书考试文学素养测试任务 |
3.1.2 英语教师证书考试文学素养测试任务评分标准 |
3.2 研究设计 |
3.2.1 混合研究法 |
3.2.2 探究性次序式设计 |
3.3 研究参与者 |
3.3.1 受访专家 |
3.3.2 试测对象 |
3.3.3 评分员 |
3.4 研究工具 |
3.4.1 焦点小组访谈提纲 |
3.4.2 评分记录表 |
3.4.3 评分员反馈信息记录表 |
3.5 数据收集与分析 |
3.5.1 专家意见和建议 |
3.5.2 试测对象测试表现 |
3.5.3 评分结果和评分员反馈信息 |
3.6 本章小结 |
第四章 研究结果 |
4.1 测试任务及其评分标准有效性的质性分析 |
4.1.1 测试任务的代表性 |
4.1.2 试测对象对拟测文学素养的运用 |
4.1.3 评分标准的可靠性 |
4.2 测试任务及其评分标准有效性的量化分析 |
4.2.1 多面Rasch模型分析 |
4.2.2 评分结果之间的一致性分析 |
4.2.3 评分结果与试测对象测试表现之间的一致性分析 |
4.3 本章小结 |
第五章 讨论 |
5.1 测试任务效度论证 |
5.1.1 测试任务测量拟测能力的充分性 |
5.1.2 测试任务的区分性 |
5.2 评分标准效度论证 |
5.2.1 评分标准对测量目标的体现 |
5.2.2 评分标准的区分性 |
5.2.3 评分结果的可靠性 |
5.3 本章小结 |
第六章 结论 |
6.1 主要发现 |
6.2 研究贡献 |
6.3 研究启示 |
6.4 研究局限及展望 |
参引文献 |
附录 |
附录1 国外文学素养测试样题及评分标准 |
附录2 测试样题 |
附录3 各等级试测对象作答文本示例 |
附录4 样题(初稿)试测调查问卷 |
附录5 焦点小组访谈提纲 |
附录6 焦点小组访谈录音转写文本示例 |
附录7 评分标准 |
附录8 评分员培训材料 |
附录9 评分记录表 |
附录10 评分员反馈信息记录表 |
附录11 FACETS软件数据分析指令 |
在读期间的研究成果 |
(3)计算机适应性在语言测试中的应用及其流程(论文提纲范文)
一、引言 |
二、CAT的理论基础 |
三、CAT的基本流程 |
(一)项目反应理论模型 |
(二)题库的建设 |
(三)初始题的选择 |
(四)即时能力估计 |
(五)选题策略 |
(六)测验终止标准 |
四、CAT应用于语言测试的意义 |
五、CAT在语言测试中的应用 |
(一)国外CAT在语言测试中的应用 |
(二)国内CAT在语言测试中的应用 |
六、结语 |
(5)泰国初中汉语综合课成绩测试现状调查与研究(论文提纲范文)
摘要 |
ABSTRACT |
绪论 |
第一节 选题缘由 |
第二节 研究意义 |
第三节 研究方法 |
第四节 研究综述 |
一、对外汉语成绩测试相关研究 |
二、泰国汉语成绩测试相关研究 |
第一章 汉语综合课成绩测试理论概述及研发实施 |
第一节 成绩测试的定义及重要作用 |
一、成绩测试的定义 |
二、成绩测试的重要作用 |
第二节 成绩测试的特点 |
第三节 成绩测试的研发与实施 |
一、成绩测试的研发 |
二、成绩测试的实施 |
第四节 成绩测试的质量评估 |
一、测试成绩的分析 |
二、试卷质量的分析 |
第二章 泰国初中汉语综合课成绩测试情况调查 |
第一节 问卷调查设计与内容 |
一、问卷调查的目的 |
二、问卷调查的对象 |
三、问卷调查的内容 |
第二节 问卷调查的操作与实施 |
第三节 问卷结果数据统计与分析 |
一、问卷结果数据统计 |
二、问卷结果具体分析 |
第三章 泰国初中汉语综合课成绩测试试卷分析 |
第一节 试卷收集基本情况说明 |
第二节 泰国初中汉语综合课试卷内容分析 |
一、试卷总体构成 |
二、题型分析 |
第三节 泰国初中汉语综合课试卷质量分析 |
一、难易度(facility value) |
二、信度(reliability) |
三、效度(validity) |
第四节 小结 |
第四章 成绩测试现存问题及解决对策 |
第一节 泰国初中汉语综合课成绩测试现存问题 |
一、泰国教育部方面 |
二、泰国学校方面 |
三、汉语教师方面 |
四、泰国学生方面 |
五、成绩测试试题方面 |
第二节 针对现存问题的解决对策 |
一、提高对汉语成绩测试的重视程度 |
二、加强汉语教师的测试理论知识储备 |
三、提高汉语成绩测试试题的有效性 |
四、合作建立汉语成绩测试题库 |
结语 |
附录一:泰国初中汉语综合课成绩测试现状问卷调查 |
附录二:汉语教师访谈提纲 |
参考文献 |
致谢 |
(6)汉英翻译学习电子词典场景融合设计研究(论文提纲范文)
摘要 |
Abstract |
缩略语 |
第一章 绪论 |
1.1 研究背景 |
1.2 研究对象 |
1.3 研究目标 |
1.4 研究方法 |
1.5 论文结构 |
第二章 文献综述 |
2.1 核心术语界定 |
2.1.1 词典设计 |
2.1.2 场景融合 |
2.1.3 电子词典 |
2.1.4 翻译学习者 |
2.2 电子词典研究述评 |
2.3 翻译学习词典研究述评 |
2.4 汉英词典研究述评 |
2.5 学习者翻译能力研究述评 |
本章小结 |
第三章 汉英翻译学习电子词典场景融合设计关键要素 |
3.1 词典类型的场景化定位 |
3.1.1 词典类型定位的复杂性 |
3.1.2 词典目标定位与场景融合设计 |
3.1.3 汉英翻译学习电子词典类型定位 |
3.2 词典媒介功能的场景化实现 |
3.2.1 存储功能与场景化的信息集成 |
3.2.2 动态特征与场景化的交互界面设计 |
3.2.3 媒介功能与场景化设计的挑战 |
3.3 词典用户需求的场景化锚定 |
3.3.1 使用场景中的用户需求 |
3.3.2 设计场景中的用户需求 |
3.3.3 场景融合设计中的用户需求 |
本章小结 |
第四章 汉英翻译学习电子词典场景融合设计框架 |
4.1 场景化设计理论概述 |
4.1.1 场景化设计的概念及优点 |
4.1.2 场景化设计的理论框架 |
4.2 汉英翻译学习场景的特殊性 |
4.2.1 汉英翻译学习场景考察 |
4.2.2 汉英翻译学习场景相关分析 |
4.3 汉英翻译学习场景中的词典使用特征 |
4.3.1 翻译学习场景中词典功能的过程复杂性 |
4.3.2 翻译学习场景中词典交际的人机交互性 |
4.4 汉英翻译学习电子词典的场景融合设计框架构建 |
4.4.1 场景化设计理论对词典学理论研究的意义 |
4.4.2 词典场景化设计的实践可行性 |
4.4.3 汉英翻译学习电子词典的场景融合设计框架 |
本章小结 |
第五章 汉英翻译学习电子词典场景融合的内容设计 |
5.1 场景融合的内容设计之适用性原则 |
5.1.1 语言知识的适用性 |
5.1.2 翻译知识的适用性 |
5.1.3 帮助信息的适用性 |
5.2 场景融合的内容设计之可学性原则 |
5.2.1 语言知识的可学性 |
5.2.2 翻译知识的可学性 |
5.2.3 语言和翻译知识的整合 |
5.3 场景融合的内容设计之系统性原则 |
5.3.1 语言知识的系统性 |
5.3.2 翻译知识的系统性 |
本章小结 |
第六章 汉英翻译学习电子词典场景融合的结构设计 |
6.1 场景融合的结构设计之灵活性原则 |
6.1.1 检索结构的灵活性 |
6.1.2 存储结构的灵活性 |
6.1.3 呈现结构的灵活性 |
6.2 场景融合的结构设计之层次性原则 |
6.2.1 检索结构的层次性 |
6.2.2 存储结构的层次性 |
6.2.3 呈现结构的层次性 |
6.3 场景融合的结构设计之交互性原则 |
6.3.1 检索结构的交互性 |
6.3.2 存储结构的交互性 |
6.3.3 呈现结构的交互性 |
本章小结 |
第七章 汉英翻译学习电子词典场景融合设计的效用测试 |
7.1 场景融合设计的电子词典样条示例 |
7.1.1 样条的内容设计 |
7.1.2 样条的结构设计 |
7.2 词典场景融合设计的有效性测试 |
7.2.1 测试目的 |
7.2.2 测试材料 |
7.2.3 测试用户 |
7.2.4 数据收集 |
7.2.5 测试过程 |
7.2.6 结果和讨论 |
7.2.7 词典设计效用测试总结 |
7.3 修正后的场景融合设计框架及样条示例 |
7.3.1 修正后的电子词典设计框架 |
7.3.2 修正后的词典样条示例 |
本章小结 |
第八章 结论 |
8.1 本研究的主要发现 |
8.1.1 汉英翻译学习电子词典的关键设计特征 |
8.1.2 汉英翻译学习电子词典场景融合设计框架 |
8.1.3 汉英翻译学习电子词典样条的效用测试方法 |
8.2 本研究的主要启示 |
8.2.1 本研究的理论意义 |
8.2.2 本研究的实践意义 |
8.2.3 本研究的方法意义 |
8.3 本研究的主要不足 |
8.4 对后续研究的建议与展望 |
参考文献 |
攻博期间发表的论文 |
致谢 |
(7)基于IRT的来华留学生CAT分级测试研究(论文提纲范文)
摘要 |
abstract |
绪论 |
一、问题的提出 |
二、选题意义 |
三、理论基础 |
(一)语言学和心理学基础 |
(二)项目反应理论(IRT) |
四、研究方法 |
五、研究思路 |
第一章 相关研究综述 |
第一节 语言测试的相关研究 |
一、语言测试的发展历程 |
二、国内外语言测验结构分析 |
第二节 分级测试的相关研究 |
一、汉语作为第二语言的分级测试 |
二、英语作为第二语言的分级测试 |
第三节 计算机自适应性分级测验的相关研究 |
一、计算机自适应性汉语分级测验的研究现状 |
二、计算机自适应性英语分级测验的研究现状 |
第二章 试题开发 |
第一节 考试对象 |
一、考生数量 |
二、考生水平 |
第二节 考试形式及内容范围 |
一、考试形式 |
二、考试的内容范围 |
第三节 试卷结构及考试题型 |
第三章 题库建设 |
第一节 预测试 |
一、试题的编制和审定 |
二、试题库的建设 |
三、预测试的实施 |
第二节 假设检验及参数估计 |
一、Logistic模型简介 |
二、参数估计 |
(一)单维性检验 |
(二)参数估计及试题筛选 |
结语 |
参考文献 |
致谢 |
(8)高考语文测试对国民汉语能力测试系统建构的启示(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 选题缘由与选题意义 |
1.1.1 选题缘由 |
1.1.2 选题意义 |
1.2 选题研究现状 |
1.2.1 国民汉语能力测试相关研究 |
1.2.2 高考语文测试的相关研究 |
1.2.3 研究创新点 |
1.3 研究思路与方法 |
1.3.1 研究思路 |
1.3.2 研究方法 |
2 国民汉语能力相关问题 |
2.1 国民汉语能力概述 |
2.1.1 汉语能力与语文能力 |
2.1.2 汉语能力与汉语知识 |
2.1.3 国民汉语能力 |
2.1.4 国民汉语能力标准 |
2.2 国民汉语能力测试 |
2.2.1 国民汉语能力测试的性质与用途 |
2.2.2 国民汉语能力测试的目的 |
2.2.3 国民汉语能力测试的对象 |
2.2.4 国民汉语能力测试的媒介与结果报告 |
3 高考语文测试对国民汉语能力测试的启示 |
3.1 测试内容 |
3.1.1 必备知识 |
3.1.2 关键能力 |
3.2 测试题型与分值分布 |
3.2.1 书面理解 |
3.2.2 书面表达 |
3.3 试题命制 |
3.3.1 命题思路与要求 |
3.3.2 命题材料 |
3.4 评分标准 |
3.5 测试对象 |
3.6 小结 |
4 国民汉语能力测试构拟 |
4.1 国民汉语能力测试的知识点整理 |
4.2.1 语言基础知识 |
4.2.2 语言运用知识 |
4.2 国民汉语能力测试的能力层级 |
4.3 国民汉语能力测试的分项技能设计 |
4.3.1 阅读测试 |
4.3.2 听力测试 |
4.3.3 写作测试 |
4.3.4 口语测试 |
4.4 国民汉语能力测试的总体试题结构 |
4.5 国民汉语能力测试工具的效度问题 |
5 结语 |
参考文献 |
致谢 |
(9)针对高校汉语进修生的安置性测试设计 ——以辽宁大学为例(论文提纲范文)
摘要 |
ABSTRACT |
绪论 |
0.1 研究背景及意义 |
0.2 理论基础 |
0.2.1 语言测试 |
0.2.2 语言能力及语言能力标准 |
0.2.3 语言学能理论 |
0.3 研究内容及方法 |
1 相关研究综述 |
1.1 语言测试的相关研究 |
1.1.1 语言测试的参照标准 |
1.1.2 关于测试类型与题型的研究 |
1.1.3 关于信度与效度的研究 |
1.2 关于汉语作为第二语言测试的研究 |
1.2.1 研究发展历程 |
1.2.2 研究现状 |
1.3 汉语作为第二语言安置性测试的研究 |
1.3.1 关于测试内容的研究 |
1.3.2 关于测试形式的研究 |
1.3.3 关于测试结果的研究 |
2 高校汉语作为第二语言教学的安置性测试现状调查 |
2.1 调查实施 |
2.2 调查结果 |
2.2.1 测试的目的与内容 |
2.2.2 测试的形式 |
2.2.3 测试的命题构建 |
2.3 调查结论 |
3 针对高校汉语进修生的安置性测试设计原则 |
3.1 测试设计的针对性 |
3.2 能力考察的全面性 |
3.3 测试设计的科学性 |
3.3.1 命题和评分的规范性 |
3.3.2 测试方法选择的科学性 |
3.3.3 语言测试的真实性 |
4 针对辽宁大学汉语进修生的安置性测试设计方案 |
4.1 命题范围 |
4.2 测试形式选择及试卷结构设置 |
4.2.1 口语测试的形式及试卷结构 |
4.2.2 书面笔试的试卷结构 |
4.2.3 题目说明 |
4.3 测试过程及安置办法 |
4.4 题库建设 |
5 试题分析及评分标准 |
5.1 口语测试试题分析及评价标准 |
5.1.1 初测问答 |
5.1.2 听后复述 |
5.1.3 交际任务和话题表达 |
5.2 书面测试试题分析 |
5.2.1 汉语知识测试 |
5.2.2 汉语技能测试 |
6 反思与展望 |
结语 |
参考文献 |
附录 |
致谢 |
(10)语言测试公平性研究:理念构建与检测应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 研究背景 |
1.2 研究意义 |
1.3 研究内容 |
1.3.1 研究目标 |
1.3.2 具体内容 |
1.4 研究方法 |
1.5 论文结构 |
第二章 文献综述 |
2.1 语言测试评估研究述评 |
2.1.1 国外研究 |
2.1.2 国内研究 |
2.2 语言测试公平性研究述评 |
2.2.1 公平的定义 |
2.2.2 公平的意义 |
2.2.3 国外公平性研究 |
2.2.3.1 研究起源与发展历程 |
2.2.3.2 机构文献 |
2.2.4 国内公平性研究 |
2.3 问题与挑战 |
第三章 语言测试公平性因素调查 |
3.1 研究问题 |
3.2 研究工具 |
3.3 研究对象 |
3.4 数据收集 |
3.5 分析与讨论 |
3.5.1 学生对个体差异公平性的认识 |
3.5.2 学生对测试设计公平性的认识 |
3.5.3 学生对试卷质量公平性的认识 |
第四章 语言测试公平性因素分析 |
4.1 测试设计 |
4.1.1 测试目标 |
4.1.2 测试大纲/说明 |
4.1.3 试卷编制 |
4.1.4 预测分析 |
4.2 试卷质量 |
4.2.1 信度 |
4.2.2 效度 |
4.2.3 区分度 |
4.2.4 难度 |
4.3 考生差异 |
4.3.1 个体特征差异 |
4.3.2 社会生活背景差异 |
4.3.3 学科知识背景差异 |
第五章 语言测试公平性的检验 |
5.1 公平性的界定 |
5.1.1 公平性与伦理 |
5.1.2 公平性与效度 |
5.1.3 公平性与公正性 |
5.1.4 测试使用的公平性 |
5.2 公平性检验的理论模型 |
5.2.1 可比性模型 |
5.2.2 社会公正模型 |
5.2.3 形式模型 |
5.3 公平性检验的应用框架 |
5.4 公平性检验的具体项目 |
第六章 语言测试公平性验证的实证分析:以H省2015年高考英语卷为例 |
6.1 实验设计 |
6.1.1 试卷概况 |
6.1.2 数据收集 |
6.1.3 分析方法 |
6.2 分析与讨论 |
6.2.1 对测试设计公平性的分析 |
6.2.2 对试卷质量公平性的分析 |
6.2.3 对个体差异公平性的分析 |
6.3 结论与建议 |
第七章 语言测试公平性质量保障体系 |
7.1 制度层面 |
7.1.1 法律保障 |
7.1.2 政策保障 |
7.2 理论层面 |
7.2.1 伦理规范 |
7.2.2 行为准则 |
7.3 实践层面 |
7.3.1 技术标准 |
7.3.2 素质保障 |
第八章 结语 |
8.1 研究总结 |
8.2 研究局限 |
参考文献 |
附录1: 缩略语词表 |
附录2: 教育测试评估标准中英文对照 |
附录3: 语言测试评估标准中英文对照 |
附录4: 语言测试公平性调查问卷 |
附录5: 调查问卷描述统计量 |
附录6: 调查问卷各项频数统计 |
附录7: 语言测试公平性检验表 |
附录8: 样卷公平性人工审查表 |
附录9: 样卷试题及答案 |
附录10: 样卷听力部分录音原稿 |
在校期间发表的论文、科研成果等 |
致谢 |
四、计算机在语言测试中的应用(论文参考文献)
- [1]iWrite自动评分与人工评分一致性研究 ——以国才考试撰写邮件为例[D]. 李颖. 北京外国语大学, 2021(09)
- [2]英语教师证书考试文学素养测试任务效度研究[D]. 姜秀娟. 北京外国语大学, 2021(09)
- [3]计算机适应性在语言测试中的应用及其流程[J]. 刘美美. 语言规划学研究, 2020(01)
- [4]教育部关于印发普通高中课程方案和语文等学科课程标准(2017年版2020年修订)的通知[J]. 教育部. 中华人民共和国教育部公报, 2020(06)
- [5]泰国初中汉语综合课成绩测试现状调查与研究[D]. 曾琴. 广西大学, 2020(07)
- [6]汉英翻译学习电子词典场景融合设计研究[D]. 梁鹏程. 南京大学, 2020(04)
- [7]基于IRT的来华留学生CAT分级测试研究[D]. 李慧敏. 大连外国语大学, 2020(07)
- [8]高考语文测试对国民汉语能力测试系统建构的启示[D]. 李玲蔚. 华中师范大学, 2020(02)
- [9]针对高校汉语进修生的安置性测试设计 ——以辽宁大学为例[D]. 代佳旭. 辽宁大学, 2019(01)
- [10]语言测试公平性研究:理念构建与检测应用[D]. 童扬芬. 华中师范大学, 2018(05)