期刊文献+
共找到123篇文章
< 1 2 7 >
每页显示 20 50 100
老年肺癌患者胸腔镜下根治切除术后谵妄发生的列线图模型的建立与评价
1
作者 刘微 关丹丹 张洪岩 《现代肿瘤医学》 CAS 2024年第6期1054-1059,共6页
目的:分析影响老年肺癌患者胸腔镜下根治切除术后发生谵妄的危险因素,基于上述影响因素构建个体化的列线图模型,并验证该列线图模型预测的准确性和临床有效性。方法:回顾性分析2016年01月01日至2021年01月01日我院行胸腔镜下肺癌根治切... 目的:分析影响老年肺癌患者胸腔镜下根治切除术后发生谵妄的危险因素,基于上述影响因素构建个体化的列线图模型,并验证该列线图模型预测的准确性和临床有效性。方法:回顾性分析2016年01月01日至2021年01月01日我院行胸腔镜下肺癌根治切除术的老年肺癌患者临床资料,挑选符合入组的患者,以是否发生术后谵妄为结局变量,探讨患者相关临床指标、围手术期相关指标以及实验相关指标对术后是否发生谵妄的影响,采用单因素以及多因素logistics分析影响老年肺癌胸腔镜下切除术后发生谵妄的危险因素,利用R语言包构建列线图模型,并利用Bootstrap方法以及临床决策曲线验证该模型的准确性和临床决策的获益性。结果:最终纳入284例患者,284例患者中术后发生谵妄的患者为32例,发生比例为11.27%,通过多因素logistics分析显示导致术后谵妄发生的独立危险因素为:COPD病史,PO 2,BMI,ASA分级,术中单肺通气时间,术中丙泊酚用量以及术后地佐辛用量;ROC曲线验证列线图模型显示:构建的列线图个体化预测老年肺癌胸腔镜下切除术后发生谵妄能力较强,其中AUC=0.858,95%CI 0.71~0.92,随后采用Bootstrap方法重复抽样1000次验证列线图,发现校准曲线的平均绝对误差为0.016,说明校准曲线与理想曲线贴合良好;临床决策曲线显示,列线图模型预测老年肺癌胸腔镜下根治切除术后发生谵妄的发生阈值为0.06~0.87之间时该模型图的适用性最佳。结论:影响老年肺癌患者胸腔镜下根治切除术后发生谵妄的独立危险因素为:COPD病史,PO 2,BMI,ASA分级,术中单肺通气时间,术中丙泊酚用量以及术后地佐辛用量,基于上述危险因素构建的列线图模型对于老年肺癌胸腔镜下根治切除术后发生谵妄预测准确,且临床应用价值较高。 展开更多
关键词 胸腔镜 肺癌 谵妄 列线图模型
下载PDF
两种评分量表的评分效应比较研究 被引量:14
2
作者 关丹丹 陈睿 +1 位作者 张开 赵静宇 《教育研究与实验》 CSSCI 北大核心 2011年第4期92-96,共5页
本研究运用多面Rasch模型对比分析了大、小两种评分量表下评分员的评分效应。结果显示,与小尺度评分量表相比,评分员在大尺度评分量表下不能使用全距分值,容易给出趋中分数;而且,在大尺度评分量表下评分员间的评分一致性较差。据此,提... 本研究运用多面Rasch模型对比分析了大、小两种评分量表下评分员的评分效应。结果显示,与小尺度评分量表相比,评分员在大尺度评分量表下不能使用全距分值,容易给出趋中分数;而且,在大尺度评分量表下评分员间的评分一致性较差。据此,提出应改进我国各项考试中写作评分量表的设置,并单独报告写作成绩的建议。 展开更多
关键词 写作评分 评分误差 多面RASCH模型 评分量表
下载PDF
立足“四个评价”、服务“五类主体”进一步深化高考评价改革 被引量:9
3
作者 关丹丹 韩宁 章建石 《中国考试》 CSSCI 北大核心 2021年第3期1-8,共8页
《深化新时代教育评价改革总体方案》(以下简称《总体方案》)提出“四个评价”的改革思路,并针对“五类主体”统筹设计改革任务。高考作为教育评价指挥棒之一,面对教育评价改革新形势新要求,需要立足“四个评价”,从服务“五类主体”的... 《深化新时代教育评价改革总体方案》(以下简称《总体方案》)提出“四个评价”的改革思路,并针对“五类主体”统筹设计改革任务。高考作为教育评价指挥棒之一,面对教育评价改革新形势新要求,需要立足“四个评价”,从服务“五类主体”的角度进一步深化改革。高考评价改革要积极探索高考在改进结果评价、强化过程评价、探索增值评价、健全综合评价中的定位和作用,整体提升高考评价的科学性、客观性和公平性。高考评价改革要以学生评价这一主体为抓手,立足全局,整体谋划,加快推进服务“五类主体”的目标。锚定2035年远景目标,高考评价改革要以《总体方案》为根本遵循,以“中国高考评价体系”为理论基础和实践指南,从考试内容、考试形式和考试评价3个方面重点突破,完善评价工具,创新评价手段,健全评价结果反馈与使用,全方位提升高考评价功能,助力新时代教育评价改革落地。 展开更多
关键词 教育评价改革 高考改革 “四个评价” 结果评价 过程评价 增值评价 综合评价
下载PDF
北京女大学生进食障碍调查分析 被引量:21
4
作者 关丹丹 王建平 《中国心理卫生杂志》 CSSCI CSCD 北大核心 2003年第10期672-672,665,共2页
关键词 北京 女大学生 进食障碍 调查分析 流行病学
下载PDF
信度的再认识与信度概括化研究 被引量:17
5
作者 关丹丹 张厚粲 《心理科学》 CSSCI CSCD 北大核心 2004年第2期445-448,共4页
本文首先对信度概念进行了明确,指出信度是评价测验结果可靠与否的一个指标,而不是测验工具的不变属性。针对测验结果的信度估计的可变性,介绍了上世纪末Vacha-Haase提出的信度概括化研究方法,即一种用来探索得分信度估计的可变性、并... 本文首先对信度概念进行了明确,指出信度是评价测验结果可靠与否的一个指标,而不是测验工具的不变属性。针对测验结果的信度估计的可变性,介绍了上世纪末Vacha-Haase提出的信度概括化研究方法,即一种用来探索得分信度估计的可变性、并对引起变异的预测源进行探讨的一种元分析方法。最后通过对信度概括化研究手段的分析,指出信度概念的再认识与信度概括化研究将会给心理测验工作者带来新的启示。 展开更多
关键词 心理测验 再认识 信度概括化 信度系数
下载PDF
全国高考英语试题的城乡项目功能差异分析 被引量:5
6
作者 关丹丹 乔辉 +1 位作者 陈康 韩奕帆 《心理学探新》 CSSCI 北大核心 2019年第1期64-69,共6页
本研究主要目的是针对高考英语成绩存在的城乡差异,检验这种差异是否来源于试题在城乡上的项目功能差异。如果两个能力本来相同的考生群体在某一试题得分上表现出不同程度的差异,该试题就存在项目功能差异。研究采用试题标准化分数差法... 本研究主要目的是针对高考英语成绩存在的城乡差异,检验这种差异是否来源于试题在城乡上的项目功能差异。如果两个能力本来相同的考生群体在某一试题得分上表现出不同程度的差异,该试题就存在项目功能差异。研究采用试题标准化分数差法,利用STDIF软件逐一分析了2016年三套全国高考英语卷的客观题是否存在城乡上的项目功能差异,在确定客观题没有项目功能差异后,以客观题成绩为匹配变量,采用条件得分图法对书面表达题是否存在城乡上的项目功能差异进行了分析。研究结果显示,高考英语全国I、II、III卷均未发现城乡上的项目功能差异试题,即可以认为高考英语全国卷对城乡不同户籍考生都非常公平、公正,城乡考生在英语成绩上的差异并非题目的公平性所致。 展开更多
关键词 高考英语 项目功能差异 城乡
下载PDF
PETS计算机自适应序列测试设计与模拟研究 被引量:4
7
作者 关丹丹 刘庆思 莫春晖 《心理学探新》 CSSCI 2011年第5期467-471,共5页
根据PETS考试的特点,结合计算机自适应序列测试(CAST)的优势,该研究提出并设计了PETS-CAST测试。为了检验PETS-CAST测试系统的性能,该研究利用PETS试题的真实难度参数和模拟的考生能力参数生成相应的原始得分矩阵,并根据路径规则实现适... 根据PETS考试的特点,结合计算机自适应序列测试(CAST)的优势,该研究提出并设计了PETS-CAST测试。为了检验PETS-CAST测试系统的性能,该研究利用PETS试题的真实难度参数和模拟的考生能力参数生成相应的原始得分矩阵,并根据路径规则实现适应性的模块选择。研究结果表明,PETS-CAST所设计的路径能够满足不同能力水平考生的要求,且各条路径的测量精度均能够达到CAST考试的要求。曝光率方面的研究则说明,PETS-CAST应该在设计题池时充分考虑试题模块在数量方面的配置。该模拟研究为PETS-CAST的具体实施在理论和实践层面做了一些有益的尝试。 展开更多
关键词 计算机自适应序列测试 PETS 模拟研究 能力估算 曝光率
下载PDF
英语机考的信效度研究 被引量:5
8
作者 关丹丹 李英 《电化教育研究》 CSSCI 北大核心 2017年第8期96-98,128,共4页
文章以PETS-5为例,在设计并实现机考形式后,选取出国培训班学生共404人参加了该机考测试。测试结束后,通过在线问卷调查的形式调查了被试对该机考形式的感受与意见,并收集了考生参加PETS-5纸笔考试的考试成绩。研究结果表明:(1)该机考... 文章以PETS-5为例,在设计并实现机考形式后,选取出国培训班学生共404人参加了该机考测试。测试结束后,通过在线问卷调查的形式调查了被试对该机考形式的感受与意见,并收集了考生参加PETS-5纸笔考试的考试成绩。研究结果表明:(1)该机考总体的Alpha信度为0.82,各部分为0.63~0.65,具有较好的内部一致性信度;(2)该机考各部分的相关系数为0.34~0.43,与纸笔考试各部分相关的结果基本相近,具有较好的结构效度;(3)该机考成绩与纸笔考试成绩的相关系数为0.709,具有较好的效标关联效度;(4)该机考模式对于男生和女生是公平的,试题在性别上不存在项目功能差异;(5)关于测验总分及各部分性别差异t检验结果显示,男女考生仅在阅读理解成绩上存在性别差异,男生的平均成绩高于女生。 展开更多
关键词 英语 机考 信度 效度
下载PDF
差异分数的信度分析 被引量:2
9
作者 关丹丹 张厚粲 李中权 《心理科学》 CSSCI CSCD 北大核心 2005年第1期161-163,共3页
 本文提出差异分数的信度变化问题,并以模拟数据分析了差异分数的信度在不同情况下的变化规律。结果指出:1.当 两次测试得分的信度系数相等或相近时,两次测试的标准差相差越大,差异分数的信度越高。2.当两次测试得分的信度系数不 ...  本文提出差异分数的信度变化问题,并以模拟数据分析了差异分数的信度在不同情况下的变化规律。结果指出:1.当 两次测试得分的信度系数相等或相近时,两次测试的标准差相差越大,差异分数的信度越高。2.当两次测试得分的信度系数不 等时,只要两次施测中任何一次的信度和标准差同时大于另外一次,那么差异分数的信度也比较高。3.无论两次测试的信度关 系如何,两次测试相关越低,差异分数的信度越高。 展开更多
关键词 差异分数 信度变化 认知 信度系数
下载PDF
计算机自适应序列考试概述 被引量:8
10
作者 关丹丹 刘庆思 《中国考试》 2011年第1期29-35,共7页
计算机自适应序列考试(CAST)是一种考试实施程序,也是一种考试设计的方法学。本文以一个1-3-3模式的三阶段CAST为例,介绍了CAST的基本框架、组卷策略与步骤,以及CAST的实施。CAST既能像计算机自适应考试(CAT)一样高效,同时又能满足考试... 计算机自适应序列考试(CAST)是一种考试实施程序,也是一种考试设计的方法学。本文以一个1-3-3模式的三阶段CAST为例,介绍了CAST的基本框架、组卷策略与步骤,以及CAST的实施。CAST既能像计算机自适应考试(CAT)一样高效,同时又能满足考试的内容要求,为实现高品质的计算化考试带来了新的哲学理念。 展开更多
关键词 计算机自适应序列考试 多阶段 模块
下载PDF
图形分析法在高考试题评价中的应用——以高考物理试题为例 被引量:4
11
作者 关丹丹 程力 门东平 《中国考试》 2018年第2期6-11,共6页
本文基于不同能力水平组考生在具体题目上的反应曲线,研究如何基于条件概率估计,采用图形分析法对高考试题进行评价。图形法既可以做0/1计分题目分析,如直观展示选择题的难度、区分度、选项的迷惑性及随考生能力水平的递增而变化的趋势... 本文基于不同能力水平组考生在具体题目上的反应曲线,研究如何基于条件概率估计,采用图形分析法对高考试题进行评价。图形法既可以做0/1计分题目分析,如直观展示选择题的难度、区分度、选项的迷惑性及随考生能力水平的递增而变化的趋势等,也可以做多级计分题目分析,如直观展示主观题在可能获得的不同分数点上的难度和对不同层次考生的区分情况。本文结合2017年高考物理试题和考试数据,对图形分析法所传达的信息进行解读,希望能为考试工作者特别是命题人员提供参考。 展开更多
关键词 高考 试题评价 题目分析 条件概率估计 图形分析法
下载PDF
新高考改革背景下不分文理的数学成绩差异研究 被引量:11
12
作者 关丹丹 景春丽 《数学教育学报》 CSSCI 北大核心 2018年第4期31-34,共4页
高考不分文理科是此次考试招生制度改革的一个重要举措.选取Y省高考现有文理科考生的数学成绩为研究样本,将文理数学试卷中的共同题作为内锚,采用等值技术对比分析了Y省现有文科考生与理科考生的高考数学成绩的差异,并对使用同一试卷的... 高考不分文理科是此次考试招生制度改革的一个重要举措.选取Y省高考现有文理科考生的数学成绩为研究样本,将文理数学试卷中的共同题作为内锚,采用等值技术对比分析了Y省现有文科考生与理科考生的高考数学成绩的差异,并对使用同一试卷的不同省份的文理差异程度进行了分析.研究发现:(1)理科考生群体的数学成绩普遍且明显高于文科考生群体.以Y省为例,基于共同题等值后,两个考生群体的数学成绩平均相差13分.(2)不同省的文理科考生群体在数学成绩的差异上程度明显不同,文理数学水平差距最大的省比文理差距最小的省在差异程度上又有12分之多.文理科数学成绩差异及不同省差异程度的问题值得关注,为进一步落实高考数学文理不分科提供参考. 展开更多
关键词 新高考 数学 文理差异
下载PDF
高中生数学成绩的性别差异研究 被引量:7
13
作者 关丹丹 《数学教育学报》 CSSCI 北大核心 2017年第6期22-25,32,共5页
数学能力性别差异一直是国内外教育考试界关注的热点问题.选取2016年使用全国同一数学试卷的多个省的高考考生为研究样本,对比分析了总体以及每一个省的高考数学成绩的性别差异,并依据题型、能力和知识内容维度分类后对性别差异的具体... 数学能力性别差异一直是国内外教育考试界关注的热点问题.选取2016年使用全国同一数学试卷的多个省的高考考生为研究样本,对比分析了总体以及每一个省的高考数学成绩的性别差异,并依据题型、能力和知识内容维度分类后对性别差异的具体表现形式进行了详细分析.结论如下:(1)总体上,男生在高考数学表现上更加优异.(2)女生的选择题成绩总体上优于男生,而男生的填空题与解答题成绩总体上优于女生.(3)男生的逻辑思维、空间想象、数据处理3种能力总体上均高于女生,而女生的运算求解能力总体上高于男生,创新应用能力性别差异不显著.(4)男生在代数、立体几何、概率与统计3项成绩上总体高于女生,而女生在解析几何和三角函数两项成绩上则高于男生.(5)不同省之间在高考数学成绩的性别差异程度及差异的具体表现形式有所不同,个别省性别差异程度较大,其原因值得教育研究者与实践者不断关注与探讨. 展开更多
关键词 高中生 高考 数学 性别差异
下载PDF
两种PETS计算机自适应序列测试框架比较研究 被引量:4
14
作者 关丹丹 刘庆思 《中国考试》 2013年第1期16-22,共7页
根据PETS考试的特点,结合计算机自适应序列测试(CAST)的优势,研究者提出并设计了1-3-5三阶段和1-2-5-5四阶段两种PETS-CAST测试框架。为了检验两个测试框架的性能,研究者模拟生成了样本量分别为500、1000、3000、5000四个考生群体的能力... 根据PETS考试的特点,结合计算机自适应序列测试(CAST)的优势,研究者提出并设计了1-3-5三阶段和1-2-5-5四阶段两种PETS-CAST测试框架。为了检验两个测试框架的性能,研究者模拟生成了样本量分别为500、1000、3000、5000四个考生群体的能力值,然后,利用蒙特卡罗模拟方法,在试题参数已知的CAST框架上模拟生成考生的作答反应。研究结果表明,随着阶段的增加,自适应序列测试提供了更多的测验信息,能力估计的标准误逐渐减小,模拟能力与估计能力呈现出高相关。1-2-5-5四阶段测试对考生能力估计及分类决策的准确性更高,结果更为可靠。该模拟研究为PETS-CAST的具体实施在理论层面做了一些有益的尝试。 展开更多
关键词 计算机自适应序列测试 PETS 测试框架 模拟研究
下载PDF
美国ACT课程调查对我国高考改革的启示 被引量:3
15
作者 关丹丹 向冠春 《中国考试》 2012年第5期24-29,共6页
美国ACT对教授英语/写作、数学、阅读和科学四个内容领域的初中、高中和大学教师定期开展全国课程调查。本文介绍了2009年课程调查的对象、任务、结果和结论。ACT通过课程调查改进考试的做法值得我们借鉴学习,针对高中、大学开展全国高... 美国ACT对教授英语/写作、数学、阅读和科学四个内容领域的初中、高中和大学教师定期开展全国课程调查。本文介绍了2009年课程调查的对象、任务、结果和结论。ACT通过课程调查改进考试的做法值得我们借鉴学习,针对高中、大学开展全国高考课程调查,或许能为高考改革找到一个突破口。 展开更多
关键词 课程调查 高考 改革 高校人才选拔标准
下载PDF
研究生入学考试写作评分的概化理论研究与多面Rasch分析 被引量:5
16
作者 关丹丹 《心理学探新》 CSSCI 2014年第5期437-440,共4页
为了评价和改进硕士研究生入学考试一般能力测试的写作评分,研究者采用概化理论和多面Rasch分析对113位考生的写作样本的评分误差来源、评分信度等进行了探讨。概化理论研究显示,评分者和题目对评分准确性影响不大,以两道写作题的考试... 为了评价和改进硕士研究生入学考试一般能力测试的写作评分,研究者采用概化理论和多面Rasch分析对113位考生的写作样本的评分误差来源、评分信度等进行了探讨。概化理论研究显示,评分者和题目对评分准确性影响不大,以两道写作题的考试设计而言,评分者为2人即可保证评分信度在0.75以上。多面Rasch分析显示,评分者宽严度的估计值及其误差均在可接受的范围内,评分者之间在宽严度上不存在显著差异,且评分者自身在评分时总体上比较稳定。但个别评分者在特定考生特定题目上表现出特殊偏向。概化理论和多面Rasch分析丰富了写作评分研究的量化指标,证实了硕士研究生入学考试一般能力测试的写作评分具有较高的信度。 展开更多
关键词 写作 评分信度 概化理论 多面Rasch分析
下载PDF
基于条件得分的分析技术在考试质量评价中的若干应用 被引量:1
17
作者 关丹丹 韩宁 《中国考试》 CSSCI 2019年第11期30-35,共6页
与基于全体考生的总体分析不同,基于条件得分的分析是基于不同能力水平的考生子群体的分析。条件得分分析技术可以应用于对选择题的选项分析和主观题的图形分析、主观题的项目功能差异分析、选考题的公平性分析、评分宽严尺度分析等,不... 与基于全体考生的总体分析不同,基于条件得分的分析是基于不同能力水平的考生子群体的分析。条件得分分析技术可以应用于对选择题的选项分析和主观题的图形分析、主观题的项目功能差异分析、选考题的公平性分析、评分宽严尺度分析等,不依赖于任何数学模型,原理简单直观,结果容易解释,但缺点是尚没有建立公认的判断准则。基于条件得分的分析技术在我国考试质量评价中有广泛应用空间。 展开更多
关键词 条件得分分析技术 试题图形分析 考试评价技术 项目功能差异分析
下载PDF
问题解答过程模型对考试设计的启示 被引量:2
18
作者 关丹丹 张开 《考试研究》 2009年第4期90-98,共9页
本文通过分析英国剑桥评价提出的问题解答过程模型,探讨引入认知加工模型对考试设计的作用。笔者认为,运用认知加工模型有利于提高试题的质量,控制和调整试题的难度,加强考试的诊断功能,确保考试的效度。在考试设计中强化认知加工模型... 本文通过分析英国剑桥评价提出的问题解答过程模型,探讨引入认知加工模型对考试设计的作用。笔者认为,运用认知加工模型有利于提高试题的质量,控制和调整试题的难度,加强考试的诊断功能,确保考试的效度。在考试设计中强化认知加工模型的理念,将成为教育考试设计的有效框架之一。 展开更多
关键词 问题解答过程模型 认知加工模型 考试设计
下载PDF
纸笔考试与计算机自适应考试的等效研究探讨 被引量:6
19
作者 关丹丹 《中国考试》 2011年第10期13-16,共4页
将纸笔考试转成计算机自适应考试时必须对两种测试的可比性进行研究,针对媒介的变化、测量思想的变化,须关注两种考试模式下考生分数、试题参数、信度、效度的可比性。等效研究是确保计算机自适应考试品质的重要步骤。
关键词 纸笔考试 计算机自适应考试 等效研究 信度 效度
下载PDF
阅读理解测试的信度研究:来自概化分析的视角 被引量:3
20
作者 关丹丹 《心理学探新》 CSSCI 北大核心 2016年第1期70-74,共5页
阅读理解测试通常为多个题目共用一个语篇材料,属于典型的题组题型,传统的基于单题的信度估计方法将会高估测试的信度。研究采用概化理论模型,通过比较传统信度系数以及不同的概化理论测量设计模型,探讨不同方法对阅读理解测量精度估... 阅读理解测试通常为多个题目共用一个语篇材料,属于典型的题组题型,传统的基于单题的信度估计方法将会高估测试的信度。研究采用概化理论模型,通过比较传统信度系数以及不同的概化理论测量设计模型,探讨不同方法对阅读理解测量精度估计的差别;同时,通过改变语篇和题目的数量来观察概化系数和可靠性指数等指标的变化,为改进考试设计和命题提供参考信息。结果表明,忽略语篇的单变量概化设计以及基于题目的 系数会在概化系数上高估0.0404,将语篇作为多变量的交叉设计会在概化系数上高估0.0480,基于语篇的系数与单变量嵌套设计的概化系数一致。另外,增加阅读理解中的语篇量或题目量都可以提高测量的精度,但增加语篇量在提高阅读理解测试的测量精度上更为高效。 展开更多
关键词 阅读理解 题组 概化理论 信度 系数
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部