GMAT考什么 gmat考试是什么( 二 )


记者:从技术层面来讲 , 这项考试如何测试出考生的真实能力?
郭凡民:它是一种自适应考试 。考生坐在考试计算机面前的时候 , 面对的是一个题库 , 计算机根据考生的答题水平 , 给出相应的考题 。
为什么这么做?举例来说 , 考试中有人得200分 , 有人得800分 , 不应该使用一套考卷来测试不同水平的群体 。拿800分难度的考题给只有200分水平的考生完全是挫伤他的积极性 。反过来 , 800分的学生答200分难度的题目也浪费考生的时间 。
计算机自适应考试就是这样的一种考试 , 首先假定考生是一个中等水平的学生 , 先给出一道题 , 如果这道题答对 , 那么计算机就会选一个比该题难度更高一点的题目 。答完后 , 电脑将两题合起来给考生评一次分 , 然后根据这个成绩再选第三题 。再把三道题合起来给考生打一次分 , 四道题合起来打一次分 , 计算机每次选出的下一道题都是难度最适合考生当前水平的题目 。
实际上 , 自适应考试是根据每一个人的实际水平出一套最合适他的考题 。自适应考试可以用最少的题目 , 在最短的时间内得出考生最精确的分数 。有些考试是把试卷分成两个或三个部分 , 计算机按考生水平选择难度合适的下一部分考题 , 而且只能进行一次或两次自适应选题 。但经企管理研究生入学考试是以试题为自适应选题的单位 , 每一道题完了以后 , 计算机都给考生测分数 , 并根据分数选下一道题 , 因此是效率最高的考试模式 。
记者:那么 , 写作部分的阅卷如何进行 , 如何给出合理的分数?
郭凡民:经企管理研究生入学考试是全世界高风险入学考试里面第一个采用计算机批阅作文的 。在机器阅卷方面 , 我们做了很多研究 。在我们分析计算机阅卷能够给出可靠的分数之后 , 我们把这一技术用于阅卷 。一直以来 , 我们采取人机阅卷结合的方式 , 计算机阅卷给出一个分数 , 阅卷考官再给出另外一个分数 。这两个分数相差如果在一分以上 , 我们会再请更高一个层次的 , 比如说阅卷组长再给一个分数 。在这种情况下 , 阅卷组组长给的那个分数会替代其他两个分数 。
记者:计算机能测评考生文章的语法、结构和表达艺术吗?
郭凡民:考试技术正在发生突破性或颠覆性变化 , 我们正处在这个变化之中 。因为 , 早期的机器阅卷是从语法开始的 。计算机阅卷一方面可以考查语法 , 也可以考查段落之间的修辞手法 。比如一共要给三个论据 , 这三个论据是否一致 , 这三个论据之间是否有过渡词、关联词 。从某种角度来说 , 当前的计算机阅卷已经超越了纯语法的考查 。从语言学角度来看 , 有相当一部分超段落 , 若干个段落组成的大段之间 , 机器可以考查文章内部的过渡、连接等 。
记者:您刚才提到现在对于机器阅卷来说是关键的转折期 , 为什么?
郭凡民:一些人工智能研究 , 特别是一些深层学习的研究 , 一旦获得成功就很可能会给机器阅卷带来革命性变化 。人工智能从某种角度上来说 , 有可能超越对词汇、语法、段落的分析 , 在语义分析上有重大突破 。机器阅卷很可能在新的层面上 , 利用这些新技术 。未来的机器阅卷 , 很可能会出现质的变化 。它不但能够判断 , 还能一边学习 , 一边判断 。人工智能的引入 , 很可能会引起机器阅卷颠覆性的变化 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。