问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

研究:教师如何使用大型语言模型和布鲁姆分类法来创建教育测验

创作时间:
作者:
@小白创作中心

研究:教师如何使用大型语言模型和布鲁姆分类法来创建教育测验

引用
CSDN
1.
https://blog.csdn.net/weixin_43961909/article/details/141060511

随着人工智能技术的不断发展,大型语言模型(LLM)在教育领域的应用越来越受到关注。一篇发表在AAAI会议上的论文探讨了教师如何使用LLM和布鲁姆分类法来创建教育测验。研究发现,自动生成的问题不仅能够提高测验的覆盖率,而且在某些指标上甚至可以提高测验的质量。

研究背景

问题生成(QG)是一种自然语言处理任务,在教育领域具有广泛的应用前景。然而,尽管QG系统在技术上已经取得了显著进展,但其在课堂上的实际应用却相对有限。为了改变这一现状,研究者们开始尝试将大型语言模型(LLM)与布鲁姆分类法相结合,以生成更符合教学需求的问题。

研究方法

研究采用了两种不同的提示策略:简单提示策略和受控提示策略。简单提示策略试图评估模型在不进行任何额外提示工程的情况下生成教学上有用的问题的能力。受控提示策略则使用布鲁姆分类法来生成具有不同学习目标的问题。

评估与结果

研究设计了一个实验,让24位教师分别使用手写、简单生成和受控生成三种方式来编写测验。结果显示:

  • 测验质量:手写和两代测验类型之间没有明显的质量损失。甚至有人认为,从以下一些结果中可以看出测验质量有所提高。
  • 覆盖率:当教师在测验编写过程中使用生成的问题时,覆盖率结果显示显着改善。
  • 测验写作体验:测验写作结果表明,当教师使用生成问题时,效率不会持续下降,至少在所用时间方面是如此。
  • 教师偏好:测验后结果表明,两个群组的教师都强烈倾向于使用受控生成。






结论与展望

研究结果表明,LLM能够从给定上下文中生成不同类型的问题,教师认为这些问题对于创建与手写版本质量相当的测验很有用。未来的研究应该进一步扩大这些方面的多样性,以评估生成的问题如何使其他教育环境受益。此外,还需要考虑教育环境的另一半:学生。未来的工作应该包括学生的目标、意见和表现,以便更全面地了解在课堂上使用自动生成的问题的影响。

本文原文来自AAAI会议论文

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号