训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
诗词赏析|读王之涣《登鹳雀楼》积极探索和无限进取的志向
病毒感染怎么治疗效果最好
Excel内容ABC分类的多种实用方法
浅谈化学元素的各种命名
使用方案在各种值集之间切换
Logistic回归在信用评分中的实践
通胀和地缘政治双重压力下催生“新避险逻辑” 黄金矿商股价跑赢金价
患上红眼病使用哪些药水治疗
保定有家古生物界“顶流”博物馆
What's up 是什么意思?全方位解析这个常用英文短语
编码器是什么?它是如何工作的?
《融聚千年》:用艺术形式讲好中华民族共同体故事
医生解答:喝奶粉真的能增强免疫力吗?
血压高应该挂什么科室就诊
吉首大学信息科学与工程学院专业介绍
如何行使及保护中小股东的权利
VI设计的定义与重要性:为什么企业需要VI设计?
vi设计最基础包括哪些?vi设计需要遵循哪些原则?
清洗液与生理盐水区别
红皮病银屑病的饮食指导
工程机械个体户经营范围全解析
如何用简洁的语言讲解复杂的研究问题?
多久洗一次澡更好?专家有话要说
降真香和什么合香好?—— 降真香做合香配方探索
车辆保险费用测算怎么做
揭秘小说网站流量排行,热门平台背后的秘密与趋势
翼型的基本参数与典型低速翼型简介
周固成:俗文学中的唐僧对历史玄奘形象的传承与嬗变
保全费与保函费:概念、区别及应用场景详解
危险!充完电,请及时拔掉充电器