训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
纹眉后护理指南:保持干燥清洁,使用修复霜,一个月内避免刺激
多选填空大题各减一题,高考数学改革倒逼教学转型
秋季三角梅修剪攻略:让花期翻倍的秘密武器!
高铁乘务员薪资揭秘:月薪可达万元,含五险一金
全口假牙松了怎么处理?了解全口假牙松动原因及处理方式
“绿茶女”现象背后的社交博弈
黄蜂泡酒制作详解:70%的酒都是勾兑,这些细节要注意
西安碑林博物馆建筑揭秘:红柱飞檐遇现代设计
西葫芦富含钾和维C,双重营养守护心血管健康
西葫芦烹饪全攻略:从家常小炒到米其林级创意
每100克仅20千卡,西葫芦成减肥人群新宠
4月住户存款锐减4万亿元,理财规模增2.3万亿元
冬季早安心语,温暖你的清晨
选购使用双管齐下,让冰箱耗电更少
夏季冰箱省电实用指南:三招巧用日常物品
长白山桦树茸:养生新宠,功效与饮用指南
7份简短致辞模板,女方家长订婚必看
秋冬养生必备:白及的神奇功效与应用
四神丸使用指南:功效、用量及注意事项
破解“内卷式竞争”,建立“有为政府”的合理边界是关键
卷不动了怎么办?600号开出“打工人心病处方”
冰箱储存有讲究:五大误区及科学解决方案
百合炖冬果梨:秋冬季节的润肺止咳养生汤
孔子文化节开幕,曲阜“三孔”展现儒家文化新活力
10平米卧室设计案例:简洁硬装+超强收纳
五鼠遁元口诀:推算时辰天干的古代天文学方法
儒略历:凯撒大帝的历法改革开创现代纪年
山东十大旅游打卡地:泰山、曲阜三孔等文化名胜与自然美景全攻略
如何解决门锁维修相关的难题?这类难题有哪些常见的处理方式?
成都八大寺庙旅游攻略:从文殊院到宝光寺,总有一处让你心灵宁静