训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
UV打印机常见十六大故障及解决方法
南京到南京南怎么走?从新手小白到老司机的进阶指南,轻松搞定两地之间的往返!
【关注】患儿腺样体肥大,别着急手术,中医特色治疗优势明显!
压力性胃痛丨一紧张就胃痛?严重恐作呕?医生解构成因/症状/改善方法
化妆品乳液和面霜的区别
宅基地风水布局:杨明德大师的全面分析
复杂的机油型号,你的机油加对了吗?
社区宣传栏不要成了摆设
投影仪与电脑连接全攻略,有线无线任你选
投影仪电线如何正确连接?接线后安全吗?
量子计算:全球AI竞争的关键优势
大开眼界!因缺乏车辆,在乌克兰的俄军开始用驴子运送弹药
手机格式化U盘为exFAT格式全攻略:详细步骤与注意事项
高原地区为什么排尿减少?
首创研究有助于解释为什么太空中的饭菜味道不好
四名志愿者在 NASA 火星模拟舱生活一年后成功出舱,身体未出现重大问题
甲状腺结节的症状、危害与科学治疗方案
焦虑型依恋需要看心理医生吗
耳朵痒时,为什么不能用酒精棉签擦拭?
《跳棋》策略与战术解析
肺癌重要里程碑!埃万妥单抗注射液在我国获批上市
环市街江侨社区:千家温暖皆入卷 文明实践写民生
准高三学生如何面对失败和挫折?怎么调整心态?
加班费仲裁需要什么证据?一文详解证据、时效和计算标准
X射线机曝光曲线的精准调整与应用
脾胃健康,放屁不再尴尬!中医调理全攻略
如何理解火在IGCSE物理中的重要性
六要素微气象传感器:提升环境监测效率的关键工具
社保卡能否作为工资卡?使用前必看
除了踏青,春天还有上百种打开方式