训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
2025年骑电动车新规定:合规资质与上路必备四大件,你准备好了吗?
如何练就强悍的分析能力:全面成长指南
增强分析:新时代的数据洞察工具
安阳古城西大街:千年古街变身中医养生集市
三七叶成分揭秘:七叶安神片真的能助眠?
七叶安神片:失眠救星还是安全隐患?
世界睡眠日:七叶安神片助你一夜好眠
沈月自爆分手原因:恋爱太消耗
沈月自曝已分手:聚光灯下的明星恋爱难
老年人春季养生指南:饮食起居运动全方位指导
老花镜如何选择 怎样识别老花镜的好坏
基因编辑技术:改变生态系统的双刃剑
吉他琴颈弯曲?教你轻松搞定!
吉他的琴颈弯曲了?自己动手修起来!
双十一教你DIY修复吉他琴颈
Fender & Gibson琴颈修复大挑战!
肺结节诊治中国专家共识:早期诊断与治疗新进展
冬季雾霾来袭,你的肺结节能扛得住吗?
AI自主导航:让航天器在深空“自由行走”
《围城》里的夸张手法,你get到了吗?
《哪吒2》出海:文化解释权与话语权的重新洗牌
流式课堂 | 常见的细胞因子检测方法【建议收藏】
大数据技术在智能交通系统中的应用与挑战
尼采的生命哲学:权力意志、超人与永恒轮回
科技与温情双驱动,安阳开发区收费站智慧护航开学季
意大利&法国塔罗牌流派大揭秘!
塔罗牌趣味测试:你的周末活动指南
比特币投资中的心理陷阱:如何避免FOMO、贪婪与羊群效应
人性最底层的本质是什么
如何在情感关系中保持自我价值和自信