训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
珠宝首饰TEMU上架必读:RSL Report检测要求与认证流程详解
十大项链材质是什么 十种常见材质项链盘点
南太湖上的明珠,打卡湖州的旅游景点
考高压电工证需要什么条件,电工证考试科目有哪些(2024新政策解读)
IPv6 vs IPv4:谁才是未来网络的主角?
IPv6 vs IPv4:谁更安全?
手麻原因?看什麼科?一表看懂手指頭麻、手掌麻的可能疾病
太湖畔的弁山:湖州的自然与人文交响
十大牛排的经典做法 牛排如何做好吃又嫩?
简单又好吃的烤羊排
雷凌双擎E+带你玩转湖州:两天一夜自驾游全攻略
上海特色餐馆的逆袭:社区团购与预制菜的双重奏
探秘湖州:七里亭与邱城遗址揭秘
如何写好记叙文开头?10个技巧让你文章瞬间吸睛!
记叙文六要素分别是什么 有哪些作用
说明文的特点三要素及其作用详解
雨天驾车安全指南:7个实用技巧助你安全出行
高铁就在家门口!昌平小伙伴“说走就走”
海南环岛高铁游攻略自由行
大圣娶亲:孙悟空的浪漫史诗,王者荣耀中的经典之作
黄溪古村洞房婚联:传统文化的魅力
双十一精选新婚对联,为婚礼添喜气!
平遥古城“乘”着高铁加速跑
玉手镯都有哪些寓意
如何有效恢复与保养玉镯光泽:全面指南
送玉镯子作为结婚礼物怎么说:礼仪、寓意及挑选指南
在珠宝行业中实施质量管理的方法
奇葩趣事集锦,笑料不断,让你的生活充满欢声笑语!
公共场所安全小常识
英歌舞走红:古老战舞的现代新生