训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
粥是最差的主食吗?早餐到底能不能喝粥?钟南山:早餐应该这样吃
如何搭配营养早餐?速点这份搭配指南
急性胰腺炎治疗迎来突破:乳酸林格氏液成首选
急性胰腺炎患者营养管理指南:从禁食到恢复正常饮食
中山医院专家推荐:如何通过饮食预防急性胰腺炎?
远离急性胰腺炎:饮食调整与体检筛查双管齐下
七色糙米饭:营养均衡的五谷杂粮组合及烹饪秘诀
珠海十大景点全攻略:从海洋王国到日月贝,玩转滨海之城
湖南省第二人民医院教你春节防肠胃炎
饮食卫生:如何有效预防急性肠胃炎?
得了急性肠胃炎?小米粥来救急!
老话“十一请子婿” 怎么请?了解下
科学家发现探测戴森环新技术:或能捕捉外星文明踪迹
惊现戴森球疑踪:天文学家在距离地球1000光年范围内锁定7个目标
自2015年后,戴森球的新消息来了
中药汤剂、颗粒剂、膏方,哪个好?
中医视角下对失眠的看法及其调养方式
正月十一啥日子?记得吃4样、做2事,日子越过越红火,莫忘老传统
早餐建议常吃这10种食物,补充蛋白质钙元素丰富,再贵也要舍得吃
什么燕麦食品更适合血糖高的人群?
澳洲每月超3万人吃不上饭,越来越多人开始排队领救济!慈善机构也“扛不住”了...
红楼梦中林黛玉的全部诗词
香港五天游,跟团还是自由行?一文帮你做出最佳选择!
快递春节正常派送,我看到了行业残酷的一面
推进农村物流体系发展,激发乡村振兴新动能
肝火旺盛,这些身体信号你察觉到了吗?
2025年房地产市场新动向:京津冀领跑
因特拉肯:瑞士必打卡历史文化胜地
冬季滑雪必打卡:瑞士少女峰
瑞士双璧:少女峰与马特洪峰的世界遗产之旅