训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
海南环岛高铁:645公里串起12城,热带风光与人文魅力的完美融合
四川麻辣鱼制作详解:从选材到装盘的完整教程

江苏ETC办理:线上便捷VS线下专业,一文读懂如何选择
22点至23点入睡最健康,太早太晚都伤身
information与news:这两个易混淆单词的用法全解析
陈与义的“换骨法”:在继承与创新中寻求平衡
B站Excel教程哪家强?四大优质课程带你从入门到精通
8848米之上:喜马拉雅山脉的自然奥秘与人类活动
俞逊发:用创新精神演绎《扬鞭催马运粮忙》的“魔笛”大师
坦诚沟通+数据支撑:企业降薪时的高管沟通术
文言文词汇解析:实词虚词分类与特殊用法
消防法规定十大措施,全面提升消防安全管理水平
医疗器械科普 | 一文了解超声影像诊断设备
从楔形到阿拉伯:世界主要数字系统发展史
2025“新八省联考”来了!原因详细解析,意义十分重大
冬季狗狗长得更快?掌握这些技巧,让你的狗狗一冬长高!
曼尼托巴大学:留学加拿大的宝藏选择
冬季养生必试:按摩八髎穴缓解腰痛提升免疫力
儿童文学里的幽默魔法:让欢笑点亮阅读之路
《宝可梦大集结》积分赛必胜攻略:收集宝可豆篇
正确使用盐酸环丙沙星片:从用量到禁忌,这些要点需谨记
逆袭!36岁贝弗利豪赚千万转战欧洲,妻子美艳堪比巨星太太
反对作品注水被封杀,李保田:演艺圈需要艺术坚守
《和平精英》载具大揭秘:谁才是最强战车?
详解12类消防设备维护要点,确保消防安全
安邦保险破产案:保险保障基金如何保护投保人权益
红枣养生新潮流:科学吃法揭秘
三国豪杰的侯爵之争:谁才是真正的顶级侯?
泰安医保门诊统筹新政解读:起付线降至300元,最高报销70%
骨碎补:千年的骨骼守护神