训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
早上喝咖啡或增糖尿病患者死亡风险,专家建议改为中午饮用
糖尿病患者冬季饮食指南:苦瓜降糖效果有限,需配合药物治疗
韩剧《请和我的老公结婚》收官:女主完成复仇,与爱人终成眷属
重生复仇包裹婚姻反思,韩剧《请和我的老公结婚》登顶67国榜首
《犯罪现场清洁工》:把清理变得有趣起来
地龙:功效、作用与应用详解
零基础学移动开发:Android和iOS平台入门指南
从自动化测试到部署:移动应用开发的6大CI/CD实践
牙医推荐:最有效的洁牙顺序是先牙线后刷牙
口腔诊所合法经营必备五证,专家教你如何辨别
台湾布袋戏:两百年八大阶段塑造独特艺术形式
重阳节关爱老人:常见骨病预防指南
职场中的厚道:不只是美德,更是成功之道
厚道品质成就职场辉煌:单杏花与12306背后的故事
智能升降工位破解久坐难题,实时监测打造健康办公新选择
中文名字翻译有讲究:结构、拼音和文化差异
燕麦奶、椰乳、苹果汁:谁是减肥圈的“网红之王”?
当杨幂变成“摇米”:明星英文名翻译背后的跨文化故事
罗马帝国与基督教:从迫害到国教的曲折历程
英国首展卡拉瓦乔绝笔,自画像诉说最后时光
天主教两度迫害东正教:从十字军东征到拜占庭帝国覆灭
变胖可能是脾虚!睡不好、经常感冒咳嗽是典型症状,中医师教你养脾、改善虚胖
分时图揭秘:股价突破均价线的绝佳时机
通达信60日均线战法揭秘:捕捉股市趋势的利器
天和磁材突破五日均线,机构看好磁材行业前景
γ-氨基丁酸的作用
冬季暖心必备:四川辣子鸡的营养揭秘
家庭简易辣子鸡,让你秒变大厨
北欧五国旅游攻略:冰岛、挪威、瑞典、芬兰和丹麦的绝美景点
艺术生就业难?提升专业技能和关注行业动态是关键