训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
瘀血重,舌下青筋粗紫,血府逐瘀丸无效?中医:先疏肝再温阳才行
职业教育应如何培育工匠精神
中药剂量换算:从汉代到现代的演变与最新标准
中国十大家常菜:麻婆豆腐、红烧肉等,道道凝聚亲情
糖尿病患者饮食管理全攻略:从外出就餐到旅游注意事项
鱼肉营养全解析:8种常见鱼类功效与9大健康益处
通心络胶囊:心脑血管健康的新希望
秋冬经典穿搭全攻略:40岁女性的优雅穿衣指南
智能化+人性化:物业管理提档升级新路径
元旦手抄报这样画最漂亮!附3幅一等奖作品赏析
手把手教你制作一年级手抄报,3个创意主题让作业不再愁
小产权房风险防范指南:五类隐患及维权路径详解
张红甫教你做创意土豆炖鸡块
新西兰红玫瑰苹果遇上土豆炖鸡块:传统美味的创新演绎
诱导老人购买劣质净水器,销售公司被判赔偿980元
净水器守护家庭用水安全:六大功能全方位保障健康
维生素B1缺乏可致神经系统疾病,这些食物帮你有效预防
花生:维生素B1含量超高的营养 powerhouse
砂石骨料自动装车:智能技术提升效率,年省50万人工成本
塔木德咨询教你建立高效绩效考核体系
中北大学研发新型石墨烯制备技术,兼具环保与低成本优势
全国第二,中北大学装甲车辆工程专业实力解析
浙江大学:紫金港现代大气,之江校区如诗如画
百年浙大:从求是书院到国内顶尖学府
浙大科研经费首破80亿,校友企业掌控313家上市公司
浙工大:产教融合培育双创人才,学生获多项国家级竞赛金奖
2025浙江重点大学排名:浙大蝉联第一,宁大浙工大分列二三
被人骗吸毒也犯法吗
新春慰问活动启动,领导干部带头走访贫困家庭
用麦肯锡信任公式提升职场信任力,90后两年晋升合伙人