训练和评估模型
创作时间:
作者:
@小白创作中心
训练和评估模型
引用
1
来源
1.
https://learn.microsoft.com/zh-cn/training/modules/custom-name-entity-recognition/4-train-evaluate-your-model
训练和评估模型是一个迭代过程,用于向训练数据集添加数据和标记,以便更准确地训练模型。 若要了解需要改进的数据和标记类型,Language Studio 在左侧窗格的“查看模型详细信息”页中提供评分。
单个实体和整体模型分数分为三个指标,以说明它们的性能以及需要改进之处。
指标 | 说明 |
|---|---|
精度 | 成功识别实体次数与尝试的所有识别次数的比率。 高分数意味着只要识别实体,它就已正确标记。 |
召回率 | 成功识别实体次数与文档中实际存在的实体数的比率。 高分数意味着它能够很好地查找实体,无论它是否为其分配正确的标签 |
F1 分数 | 将精准率和召回率组合可提供单个评分指标 |
分数可按各实体提供,也可提供整个模型的分数。 你可能会发现某个实体分数很高,但整个模型分数却不高。
如何解释指标
理想情况下,我们希望模型在精准率和召回率方面获得高分,这意味着实体识别效果良好。 如果这两个指标分数都低,则意味着模型很难识别文档中的实体,并且当它确实提取该实体时,它不会为其分配置信度高的正确标签。
如果精准率低,但召回率高,则表示模型能够很好地识别实体,但不将其标记为正确的实体类型。
如果精准率高,但召回率低,则表示模型并不总是识别实体,而是在模型提取实体时应用了正确的标签。
混淆矩阵
在同一“查看模型详细信息”页上,“混淆矩阵”顶部还有另一个选项卡。 此视图提供所有实体的可视表以及每个实体的表现,以全面了解模型及其不足之处。
使用混淆矩阵,可以直观地发现在何处添加数据可提高模型的性能。
热门推荐
如何区分共同财产和个人财产
每年有470万匹马被屠宰,为什么在中国却很少见到有人吃马肉?
寸和英寸的区别!一英寸等于几寸呢?度量单位的趣味课堂,带你一探究竟!
紫微斗数命宫化忌:命理学中的关键概念解析
成都美食打卡指南:旅游必吃十大美食排行榜,舌尖上的巴蜀江湖
三氧化硫常温下是什么状态 什么时间是气体
壬水命的男人特点与正缘匹配
昆仑山下“盐湖城”中草药种植再添“新成员”
机器学习边缘推理-深度研究
唐末最忠诚的藩镇将领:数次为唐朝续命,唐亡后仍用其年号
新手必读:如何规划一条完美的骑行路线
新能源混动、增程、纯电大比拼:谁更适合城市通勤?
十二时辰养生经 | 子时:一觉好眠助胆气
亲兄弟血型必相同?揭开遗传奥秘!
住宅房屋的风水禁忌有哪些
揭秘美国三角洲特种部队:神秘的D分遣队
三角洲特种部队,美国最神秘部队,人员淘汰率高达95%
数学教学中怎样培养学生提问题
利用DeepSeek生成原创图片指南
从深圳到武汉的路线、油耗、距离、路桥费详解
艾滋病孕妇能否安全服用替拉依?专业解答来了
保存红薯的11个方法,不发芽不烂,越放越甜
红薯保鲜方法技术及注意事项
电脑硬盘显示脱机怎么办?原因分析与解决方法详解
从叙事形式方面比较张艺谋改编电影与小说原著的叙事
如何精准选用公文文种:场景与原则解析
两公里走路要用多少分钟?了解步行速度与时间计算
《哪吒2》全球爆火背后的心理图景:解码Z世代的集体焦虑与自我重构
左侧太阳穴胀痛的原因及应对方法
如何通过邮件有效吸引外贸客户回复