搜索引擎相关性评估:从定义到分档的完整指南
创作时间:
作者:
@小白创作中心
搜索引擎相关性评估:从定义到分档的完整指南
引用
CSDN
1.
https://m.blog.csdn.net/hxdxiaoming/article/details/145232924
搜索引擎的相关性评估是信息检索领域的重要课题。本文详细介绍了工业界如何通过标注规则、数据标注、模型训练和线上推理等步骤来实现搜索相关性的评估。同时,文章还阐述了相关性的档位划分标准,包括字面匹配与需求匹配的区分、内容质量与时效性的考量,以及上位词与下位词的关系等。此外,文章还介绍了标注流程的具体步骤,包括样本抽取、标注过程监督和结果验收等。
工业界是怎么做的?
- 制定标注规则 -> 标注数据 -> 训练模型 -> 线上推理
- 搜索产品和搜索算法团队定义相关性标注规则
- 人为地将 (q,d) 相关性划分为 4个 或 5个 档位
- 相关性文档规则非常重要!假如日后有大幅度变动,需要重新标注数据,丢弃累积的数据
- 产品和算法团队监督指导团队的工作,累积数十万,数百万条 (q,d) 样本
- 算法团队用人工标注的数据训练相关性模型
字面匹配 vs 需求匹配
- 相关性是指 d 能满足 q 的需求或回答 q 提出的问题
- 哪怕 q 和 d 在字面上完全不匹配,两者也可以判定为相关
- 即便 q 和 d 字面匹配,两者可能不想管
- 相关性标注只考虑相关性,不考虑内容质量,时效性等因素
- 查询词 q 可能有多种意图,文档 d 只需要命中一种意图就算相关
- 如果搜上位词,出下位词,判定为相关
- 搜下位词,出上位词,判定为不相关
- 丢失核心词,判定为不相关
- 丢失重要限定词,判定为不相关
- 丢失不重要限定词,判定为相关
- 具体看 d 能否满足 q 的主要需求或回答 q 提出的问题
档位细分
根据内容划分占比高,中档位
- 如果 (q,d) 相关,则进一步划分为高,中两党,细分规则:满足需求的内容篇幅占比是否超过 50%
根据参考价值划分为低,无档位
- 如果 (q,d) 不相关,则进一步划分为低,无两档。细分规则:文档是否具有参考价值
标注的流程
- 由算法团队抽取待标注样本
- 从搜索日志中随机抽取 n 条查询词。既有高频查询词,也有中频,低频查询词
- 给定 q ,从搜索结果中抽取 k 篇文档,组成二元组,4个相关性档位的样本数量尽可能平衡
- 不能直接取搜索结果页排名 top k的文档,否则高档位文档过多,低档位文档过少
- 由产品团队和算法团队减肚标注过程和验收结果
- 遇到难以界定档位 (q,d),由产品和算法团队做界定和解释
- 一条样本至少由两人标注,两人标注的结果需要有一致性
- 产品团队抽查标注结果,要求准确率高于某个阈值
- 可以事先往数据中埋雷(产品团队自己标注的样本),考察埋雷样本的标注准确率
热门推荐
美不胜收,世博文化公园双子山游览记
C语言编程中如何保留两位小数
血糖高患者可以食用的零食有哪些?
照片如何标签化管理系统
50岁以上老年人保险买什么 要注意什么问题
开飞机需要什么驾照
服用六味地黄丸人群 四适宜三慎用
六味地黄丸可以空腹食用吗
糖尿病进入靶向治疗新时代!两类已上市新降糖药,终将成主流!
用凡·高的画作点亮你的春天
燃油添加剂的作用及正确使用方法
如何判断马桶水封是否正常
掘金vs湖人:西部强强对话,谁能笑到最后?
中国女排历次奥运成绩:三次夺冠,一次亚军,更多的是苦涩
打官司赢了诉讼费和律师费谁负责
聪明人贾诩:三国时期最具传奇色彩的谋士
大河奔流—我与黄河文化地标|黄河三游划分的地理特征与历史元素
Obsidian 双端同步教程:Windows 与 iOS 设置全攻略
中国版星链!千帆极轨03组卫星发射成功
淄博公积金贷款额度及计算方法详解
小活络丸的副作用有哪些?
AI 学习方法与算法现状
不吃早餐引起的胆囊息肉怎么办
中国保险业法规与市场发展现状分析
跨境电商选品的策略和方法
中国游客引导全球旅游体验创新
小米手机如何校准陀螺仪
5种“稀罕花”,极度耐寒冷,北方长成树,呼呼“喷雪花”
家庭中帮家人缓解口干口苦有哪些小秘诀?
六小龄童谈黑神话悟空:经典文化在新时代的传承与创新