搜索引擎相关性评估:从定义到分档的完整指南
创作时间:
作者:
@小白创作中心
搜索引擎相关性评估:从定义到分档的完整指南
引用
CSDN
1.
https://m.blog.csdn.net/hxdxiaoming/article/details/145232924
搜索引擎的相关性评估是信息检索领域的重要课题。本文详细介绍了工业界如何通过标注规则、数据标注、模型训练和线上推理等步骤来实现搜索相关性的评估。同时,文章还阐述了相关性的档位划分标准,包括字面匹配与需求匹配的区分、内容质量与时效性的考量,以及上位词与下位词的关系等。此外,文章还介绍了标注流程的具体步骤,包括样本抽取、标注过程监督和结果验收等。
工业界是怎么做的?
- 制定标注规则 -> 标注数据 -> 训练模型 -> 线上推理
- 搜索产品和搜索算法团队定义相关性标注规则
- 人为地将 (q,d) 相关性划分为 4个 或 5个 档位
- 相关性文档规则非常重要!假如日后有大幅度变动,需要重新标注数据,丢弃累积的数据
- 产品和算法团队监督指导团队的工作,累积数十万,数百万条 (q,d) 样本
- 算法团队用人工标注的数据训练相关性模型
字面匹配 vs 需求匹配
- 相关性是指 d 能满足 q 的需求或回答 q 提出的问题
- 哪怕 q 和 d 在字面上完全不匹配,两者也可以判定为相关
- 即便 q 和 d 字面匹配,两者可能不想管
- 相关性标注只考虑相关性,不考虑内容质量,时效性等因素
- 查询词 q 可能有多种意图,文档 d 只需要命中一种意图就算相关
- 如果搜上位词,出下位词,判定为相关
- 搜下位词,出上位词,判定为不相关
- 丢失核心词,判定为不相关
- 丢失重要限定词,判定为不相关
- 丢失不重要限定词,判定为相关
- 具体看 d 能否满足 q 的主要需求或回答 q 提出的问题
档位细分
根据内容划分占比高,中档位
- 如果 (q,d) 相关,则进一步划分为高,中两党,细分规则:满足需求的内容篇幅占比是否超过 50%
根据参考价值划分为低,无档位
- 如果 (q,d) 不相关,则进一步划分为低,无两档。细分规则:文档是否具有参考价值
标注的流程
- 由算法团队抽取待标注样本
- 从搜索日志中随机抽取 n 条查询词。既有高频查询词,也有中频,低频查询词
- 给定 q ,从搜索结果中抽取 k 篇文档,组成二元组,4个相关性档位的样本数量尽可能平衡
- 不能直接取搜索结果页排名 top k的文档,否则高档位文档过多,低档位文档过少
- 由产品团队和算法团队减肚标注过程和验收结果
- 遇到难以界定档位 (q,d),由产品和算法团队做界定和解释
- 一条样本至少由两人标注,两人标注的结果需要有一致性
- 产品团队抽查标注结果,要求准确率高于某个阈值
- 可以事先往数据中埋雷(产品团队自己标注的样本),考察埋雷样本的标注准确率
热门推荐
陈炯明:与孙中山的政治分歧与历史影响
早睡早起:解锁健康生活的密码
深度解析:公羊传与谷梁传的独特之处
C语言如何打印的慢一点
数字人作品名称怎么改变
探秘真武大帝:身份与时代解析
用Excel计算久期的多种方法详解
空少一般能干几年?待遇怎么样?退休后还能做什么工作?
常用的国内国外免费公共DNS服务器IP地址整理
什么是企业改革
孩子锁门、家长拆锁:督促学习和尊重隐私该如何平衡
科学饮食与减肥:解锁健康瘦身密码
减肥期间适合做什么运动锻炼
《魔兽世界》冰DK天赋加点攻略:输出与生存的完美平衡
6招培养阅读素养,提升孩子的理解与思考能力
社媒热点追踪工具:选择与使用指南
爬山虎的特点及生长环境(了解爬山虎,认识生态环境)
小型柴油发电机的基本构造与工作原理解析
香椿芽,早春时节的特殊美味
随远古足迹,窥千年时光,张家口市文化遗产保护传承绽放新光彩
桃树的生长习性特点和生长环境条件
男生尿酸多少是正常范围内
杏花开多久凋谢
生根粉配方技术深度解析:从成分到发展趋势
杨涛教授解读:中国1型糖尿病胰岛素治疗指南
三套经典日语自学教材深度测评:哪一款最适合你?
5G 网速快如闪电,但它对手机电池的影响,你真的知道吗?
应用5%碳酸氢钠注射液处理经外周静脉置入中心静脉导管药物性堵塞1例
止水钢板检测标准是什么
国际机构上调中国经济增长预期 外媒:提振消费举措见成效