问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

人工评估 | 人工标注员

创作时间:

作者:

@小白创作中心

人工评估 | 人工标注员

引用

CSDN

1.

https://blog.csdn.net/HuggingFace/article/details/144463265

在大规模语言模型的开发和应用中，高质量的数据标注是确保模型性能的关键环节。本文详细介绍了如何选择合适的标注员、设计标注准则、进行迭代标注以及实施质量检查等关键步骤，并提供了多个实用的工具和资源推荐。

这是人工评估系列文章的第二篇《人工标注员》，全系列包括:

基础概念
人工标注员
技巧与提示

推荐阅读这篇综述的第三章，介绍了许多数据标注质量管理的实践经验。如果你追求的是生产级的质量，并且具备实施条件，那么请继续阅读吧！

无论项目规模多大，一旦定义了具体的评估任务和打分细则，请注意:

选择合适的标注员，如果可能的话提供经济激励

你可能希望参与任务的标注员具有以下品质:

符合特定的人口统计特征。例如：母语是测试目标语言、较高的教育水平、特定领域的专业知识、多样化的地域背景等。根据评估任务不同，对标注员统计特征需求也不一样。
提供高质量标注。

有些任务中筛选合适的标注员很重要，比如近期有一种任务是检查回答是否是 LLM 生成的。

个人认为，除非你众包标注员有强烈的自我驱动意识，否则一般还是支付合理的费用更好。

设计标注准则

请务必深入思考制定标注准则，非常值得花费大量时间去做！我们在制作GAIA数据集时的耗时最多的地方就是这里。

迭代标注

很多时候标注员会误解标注指南 (他们的想法可能比你想象的更模棱两可)，所以要做好多轮迭代标注的准备，来不断改进直到达到你的需求。

质量检查和手动筛选

你需要仔细检查答案的质量 (检查标注员间的答案一致性)，并筛选出质量最优、相关性最高的答案。

你也可以使用专用工具来构建高质量标注数据集，如Argilla。

深入阅读推荐链接：

⭐五分钟构建自己的标注平台，Moritz Laurer 出品的数据标注教程。这篇文章介绍了使用开源工具 (如 Argilla 和 Hugging Face) 的实际经验，可以帮助更好的理解大规模人工标注的注意事项。https://hf.co/learn/cookbook/enterprise_cookbook_argilla
⭐标注实践指南。这是一篇 2023 年所有关于人工标注论文的综述，内容完整，干货满满，但很容易理解。https://aclanthology.org/2024.cl-3.1/
ScaleAI 出品的另一篇标注实践指南，专注于人工评估。它是对上述文档的更轻量级补充。https://scale.com/guides/data-labeling-annotation-guide
关于减少人工标注分歧的假设与挑战，论文探讨了标注员间分歧来源的原因，以及在实践中的缓解方法。https://aclanthology.org/2024.naacl-long.126/
Argillahttps://argilla.io/

原文链接:https://github.com/huggingface/evaluation-guidebook/blob/main/contents/human-evaluation/using-human-annotators.md

热门推荐

带孩子去美术馆，激发美术潜能！

带孩子去美术馆，激发美术潜能！

非遗进校园：剪纸艺术点亮小学美术课

非遗进校园：剪纸艺术点亮小学美术课

小学生创意绘画大赛：谁是最有想象力的小画家？

小学生创意绘画大赛：谁是最有想象力的小画家？

小学生美术学习心理大揭秘！

小学生美术学习心理大揭秘！

民族传统手工艺：提升小学美术教学质量的新路径

民族传统手工艺：提升小学美术教学质量的新路径

帕尔瓦蒂心咒：修炼爱情守护神的秘密

帕尔瓦蒂心咒：修炼爱情守护神的秘密

金球奖后的思考：罗德里与足球运动员的心理挑战

金球奖后的思考：罗德里与足球运动员的心理挑战

燃气灶安装技巧大揭秘！

燃气灶安装技巧大揭秘！

冬季厨房安全指南：燃气灶使用全攻略

冬季厨房安全指南：燃气灶使用全攻略

三大空间、七种常用家具尺寸这样选不出错！

三大空间、七种常用家具尺寸这样选不出错！

购买电视后的正确使用和维护指南

购买电视后的正确使用和维护指南

韦唯再唱亚运主题曲：从《亚洲雄风》到《从现在到未来》

韦唯再唱亚运主题曲：从《亚洲雄风》到《从现在到未来》

《我们亚洲》：一首跨越33年的亚洲赞歌

《我们亚洲》：一首跨越33年的亚洲赞歌

这些江西地名，寓意吉祥如意，藏着美好祝福

这些江西地名，寓意吉祥如意，藏着美好祝福

中国古典文化中的鸳鸯象征意义解析

中国古典文化中的鸳鸯象征意义解析

寿字纹——中国古代纹样元素

寿字纹——中国古代纹样元素

用绕口令练出好声音，你敢挑战吗？

用绕口令练出好声音，你敢挑战吗？

绕口令：从传统语言游戏到网络"顶流"

绕口令：从传统语言游戏到网络"顶流"

用绕口令搞定运动前的呼吸训练！

用绕口令搞定运动前的呼吸训练！

晨读时如何更高效地背诵古诗词和英语单词

晨读时如何更高效地背诵古诗词和英语单词

晨读如何让孩子高效记忆？

晨读如何让孩子高效记忆？

晨读小妙招：用词根词缀+间隔复习秒变单词达人

晨读小妙招：用词根词缀+间隔复习秒变单词达人

双减后，晨读成为高效学习神器？

双减后，晨读成为高效学习神器？

胃病的人吃什么水果比较好

胃病的人吃什么水果比较好

冰岛：北大西洋上的神秘岛屿国家

冰岛：北大西洋上的神秘岛屿国家

非农就业数据超预期，黄金投资如何应对？

非农就业数据超预期，黄金投资如何应对？

黄金投资：如何避免被套牢？

黄金投资：如何避免被套牢？

2025年黄金投资新趋势：如何抓住机遇？

2025年黄金投资新趋势：如何抓住机遇？

深度探秘：四川海螺沟冰川温泉之旅攻略推荐

深度探秘：四川海螺沟冰川温泉之旅攻略推荐

从成都去海螺沟怎么去，从成都到海螺沟车程多少小时？

从成都去海螺沟怎么去，从成都到海螺沟车程多少小时？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号