问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

知识工程与知识获取:从零到进阶的实用指南

创作时间:
作者:
@小白创作中心

知识工程与知识获取:从零到进阶的实用指南

引用
CSDN
1.
https://blog.csdn.net/k316378085/article/details/145766170

知识工程与知识获取:从零到进阶的实用指南

什么是知识工程?

知识工程是通过计算机技术对人类知识进行建模、管理和应用的一门交叉学科。它不仅仅是编写代码,更是通过构建知识库、实现智能问答、推荐系统等应用,让技术真正服务于人类。

什么是知识获取?

知识获取是从现有数据、文本、图像等多种来源中提取有价值的知识,构建知识表示的过程。它包括自然语言处理、数据挖掘、机器学习等多种技术。

知识工程与知识获取的关系

知识工程依赖知识获取,而知识获取又是知识工程的基础。两者相辅相成,共同推动人工智能技术的发展。

知识工程的构建步骤

  1. 需求分析:明确应用场景,确定知识库的范围和目标。
  2. 数据收集:从文本、图像、音频等多种来源获取数据。
  3. 知识表示:选择合适的表示方式,构建知识图谱或实体关系图。
  4. 知识推理:通过逻辑推理或机器学习,扩展知识库。
  5. 知识应用:将知识用于智能问答、推荐系统、决策支持等场景。

知识获取的挑战

  1. 数据质量:如何处理噪声数据和不完整数据?
  2. 语义理解:如何让计算机真正理解人类语言?
  3. 效率问题:如何在大规模数据中高效提取知识?
  4. 模型泛化:如何让模型在不同场景下表现良好?

知识工程的发展历史

知识工程的发展历史可以追溯到20世纪60年代,随着人工智能和计算机技术的快速发展,逐渐成为一门独立的学科。以下是知识工程发展历史的几个关键阶段和重要发展:

早期阶段:专家系统(20世纪60年代)

  • 特点:早期知识工程主要集中在专家系统领域。通过模拟人类专家的决策过程,解决复杂问题。依赖于预定义的规则和知识库,利用逻辑推理进行决策。
  • 代表技术:MYCIN(医疗诊断)、DENDREX(化学反应分析)、智能Shell(如NARS)。

符号主义方法(20世纪70年代到80年代)

  • 特点:强调符号表示和逻辑推理。将知识表示为符号形式(如逻辑命题、规则、框架等),并通过形式逻辑进行推理。
  • 代表理论:框架理论(Frames)、语义网络(Semantic Networks)。
  • 工具与系统:NOLOGIC、Production Systems(如MYCIN)、KL-ONE。

知识工程循环(20世纪90年代)

  • 特点:强调知识工程的完整过程,从需求分析到知识实现和应用。强调与业务流程的结合,注重知识系统的实用性和可扩展性。
  • 核心步骤:需求分析、知识获取、知识表示、知识建模、知识实现、知识应用。
  • 代表工具与方法:Kee、DAME、KRB方法论。

现代阶段:数据驱动与智能化(20世纪90年代到21世纪)

  • 特点:随着人工智能(AI)和大数据技术的发展,知识工程更加注重数据驱动的知识获取和知识表示。强调智能化,结合机器学习和深度学习技术,提升知识系统的自动构建和优化能力。
  • 代表技术:知识图谱(Knowledge Graphs)、自然语言处理(NLP)、深度学习。
  • 应用领域:电商(推荐系统)、教育(智能学习系统)、医疗(知识辅助诊断)、金融(风险评估)。

“知识汤”概念

“知识汤”(Knowledge Soup)是一种比喻性的概念,用来描述一种通过整合和组织大量知识,形成一个统一、易于使用的知识平台或系统。它类似于将分散的知识“煮”成一个统一的知识“汤”,方便人们理解和利用这些知识。

在知识工程中,“知识汤”可以理解为一种整合、管理和应用知识的方法。它强调将零散的知识点、规则、数据等通过某种方式组织起来,形成一个易于访问和应用的知识体系。这种知识体系可以是基于数据库、语义网络、图数据库或其他技术实现的。

关键点:

  1. 整合性:将分散的知识点整合到一个统一的系统中。
  2. 易用性:提供一个方便的知识获取和应用方式。
  3. 统一性:通过某种结构化的方式,使知识易于管理和扩展。

人类获取知识的瓶颈

目前,机器自动化获取知识还面临许多挑战。虽然人工智能技术取得了显著进展,但机器还远远无法达到人类预期的效果。自动化理解、认知并获取全世界的所有知识仍然是一个任重道远的目标。

简化的知识工程:知识图谱工程

知识图谱工程是一种利用知识图谱技术进行大规模知识抽取、存储和管理的系统工程。知识图谱是一种基于图结构的知识表示方法,能够有效整合和表达各种类型的知识。知识图谱工程的核心目标是通过系统化的知识抽取、存储和优化,构建一个高效的知识管理系统,支持知识管理和知识应用。

知识图谱工程更加注重依靠大数据自动化的提取知识,更加注重知识的规模。主要的知识抽取技术包括概念抽取、实体抽取、关系抽取、事件抽取和规则抽取。知识的来源主要包括结构化数据、半结构化数据和非结构化数据,其中从文本中获取知识是主要方式。

一个事件抽取的过程,可以看成是一组三元组提取的过程。

总结

知识图谱工程是简化了的知识工程,它专注于大规模知识的自动化抽取和管理,与传统的专家系统有本质区别。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号