资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

GoT 思维图：用图的各种变换，来模拟人脑的复杂网络，提升大模型推理关联能力

创作时间:

作者:

@小白创作中心

GoT 思维图：用图的各种变换，来模拟人脑的复杂网络，提升大模型推理关联能力

引用

CSDN

https://blog.csdn.net/qq_41739364/article/details/140474531

GoT（Graph of Thoughts）思维图模型是一种通过图的各种变换来模拟人脑复杂网络，从而提升大模型推理关联能力的技术。本文详细介绍了GoT的背景、原理、设计和应用，通过对比CoT（思维链）和ToT（思维树），阐述了GoT的优势和应用场景，特别是医疗诊断场景中的应用。

提出背景

CoT（Chain-of-Thought，思维链）：生成一条单一的推理路径。这种方式就像一个接一个地解决问题的步骤，每个步骤只依赖于前一个。
ToT（Tree of Thoughts，思维树）：生成多条推理路径，形成一个树状结构。这允许在推理时探索不同的分支，类似于你在面对决策时考虑不同的选择。
GoT（Graph of Thoughts，思维图）：不仅生成多条推理路径，而且这些路径可以交叉和重新连接，形成一个网络。这更类似于一个复杂的网络，其中每个思考点都可能与多个其他点相连，允许信息在网络中自由流动，从而产生更全面和灵活的解决方案。

GoT框架通过将推理过程建模为一个有向图，可以使各个思考单元（节点）之间不仅线性相连，还可以进行更复杂的交互，从而模拟人类思维中的非线性和复杂性。问题在于，怎么模拟？人的思维 = 复杂网络 = 图的各种变换！GoT使用图论来建模并增强LLMs的推理过程。如果将 LLM 的推理过程建模成图，那么就能自然地实现这些以及其它许多思维变换。

为什么使用 GoT？

在医疗问诊的场景中：

CoT（思维链）
特点：CoT生成单一的线性推理路径。在医疗诊断中，这种方法可能按顺序考虑每一个症状和相关的疾病，但它通常不允许同时处理多个相互关联的症状。
局限性：在复杂的医疗案例中，单一路径可能无法充分捕捉到症状之间的交互作用，可能导致误诊或漏诊。
ToT（思维树）
特点：ToT生成一个树形结构的推理路径，允许并行考虑多个诊断假设。这在某种程度上优于CoT，因为它可以探索多个可能的疾病和相关的症状。
局限性：尽管ToT提供了并行处理的能力，它的每个分支通常是独立的，这意味着不同分支之间的信息可能无法有效整合，仍可能忽略症状间的复杂关系。
GoT（思维图）
特点：GoT通过创建一个图形结构，其中节点代表不同的诊断思考，边代表节点之间的逻辑关系。这种结构不仅支持并行处理，还允许节点之间的广泛互动。
优势：
互动性：节点之间可以有多种连接，允许医生从多个角度分析症状之间的关系。
灵活性：医生可以根据新信息（如实验室测试结果）动态调整推理路径。
全面性：通过聚合和精炼转换，GoT可以整合多个诊断假设，提供更全面的疾病分析，增加诊断的准确性。

考虑一个患者同时出现发烧、咳嗽和疲劳的情况。使用GoT，医生可以建立一个包含流感、普通感冒和肺炎等多个可能疾病的思维图。这个图将显示这些疾病如何可能与各种症状相关联，还可以根据诊断测试结果（例如血液分析）动态更新。如果发现某些症状组合特别符合肺炎，GoT可以帮助医生快速调整诊断焦点，并考虑是否需要进一步的影像学检查或抗生素治疗。

GoT的核心子解法

GoT由三个核心子解法组成：

子解法1：图形结构化

特征：使思维模型具备高度互联和灵活性。
之所以用图形结构化子解法，是因为图形能够有效地模拟复杂的关系和互动。例如，GoT通过图形结构化，可以将各个思维点（节点）通过边相互连接，从而支持非线性和多路径推理过程，这反映了现实世界问题处理的复杂性和互联本质。
逻辑链：这是一种网络结构，因为每个节点可以与多个节点直接连接，形成一个复杂的网络。

子解法2：自我评估

特征：增强模型的自适应能力和动态决策能力。
之所以用自我评估子解法，是因为自我评估允许模型根据当前的推理结果动态调整其后续的操作。例如，GoT可以在推理过程中根据已生成的思维节点的效果，决定如何扩展或修正思维图，以提高解决方案的准确性和效率。
逻辑链：这是一个链条结构，因为自我评估通常是顺序进行，一个评估的结果会影响下一步的决策。

子解法3：模块化任务处理

特征：通过分解复杂任务来简化问题解决过程。
之所以用模块化任务处理子解法，是因为模块化允许将大问题分解为更小、更易管理的子任务。例如，GoT通过将一个大的排序任务分解为多个小的排序任务，独立处理这些小任务后再合并结果，这样不仅提高了处理速度，也降低了错误率。
逻辑链：这是一个决策树形式，因为每个子任务的完成是基于之前子任务的完成情况，形成了一个阶段性的决策过程。

图的各种变换：聚合与生成

聚合是将多个信息源或数据点合并成一个综合的单元，以便进行更全面的分析或决策，如将多个患者症状汇总以做出诊断。生成是基于现有信息或数据点创造新的元素或思考路径，以探索新的可能性或解决方案，如基于对多个患者的症状数据进行分析，生成针对特定疾病可能性的详细诊断报告。聚合（Aggregation）和生成（Generation）这两种操作主要属于子解法1（图形结构化）。

聚合：

图论视角：多个节点的信息被聚合到一个节点中。
排序任务实例：将多个已排序的子数组合并成一个完整的已排序数组。
写作任务实例：将多篇文章合并成一个连贯的总结。

生成：

图论视角：一个节点分裂成多个新的节点，每个新节点依赖于原节点。
排序任务实例：将一个未排序的数组分裂成多个子数组，为后续的排序做准备。
写作任务实例：从一篇文章生成多个关键词摘要，以提高质量。

工程设计：细粒度控制

对于不同的任务，最佳的图结构是什么样的？

最佳的图结构：根据每个任务的特定需求选择图结构，如线性、树状或网络形式，以确保信息流动和处理最符合实际应用的逻辑。

怎么设计最有效的聚合思维方法，以最大化准确度并最小化成本？

设计最有效的聚合思维方法：通过评估哪些节点的信息相互关联并可以合并来减少冗余，选择合适的方法来整合这些信息，以增强决策的准确性同时降低处理的复杂性和成本。

提出了【细化变换】，这种变换允许用户通过高度的控制自由度，动态地改变和结合不同的思维节点。具体来说，这个功能让用户能够将表现最好的或最相关的信息点相结合，创造出新的、更有力的解决方案。

这种方式的有助于理解GoT的设计如何响应各种挑战，并通过结构化的方法提高问题解决效率和效果的清晰视图。

GoT 流程

系统架构：这部分展示了GoT框架的主要组件，如Prompter、Parser、Scoring & Validation、Controller。它们各自的功能是生成提示、解析LLM输出、评分验证，以及控制整个推理过程。
API：列出了各个组件的可扩展API，例如Prompter的Generate和Aggregate操作，以及Parser的ParseGenerate和ParseAggregate等。这些API使得GoT框架能够灵活地应用于不同场景，支持用户自定义和扩展。
图形化的操作（GoO）与图推理状态（GRS）：介绍了操作图和推理状态如何支持推理过程的管理和进展，以及如何保持整个推理过程的连贯性和动态更新。
排序用例：通过具体的示例解释了GoT如何处理数字排序问题。从接收初始输入的数字序列开始，展示了如何通过生成、聚合等操作分割、排序和合并子序列，以达到最终的排序输出。
详细操作流程：每一个步骤都配有具体的操作指令和图示，说明了如何从输入到输出，通过各种中间步骤处理和改进LLM的输出。这包括如何利用GoT的API来生成新的提示、聚合中间结果，以及如何重复某些操作来优化输出。

Prompter（提示器）

功能：输入患者的症状，如发烧、咳嗽和胸痛。
作用：提示器将这些症状作为查询问题发送给LLM。

Parser（解析器）

功能：解析LLM生成的回答，这些回答可能包括不同的诊断建议和相关的医学信息。
作用：提取出LLM回答中的关键信息，如提到的疾病名称和推荐的检查项目。

Scoring module（评分模块）

功能：对LLM的回答进行评分，判断每个诊断建议的可靠性。
作用：确定哪些回答更有可能是准确的，如根据症状和统计数据评估肺炎的可能性。

Controller（控制器）

功能：
决策：根据评分模块的输出选择最可能的诊断。
管理元素：指导如何进一步进行检查以确认诊断，例如指定进行X光检查。
作用：确保推理过程按照逻辑和有效性推进，以及及时调整策略。

Graph of Operations (GoO)（操作图）

功能：定义了一系列预设的操作，如查询症状、获取诊断建议、请求额外检查等。
作用：保持推理流程的结构化和有序，确保所有必要的步骤都被执行。

Graph Reasoning State (GRS)（图推理状态）

功能：动态记录整个推理过程的状态，包括已经提出的诊断假设和已执行的检查。
作用：随时更新诊断进程，确保所有信息都被考虑在内，避免遗漏关键数据。

在这个场景中，GoT框架通过其各个组件的协同工作，能够有效地管理从初步症状描述到最终诊断的整个流程。例如，如果初步的LLM诊断建议指向肺炎，但实验室测试（如血常规）和X光检查的结果与典型的肺炎表现不符，控制器可以决定调整诊断方向，探索其他可能性如支气管炎或肺结核，并更新操作图和推理状态以反映这些新信息。这种动态的调整过程有助于医生做出更准确、更全面的诊断决定。