UX设计规则更新了!如何为生成式AI设计用户体验界面?
UX设计规则更新了!如何为生成式AI设计用户体验界面?
生成式AI正在改变我们的交互方式。从早期的命令行到图形界面,再到如今的对话式AI,人机交互经历了翻天覆地的变化。本文将探讨生成式AI用户体验设计的最新趋势,包括上下文捆绑、用户管理、信任构建和生态系统建设,帮助读者理解AI交互设计的未来方向。
从命令到对话
让我们回顾计算机发展的早期阶段,使用计算机意味着在命令行界面(CLI)中输入精确的命令。想象一下,记住打开文件或复制数据的确切命令是多么困难,更不用说找到你的"家庭作业"文件夹了。显然,并不是每个人都适合成为程序员。为了实现更广泛的可用性,必须进行转变。
1964年,ELIZA诞生了,这是自然语言处理的早期尝试,通过关键字识别和脚本响应让用户参与基本对话。尽管具有开创性,但ELIZA的交互远非灵活或可扩展。
与此同时,施乐PARC正在开发图形用户界面(GUI),后来由苹果于1984年和微软随后推广。GUI彻底改变了计算方式,用图标、菜单和窗口取代了复杂的命令,可通过鼠标进行导航。这一创新使得计算机对日常任务变得易于访问和直观,为技术在我们生活中的普遍作用奠定了基础。
今天,我们正在见证一个类似的演变。用户提示本质上是用自然语言编写的小程序,结果的质量取决于我们的提示工程技能。正如早期计算从CLI的复杂性过渡到GUI的简单性,使每个人都可以使用技术一样,我们也看到了类似的趋势,即生成式AI正在将复杂的输入捆绑到更简单、更用户友好的界面中,并在后台保持向复杂性的方向发展。
- Stable Diffusion WebUI、Midjourney和DALL·E 3展示了以图形方式表示复杂图像扩散后端的不同方法。
- 这些图像生成器在提示中要求不同级别的精度以获得结果。虽然Midjourney和DALL·E更容易使用,但Stable Diffusion允许获得更具体的输出。然而,我们对用户了解得越多,就越容易提供简单的体验,同时保持他们想要的特定性。
上下文捆绑
上下文捆绑通过将相关信息组合成单个命令来简化交互,解决了传达复杂指令以实现期望结果的挑战。这通过一次性调整用户意图和机器理解来增强效率和输出质量,无需手动编写用户提示。
我们已经在生成式AI工具中看到了这种情况,例如Edge中的示例提示、Google Chrome的标签管理器和Stable Diffusion中的触发词,这些都是提示中的特殊标记,可以通过文本反转、LoRA模型或其他细化方式进行调整。
在上下文捆绑中,"对话式"人工智能并不总是指对话。它关注的是用户试图获得的结果,而不是仅仅依赖于基于文本的提示。上下文捆绑为用户提供了一种无需进行冗长对话即可获得期望输出的快捷方式。用户体验不再仅仅依赖于通用的对话界面。差异化由具体数据和更专业化的体验驱动。
具体示例包括Miro Assist、Clay AI公式生成器和SCOPUS AI。每个命令都通过将相关信息组合到特定的单个命令中来简化交互。
扩展上下文捆绑的另一种方法是让用户定义这些捆绑包的属性。用户可调整的偏好和个性化被捆绑到上下文中,为用户在产品后期提供更高效和更相关的交互。
上下文捆绑不仅仅是简化对话,而是帮助用户直接实现他们的目标,无论是通过搜索查询、摘要还是其他特定任务。它将详细的指令转化为简单易用的交互,特别适用于直接或重复性任务。但是,对于更开放的任务,如探索,或者需要改进的目标呢?这就是需要持续的用户反馈机制或反馈循环的地方。
用户管理
尽管在使人工智能交互更加直观方面取得了进展,但仍然存在一系列需求,用户必须调整输出以实现其特定目标。在进行研究、头脑风暴、创建创意内容、完善图像甚至编辑等活动中,这一点尤为明显。不断增加的上下文窗口和多模式功能使得指导用户完成复杂性变得更加重要。
无论是否意识到,作为人类,我们都在不断策划我们对世界的体验。这种策划可能表现为在对话中突出或选择感兴趣的关键词,或在书籍中手动突出。在观察用户使用ChatGPT进行头脑风暴时,我注意到了这种类似的突出行为。当时用户无法与突出部分进行交互,但却利用其部分内容指导下一步行动。这表明,尽管初始输出可能无法完全满足用户的需求,但它确实提供了具体的锚点,用于指导下一步行动。使用户更容易管理和优化其输出,使用户和机器都能获得更高质量的结果。
- 示例包括Clipdrop、ChatGPT、HeyPi、Google Circle和GitHub Copilot。
- 在上图中,修复、线程对话和突出显示交互都是新兴示例,它们展示了用户如何策划信息的特定部分,以创建更相关的上下文并获得更好的结果。
再以写一份经过充分研究的报告为例。用户的旅程通常从广泛的研究开始,从而发现需要更深入调查的关键点。当他们收集和评估信息时,他们逐渐将其编制和综合成最终成品。在此过程中,突出显示或选择特定内容的时刻起着关键作用,引导AI提供更相关的结果和上下文。此路径需要用户保存和使用突出显示的方法。
用户需要保存特定的亮点,并使用这些亮点来完善他们的体验。这需要深入了解用户结果,并创建反馈机制来捕捉这一点。用户策划揭示了为了有效支持复杂的创意任务,生成式人工智能必须不仅理解,而且预测用户与信息互动的微妙方式。通过识别和响应这些"策划信号",人工智能工具可以提供更有针对性的帮助,丰富整体用户体验和结果。
为足够的信任而设计
虽然生成式人工智能使用户更容易与技术进行交互,但信任仍然是广泛采用的重大障碍。这在过去是真的,今天仍然如此。解决信任问题是建立和鼓励采用新AI工具的关键。在理解人们接受和使用新技术的许多框架中,有两个框架特别具有启发性:统一的技术接受和使用理论(UTAUT)和福格行为模型(FBM)。
作为一个有用的过度简化:UTAUT表明,使用意愿受到绩效预期、努力期望、社会影响和促进条件的影响。例如,有人可能决定开始使用客户管理工具,因为他们相信这将有效地帮助他们实现销售目标(绩效预期),他们发现该应用程序简单明了且用户友好(努力期望),他们的同事和导师也使用和推荐它(社会影响力),并且他们的组织数据库可以通过它访问(促进条件)。
类似的理论,FBM将行为简化为动机、能力和提示(或触发)。例如,购买咖啡的行为是由对咖啡因的渴望、金钱和附近咖啡店的存在以及咖啡店标志作为提示所驱动的。
生成式AI减少了实现结果所需的感知工作量。有趣的是,许多用户已经通过生成式人工智能克服了激活惯性。然而,确保更多的用户尝试并保持参与是信任起着至关重要的作用。
在信任设计的背景下,有许多像上面提到的那样的观点和框架。在这里,我们将进一步简化并考虑信任是由以下因素塑造的:以前的经验、风险承受能力、互动一致性和社会背景。
过往经历:我们必须意识到用户有过往经验的包袱。他们带着由先前经历创建的背景进入体验。要影响这种信任基础,我们只需不要重复造轮子。熟悉的界面和交互方式使用户能够将过去的信任转移到现在。在这种信任基础上建立起来要容易得多,而不是与之对抗。以对话式人工智能为例,与其告诉用户输入提示,我们可以利用潜意识倾向在对话中进行模仿,通过使用回应来影响用户的互动方式。
风险承受能力:了解用户想要避免负面结果。关键是了解用户不会承担哪些风险。我们必须将风险降到用户的风险容忍度以下。影响风险容忍度的一些方法包括:增加透明度、用户控制、用户同意、遵从性。创建精心设计的体验可以利用美观的可用性来降低风险预期。然而,针对特定产品的方法总是更有效。例如,想象一下为医生提供诊断的对话式人工智能。风险容忍度非常低。误诊对医生和患者都会产生极大的后果。通过参考资料、及时细分和相互冲突的观点确保产出透明度将有效降低风险。
交互一致性:交互既是输出,也是用户到达目标的方式。用户不应该猜测不同的词语、情况或行动是否意味着相同的事情。为了提高交互一致性,请确保从布局到按钮文本都保持内部和外部一致性。在对话式人工智能的背景下,交互一致性可能表现为回应在整个对话中具有相似的格式,单词在整个对话中具有相同的含义。如果用户请求某个主题的摘要,那么在一个互动中它不应该看起来像一篇文章,在另一个互动中不应看起来像一个项目列表,除非用户明确要求。
社会背景:可能是最明显的层层。社交环境可以包括来自受信任来源(如经理)的认可,或受信任网络内的促进,例如与预先批准的企业软件建立连接。交环境可以受到社交验证策略的影响,并在互动中创造社交验证机会。在内部数据库的背景下,这可能意味着突出用户及其直接团队完成的工作。指出系统具有内部数据的可见性有助于进一步建立对该系统在社交环境中已经获得批准的信任。
在设计对AI体验的信任时,哪些因素值得考虑应该成为当务之急。通过理解和设计信任的这些方面,人工智能体验可以与用户的期望和需求保持一致,从而提高普遍的采用和接受度。解决信任问题不仅是有益的,而且对于未来整合和接受生成式AI工具是必要的。
上下文生态系统
本文介绍了上下文捆绑、用户管理以及信任设计的新兴趋势。总的来说,生成式AI通过降低日常用户开始执行任务的门槛,彻底改变了生产力,这反映了GUI的好处和历程。然而,现代用户体验的发展已经远远超出了窗口和指针。那么,生成式人工智能下一步会走向何方呢?
GUI通过支持多个程序界面,促进了更深入、更高效的用户交互。这允许用户在不同的任务之间无缝转换,比如在一个应用中进行会计工作,在另一个应用中进行报告。管理和跨越不同的上下文突显了通过连接不同用户意图和应用程序带来的生产力收益。
如上所示,新兴示例包括Edge、Chrome和Pixel Assistant,它们集成了AI功能,允许用户使用生成式AI与他们的软件进行交互。在这种情况下,LLM意识到了软件,这超出了先前应用程序限制它的对话窗口。
回顾过去,我们看到GUI如何为用户创建数字画布。与物理世界相比,这样做的优势是:提高效率、可扩展性和生产力。生成式人工智能很可能会走上类似的道路,人工智能成为合作者,将我们的日常生活变成一种共享体验。未来可能是一个增强的生态系统,对话式和生成式AI工具将连接专业代理,形成一个统一的工作流程。这种生态系统方法可以进一步深化用户交互,从而在各种数字和现实世界环境中提供更加一体化和高效的体验。
未来的趋势不仅仅是对话或伴侣式体验。与我们今天看到的类似,生成式人工智能将直接工作以创建输出。目前用户参与输出,但终究是AI才是画布的创造者和所有者。随着我们与以人为中心的AI产品的成熟,下一步将是创建AI和用户可以在同一画布上合作的空间。
我们在以前的工具如Grammarly中看到了这一点,在像GitHub Copilot这样的生成工具中也看到了这一点。我们看到生成式AI作为贡献者进行合作,而用户最终创建并拥有工作空间。随着我们对技术的熟悉和技术的不断发展,我们可能会看到生成式AI在管理我们日常生活(物联网)的数字和物理方面发挥更大的作用,增强现实并重新定义我们的生活和生产力方法。
不断发展的生成式人工智能交互正在重复人机交互的历史。随着我们创造更好的体验,将上下文捆绑到更简单的交互中,使用户能够策划他们的体验,并增强已知的生态系统,我们将使生成式AI更值得信赖、更易于访问、更可用,并且对每个人都更有益。