问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

一文看懂五款AI对话产品:功能设计与使用体验全解析

创作时间:
2025-01-21 21:45:37
作者:
@小白创作中心

一文看懂五款AI对话产品:功能设计与使用体验全解析

在人工智能蓬勃发展的时代,AI对话类产品如雨后春笋般涌现。它们各具特色,功能多样。本文通过对讯飞星火、文心一言、通义千问、Kimi、豆包五款热门产品的详细分析,从页面布局、对话交互、亮点设计等多个方面,帮助读者深入了解这些热门AI对话产品。

一、AI产品的输入框布局

① 基础的元素

根据5大AI竞品提炼出的基础元素。

  • 提示文本:使用户能够在生成AI聊天中输入和发送的文本提示,显示可选的占位符文本以建议操作。
  • 发送图标:用户输入完成,用来进行下一步操作的按钮。
  • 上传文件:支持上传文档、图片等。

② 各产品的布局展示

  • 讯飞星火:采用上下结构布局。在基础的框架上,把一些快捷功能融入到输入框内部,增加与输入信息的关联性;在Web端融入了移动端的丝滑交互:语言录入;同时将一部分智能体模型外置展示,放在输入框下方,方便用户调用,加强智能体与输入对话的连接。

  • 文心一言:采用框内布局展示。将功能主要聚焦于输入框内进行展示。输入框内上下布局,用分割线进行分隔,上方展示产品智能体模型及指令,下方聚焦于文本相关操作:直接输入、上传文件图片,将发送按钮放置右下角。

  • 通义千问:充分利用周边结构布局。在输入框左上右三个方向都有操作功能。上方展示部分智能体,方便用户调用;左侧聚焦上传功能,可以上传文件、图片等操作;右侧聚焦指令功能,可以调用指令及新建指令操作。

  • Kimi:采用框内布局展示。将功能主要聚焦于输入框内进行展示,左右布局排布。左侧展示联网搜索,给予用户操作结果预期;右侧展示发送按钮及产品能力:上传、常用语功能;同时根据提示文本操作,可一键切换Kimi探索版,增加与用户的链接。

  • 豆包:采用上下结构布局。上方展示智能体模型,方便用户调用;输入框内将操作都放置在了右侧,避免影响左侧输入内容展示,加入语音录入功能,方便用户快速录入信息,同时加入截图提问客户端引导下载入口,增强产品与用户的链接。

③ 差异化的设计

(1)联网/深度搜索

5个竞品中,讯飞星火、Kimi、豆包支持联网搜索;讯飞星火、通义千问、豆包支持深度搜索。

  • 联网搜索:是指AI产品通过连接互联网,利用搜索引擎技术来查找和获取相关信息。这种搜索方式主要依赖于互联网上现有资源,通过爬虫技术抓取、索引网页内容,并根据用户的查询请求返回相关的网页链接或信息片段。

  • 深度搜索:是指AI产品利用深度学习、自然语言处理等先进技术,对信息进行更深层次的挖掘和分析,以提供更准确、更全面的搜索结果。这种搜索方式不仅依赖于互联网上的现有资源,还通过算法对信息进行整合、推理和生成。

(2)指令调用

5个竞品中,讯飞星火、文心一言、通义千问、Kimi支持使用指令进行问答。

  • 讯飞星火:可在指令中心直接调用或修改指令。
  • 文心一言、通义千问:可在指令中心直接调用或新建自定义指令。
  • Kimi:可自定义常用语指令,系统模版在新建指令时随机展示。

(3)预判设计

5个竞品中,Kimi和豆包在粘贴图片后进行预判。

  • 设计:提供辅助文本,将用户下一步的操作外置,预判用户接下来的行为。
  • 布局:粘贴图片展示,讯飞星火和Kimi是展示在输入框下方;文心一言、通义千问、豆包是展示在输入框内。
  • 交互:在粘贴图片后,通义千问需要输入相关指令才可点击「发送」按钮,其他4款竞品的按钮直接可点击。

(4)语音录入

5个竞品中,讯飞星火和豆包支持语音录入。

  • 讯飞星火

  • 触发:点击「语音」按钮

  • 结束:点击「语音」按钮语音录入后,编辑文本,语音不会停止;但再次进行语音时,刚编辑的文本会被清空,继续录入语音识别的内容。

  • 豆包

  • 触发:点击「语音」按钮

  • 结束:点击「语音」按钮,或者编辑文本语音自动终止

(5)文本润色

5个竞品中,讯飞星火和文心一言支持文本润色。

  • 讯飞星火旧版
  • 入口:触发输入框,显示「指令内容优化」按钮,输入文字后按钮高亮
  • 新版入口:新版官方说「指令内容优化」功能还存在,但我没找到入口,大家有知道的也可以讨论下
  • 文心一言
  • 入口:输入框内、新建指令内容框内。在输入框输入文字后高亮显示,润色后有切换Tab,依旧保留润色前的内容,由用户按需选择。

二、AI产品的对话交互

① 基础的元素

根据5大AI竞品提炼出的基础元素。

  • 用户输入消息:用户从输入字段发送到对话的消息
  • 人工智能输出响应:用户在与生成式人工智能对话时收到的消息
  • 头像:参与对话者身份的视觉标识,使用头像来代表用户和生成AI
  • 功能按钮:一般包括重新生成、复制、分享等操作,方便用户对于输出结果的下一步处理
  • 反馈按钮:一般包括赞和踩按钮,来收集用户对于回答满意度的反馈推荐
  • 输入:向用户推荐相关的内容,建议可发送的下一个提示,激励用户继续与生成式AI互动
  • 生成式AI输出标签:一个简短的标签,表明输出是由生成式人工智能产生的

② 各产品的布局展示

  • 讯飞星火

  • 新版对话布局采用左右结构,使用底色

  • 用户和生成式AI的内容:用户输入内容有底色,生成式AI输出内容无底色,使用背景底色。生成式AI输出内容、操作按钮及推荐输入,都居左对齐排布,依次展示在下方。此外,新版优化在头部加入讯飞星火产品LOGO,加强用户的品牌意识,也是生成式AI输入标签的另一种表达形式。

  • 文心一言

  • 对话布局采用上下结构,使用底色和头像区分

  • 用户和生成式AI的内容:用户头像展示默认头像,生成式AI头像展示产品Logo;用户输入内容无底色,生成式AI输出内容有底色。仅生成式AI输出内容及生成式AI输出标签展示在卡片内部,操作按钮和推荐输入内容展示在卡片下方,且推荐输入内容单条竖向排列。

  • 通义千问

  • 对话布局采用左右结构,使用底色和头像区分

  • 用户和生成式AI的内容:用户无头像展示,生成式AI有头像;用户输入内容和生成式AI输出内容底色不同,区分明显。生成式AI输出内容及操作按钮都在卡片内部,推荐输入内容在卡片下方,且单条竖向排列。

  • Kimi

  • 对话布局采用左右结构,使用底色和头像区分

  • 用户和生成式AI的内容:用户头像展示默认图标,生成式AI头像展示产品自定义头像,同时区分历史消息头像和最新消息头像;用户输入内容和生成式AI输出内容底色不同,区分明显。生成式AI输出内容和操作按钮展示在卡片内部,推荐输入内容在卡片下方,且单条竖向排列。

  • 豆包

  • 布局采用左右结构,使用底色区分

  • 用户和生成式AI的内容:用户输入内容有底色,生成式AI输出内容无底色,使用背景底色。生成式AI输出内容、操作按钮及推荐输入,都居左对齐排布,依次展示在下方。

③ 交互的内容差异

(1)加载状态

关于加载状态的展示,各产品聚焦于四部分内容的变化:

  1. 文本生成起始点进行加载缓冲;
  2. 文本跟随加载;
  3. 发送按钮加载;
  4. 头像加载
  • 讯飞星火:在「普通生成」中,使用文本生成起始点进行加载缓冲;在「联网生成」中,使用文本生成起始点进行加载缓冲,加载完成切换成常驻加载,提示用户是在使用联网搜索功能进行生成;两种生成方式中,发送按钮都是高亮状态,但不可点击。

  • 文心一言:输入框输入文本后,发送按钮变为加载样式;内容生成中,头像加载,文本跟随加载。

  • 通义千问:在「普通生成」中,使用文本生成起始点进行加载缓冲,短暂加载,后陆续生成内容,伴随跟随加载;在「深度生成」中,使用文本生成起始点进行加载缓冲,展示问题理解进度条,同时加载提示:正在搜索中…后陆续生成内容,伴随跟随加载;两种生成方式中,按钮由发送按钮变为停止生成按钮。

  • Kimi:结合了这4种加载方式,输入框输入文字,点击发送后,按钮变为置灰不可点状态;文本生成前,使用文本生成起始点进行加载缓冲;文本生成中,跟随加载及头像跳动加载;「联网生成」,在此基础上,加载提示:正在阅读文本;生成中,提示:阅读完成;「探索版生成」,在此基础上,提示:正在规划、正在搜索;生成中,提示:阅读完成。

  • 豆包:在「普通生成」中,使用文本生成起始点进行加载缓冲、文本跟随加载和按钮变化,由发送按钮,变为停止发送按钮;在「联网生成」中,再加入提示:基于XX个搜索来源;在「深入生成」中,再加入提示:正在深入搜索中及搜索来源。

(2)长文本内容生成

这5个竞品中,针对长文本内容生成的展示处理,主要有两种形式:

  1. 超出首屏向上滚动;
  2. 超出首屏屏幕固定,展示「一键置底」按钮。
  • 讯飞星火、文心一言、豆包:这3个产品采用超出首屏向上滚动的形式,这样视觉焦点始终定位到正在生成中的内容。

  • 通义千问、Kimi:这2个产品采用超出首屏屏幕固定,展示「一键置底」按钮,用户可手动点击滑动到底部。

(3)重新生成的思考

  • 内容重新生成:文心一言是采用分页及卡片堆叠方式来展示多对话层级的,同时鼠标hover在分页上,气泡提示:查看全部,点击展开右侧面板,查看全部对话信息;另外,在重新生成卡片中,文心一言会询问用户的意见:较上次回答的比较。讯飞星火旧版也是采用卡片+分页的形式,但新版后AI输出内容去掉了卡片,就仅剩下右上角的分页形式了。通义千问、豆包采用卡片内展示分页的形式;Kimi采用撤回消息的方式展示,上一条对话信息算历史消息,点击「点击查看」,弹窗展示上一条对话信息。

  • 输入重新编辑:讯飞星火、文心一言:在文本的后面展示分页;通义千问:在文本的下方展示分页;Kimi、豆包:是直接替换上一个文本的位置

(4)停止生成的思考

  • 按钮摆放位置:文心一言、Kimi:按钮在输出文本框下方,跟随文本展示;通义千问、豆包:在点击发送按钮后,将「发送」按钮,转换为「停止生成」按钮;讯飞星火:固定在输入框右上方

  • 停止生成展示:通义千问、Kimi、文心一言,这3个产品都有明确提示用户,该对话已停止;但讯飞星火和豆包没有。豆包比讯飞星火好一点的是,剩余未生成的部分使用“…”表示,也算是给了用户提示;讯飞星火生成的文本是成段落生成的,又没有停止生成标识,在视觉上很容易给用户误导,对话是生成完整了。

(5)快捷开启新对话

这5个竞品中,只有讯飞星火,在生成对话后,提示了「全新对话」按钮。这对于提高用户体验来说,有很大的帮助,因为充分考虑了用户的使用场景:当用户完成一个任务或讨论后,他们可能需要立即开始另一个完全不同的话题。增加「全新对话」按钮,用户可以快速开始一个新的对话,无缝地进入下一个主题的讨论,不仅节省了时间,还提高了操作的流畅性。

三、各产品的亮点设计

  • 讯飞星火:我个人比较喜欢的功能设计是「群聊」功能,这也是其他几款AI产品没有的。用户可以选择自己想要的智能体模型,加入群聊,重新命名,在对话中也可指定某个智能体回答问题,对于聚焦于某个使用场景的用户来说很便捷,无需分别开启不同的聊天窗口,极大提高了沟通效率。

  • 通义千问:通义千问印象深刻的功能设计点,我个人认为是效率工具集,我也咨询了下公司的其他小伙伴,能一下想起来的就是这个功能。主要这个功能设计对于打工人来说太友好了,特别是「实时记录」功能,它能够实时语音转文字、区分发言人、智能总结要点、生成思维导图等。对于会议会后溯源问题及做会议纪要的打工人来说真是太强了~

  • Kimi:大家有没有注意到,Kimi的首页logo设计是和节假日活动融合最好的产品,其他产品最多在首页模块加些活动节日主题之类的,但是Kimi会结合在logo上。比如:中秋节版本,会在logo中融入中秋节元素,同时辅助动效,加强活动氛围,鼠标hover到logo上月饼打开了。不过很可惜,那个版本没保留下截图。我从网上搜集了一些其他节假日活动的一些设计,大家可以看看~

四、浏览器插件体验

浏览器插件的展示多为悬浮窗展示,外置几种功能,在文档使用中会结合文档操作悬浮窗进行展示。这几款产品中,Kimi一如既往保留功能的简洁性,聚焦4大功能,名词解释(包括划词、框选截图)、总结全文、解释当前屏幕、快捷对话,同时可搭配快捷键使用。将划词框选功能单独拿出来,在阅读网页或者编辑文档时,一键点击Kimi图标,就可进行名词解释,很方便,大家可以试试~

  • 讯飞星火:外置3大功能:总结、翻译、提问。在使用插件翻译时,我发现和豆包插件的翻译有很大区别,大家可以看下图对比下~讯飞星火的翻译,仅支持当前页面,在切换页面时,翻译不生效;而豆包的翻译,支持该网页下全局的翻译,切换页面依然有效,而且豆包的翻译没有替换掉原英文,中英对照的方式,更方便用户对比查看,用户体验更好。

  • 豆包:外置5大功能:语音录入、收藏网页、截图识文字、总结页面、翻译页面,同时可结合快捷键使用,滚动显示设置按钮。豆包除了翻译功能外,我很喜欢的一点是根据用户场景化进行设计。比如,我在写文档时,右侧提示「编辑」按钮,点击,豆包可以帮你写、重写,这两个操作都是跟写作紧密相关的,放在这里再合适不过了。

最后

竞品分析是一个长期的过程,我们可以通过横向和纵向的对比,更加了解每个产品,根据自己的需求和使用场景选择合适的AI对话工具,同时阶段性的总结也会使得我学会从多维度去思考,基于这些竞品提供了宝贵的经验和启示,更好地理解和把握AI对话类产品的未来发展。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号