问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

从零开始学习用AI工具提升生产力,我的三项实践心得

创作时间:
作者:
@小白创作中心

从零开始学习用AI工具提升生产力,我的三项实践心得

引用
1
来源
1.
https://haosquare.com/ai-tool-productivity-tips/

随着人工智能(尤其是生成式AI、大型语言模型LLM)技术的快速发展,越来越多的人开始使用各种AI工具来提高工作效率和生产力。然而,面对琳琅满目的AI工具,很多人可能会感到困惑,不知道该如何开始使用。本文将根据作者的学习经验,提出三大AI应用建议,帮助读者快速上手并真正提升工作效率。

任务导向:搞清楚要AI做到什么事

"锤子定律":「如果你有的只是一把锤子,那么所有的东西看起来都像一个钉子」
——马斯洛《科学的心理学》

在AI工具如雨后春笋般推陈出新的今天,最容易陷入FOMO或锤子定律的思考偏误。在社交媒体上不断看到新的AI工具,每一个都想试一试、或者收藏进笔记,深怕自己一旦漏看了哪一款新的AI就会跟不上时代,却终究只徒增焦虑,毕竟,AI模型与工具的确是越新越厉害,但不代表新工具一定对你的生产力更有帮助。

在开始使用AI工具之前,最重要的是先思考自己究竟想要达成什么任务、或者解决什么问题。不需要盲目地学习一大堆AI工具,而是应该先搞清楚自己想要做到什么事,再依照自身需求寻找合适的AI来协助,才能让AI有效产生助益。

刚起步这种"任务导向"思维时,作者采用了一个非常简单的方法:打开我的待办清单(TODO list)看看我接下来要做什么,尝试寻找AI工具帮我完成这些事。TAAFT就是一个找寻AI工具的好用网站。例如,作者发现了一个从去年放到现在都还没做的工作项目——将某一场公开演讲截取成YouTube Shorts的短片形式、希望让更多人看到,根据此任务目标,作者到TAAFT网站搜索"Video Editing"关键字,确实找到了Munch AI可以一键把超长影片剪辑成几个简短的精华片段、还自动加上字幕,完全符合作者的需求,可以省下一大堆学习视频剪辑与上字幕的时间,解决这个陈年待办工作。

除了用待办清单来思考未来要完成的任务,作者也会回顾自己过去都把时间花在哪里?有没有什么工作事项是可以用AI工具来提升效率的?上周日历的行程是否有AI可以辅助的工作?

例如,作者查看了iPhone的屏幕使用时间,看到自己上一周总共花了4.5个小时在看YouTube视频,就进一步到YouTube查看自己最近看了什么视频,发现(除了很多是在看搞笑视频傻笑以外)有2个小时左右的时间是在看技术分享的录像。

作者在一周内花了4.5个小时看YouTube
比我以为的时数多好多 (・_・;
(来源:好豪自己的iPhone屏幕使用时间)

回顾花费时间后,作者开始发想:"长达一个小时以上的视频,我能不能用AI工具节省学习时间?",清楚产生出这项需求、并搜索解方后,作者学会用Google Gemini可以直接帮自己摘要YouTube的长视频,或者也能用Glasp帮自己自动生成视频字幕、再交给ChatGPT帮自己摘录重点,这些方法都帮作者大大增加了看技术分享长视频的学习以及做笔记效率。有针对性地寻找工具,作者的生产力从明天就立刻获得提升。

至于类似"20个超好用必备AI工具"这种标题的视频或文章,看再多都不见得对生产力有实质帮助,少看就少焦虑!

了解AI的优劣势:需不需要、以及敢不敢把任务托付给AI?

"知己知彼,百战百胜",上个小节提到找出想达成什么任务是知己,理解AI工具的优劣势则是知彼。

直到2024年撰文的现在,AI或LLM还没有完美到样样精通,因此,认识生成式AI的优劣势,对于辨別AI是否真的适合我们使用非常重要。目前AI普遍被认为的优缺点如下:

优点
缺点
资讯无远弗届,熟悉任何领域的知识
能够整合并引用网路上的最新资讯(RAG)快速发想新点子

大多数使用者都会特别强调AI还不能解决"幻觉与偏见"的这项缺点,据此,作者会用一句话总结AI工具的优劣势:

AI工具(大型语言模型LLM)最适合作用来加速你已经会的工作

作者尝试在工作和生活中使用AI工具后,最常见、并且对作者而言真正实用的用途是:发想规划、以及笔记摘要。AI适合帮助作者发想与寻找灵感,例如写博客文章,作者做不到随时文思泉涌,而LLM可以很快提出多种不同角度的想法,它提出的某些点子偶尔(因为幻觉)不正确也无所谓,能帮助作者减少认知负荷、找到每个段落大致上要写什么就已是极大帮助;AI也适合规划流程,若是自己从白纸开始发想一个计划,总是会丢三落四的、漏掉某些关键流程;笔记摘要几乎是我最常使用AI的情境,像是很长的线上课程视频,作者总会请LLM帮自己摘要,一方面复习,另一方面是检查是否有要点被作者忽略、没写进笔记。

以上三个AI使用情境:发想、规划、笔记摘要,都以"我已经熟悉这些工作"为前提,作者必须一眼就能看出AI讲的是对是错。举例而言,如果作者完全没看过某部演讲视频,而只依赖AI帮自己节录出摘要的内容,作者有可能会错过演讲中的某些没被AI摘要到的重要观点、或是AI对演讲的解读错误而造成作者误解。作者终究只会在需要时让AI省力,而不会让AI完全取代作者的思考流程。

写到这,作者特别想探讨使用AI工具辅助学习是否可行。作者是个会刻意花时间学习新知的知识焦虑患者,然而,作者不太敢(只)用AI来学习作者完全不熟悉的领域,从零开始学习的基础知识非常重要,如果LLM产生幻觉,给作者有偏误的资讯、作者又看不出,反而开始累积错误的知识。目前,如果要用AI来帮助作者认真地研究领域知识,作者会特别选择重视有凭有据(Grounded)的AI,像是Perplexity或NotebookLM,这两个AI工具都能够明确指出每个答复是引用自哪个资料来源,作者得以根据资料来源的权威程度,决定作者该不该信任这项答复,避免自己学歪。

(延伸阅读:NotebookLM介绍,重重视资讯透明度、超可靠的AI学习研究助理)

搜索引擎Perplexity的回答会明确指出引用资料来源
(图片来源:Perplexity)

也因为AI与LLM不是做什么事都完美无缺,作者从AI教学专家Dave Birss的线上课程中学习到,拆解任务是实践用AI工具提升工作效率的重要技巧。把整个任务或专案全都托付给AI显然是不切实际的,我们应该要把一项任务尽量拆解成多个子任务(sub-tasks)或步骤,这些子任务有些适合用AI来辅助、有些高度仰赖人工,Dave Birss建议把每个子任务分成纯AI自动化纯人工、以及混合(人工加上AI辅助)三个类别,这个分类需要透过亲身实验后自主判断,每个子任务都找对应的AI工具来试试看自己想不想使用AI帮忙、还是宁可亲力亲为。

子任务拆解的越细,越有可能找到精準做到该任务的好用AI工具。以下图示是以设计演讲投影片为例,"寻找图片搭配"正是完全可以用AI省下很多时间的子任务,作者以前要是想在投影片放上一张猫咪驾驶巴士的天马行空图片,要在网路上搜寻好久、还未必找得到,现在用Midjourney写上作者的要求,什么荒唐情境的图片都画得出来!


拆解任务的方式來思考如何以AI提升生產力
(圖片來源:Dave Birss)

改变搜索思维:跟人工智能"对话"

我们已经非常习惯,需要任何信息时就到搜索引擎"Google"一下,即使AI逐渐成熟后,能做到的事情非常多,也不代表搜索引擎会完全被AI取代,它们会彼此互补而并存。因此,我们需要思考怎么有效使用AI,以超越Google搜索引擎就能做到的事。

跟Google搜索关键词不同,使用AI更像是"跟朋友聊天"
脉络(Context,亦即背景信息或补充说明)是让AI发挥实力的关键。使用者提供越多脉络,AI越知道该如何帮助你。使用搜索引擎找资料的时候,我们通常只会输入一、两个关键词;但AI不只是找资料、更是要完成特定任务,所以提供脉络至关重要,开发Gemini模型的团队曾研究使用者给的Prompt(提示),发现有效达成任务的成功Prompt平均有21个英文字词(大约是中文的至少3句话)。想跟AI合作完成任务,就像是和朋友聊天一样,我得说出我有什么烦恼、为什么会有这个问题、希望解决方案长什么样子等等,这当然必须要有好几句的沟通才能做到。

但是,如何跟AI聊天、引导它理解我们的需求,存在一些技巧,也就是现在AI使用者们积极讨论的Prompt Engineering。作者初学Prompt Engineering觉得眼花缭乱、有点恐慌,因为好多资源对于怎么写好Prompt都会给出很多不同建议。作者个人觉得Google Gemini给出的高效写Prompt指南是作者看过的最浅白、好上手的,它长达40页,以下是作者好豪自己从这份指南摘要出几个最实用的入门Prompt技巧:

PTCF框架

担心写出来的Prompt不够全面吗?指南建议用简单的PTCF框架,确保自己跟AI沟通时有涵盖四大面向:

  • Persona:角色设定,你希望AI担任的视角
  • Task:要达成的目标、想完成什么任务
  • Context:更多背景与脉络信息,或者是限制
  • Format:提供回答的格式与形式(例如想要段落还是条列式)

一个Prompt如果能包含这个PTCF框架,轻轻松松就能超越前面提到的"21个英文字词"长度,给AI充足信息来帮你。由于AI不怕啰嗦、只怕你的提示太少,作者还曾听说一个小偏方是建议用语音输入而不是打字,用嘴巴讲的时候,会很自然地提供超级多的脉络资料给AI,通常Prompt效果会更好。

PTCF框架范例
(来源:Google Gemini Prompt Guide)

Google Gemini的个人助理功能Gem(类似于ChatGPT的GPTs功能),就是利用PTCF框架在设计提示词、来高效产生个性化的Gemini回复。非常推荐你到Gemini的此页Gem设计诀窍认识更多PTCF框架写Prompt的真实范例,学习这些PTCF的范例不只是提升Gem功能的成效、也能帮助你在使用任何AI工具时都写出更快更好的提示词

Gemini Gem也建议使用PTCF框架来与AI互动
善用此框架来写提示词,使用任何AI工具都会更有效率
(表格来源:Gemini官方文件)

别期待一次Prompt就完工

要完成一项任务,本来就需要一连串的讨论,想在一次问答(一个Prompt)完成一个任务不太实际,对吧?

现在的AI工具大多都具有一项(和搜索引擎非常不同的)强大特性:AI记得你之前说过什么,与LLM协作工作,要利用这个特性,练习用一连串对话的方式,一步步达成任务目标。指南内不断强调的"iteration",就是鼓励使用者多跟LLM来回讨论。

例如"我该怎么创业"肯定是个没什么用的Prompt,哪可能一次Prompt解答你所有面向的创业问题?更好的Prompt应该像以下这样一层层对谈:

  1. "我曾在……部门工作了5年,给我几个创业点子让我选择"
  2. "我决定以……创业,我该怎么分析我的优劣势、来判断自己是否适合创业?"
  3. "请简要介绍以……创业的长期战略计划,包括商业策略、人才经营、与财务规划"
  4. "以……创业的初期,该达成的首要目标是什么?需要投入多少时间和资本?"

如果对话(iteration)的过程中,发现AI会偏离你的任务目标,直接问AI它需要什么,也是一项好用技巧,例如:

  • "我想达成……,我该提供你什么信息,以帮助你给出更好的回复?"
  • "……, you can ask me some questions."

现在LLM已经能够主动向你索取重要信息
我们与AI对话可以更轻松,不怕遗漏某些面向没有考虑到
(图片来源:ChatGPT)

不用每次写Prompt都完全从零开始

AI再怎么厉害,若是提供脉络信息不足、则难以发挥威力,但人终究是懒,使用者要是每次都完全空白开始想怎么写Prompt,还是会嫌麻烦。作者目前会用两个简单的方法,来让作者写Prompt更省事。

第一,善用文件上传功能,像是NotebookLM可以上传PDF文件、图片、Google简报等,比起自己手动输入脉络信息,直接上传文件给AI当参考资料就方便多了。若你正在研究某公司过去三年业务方向转变,自己在Prompt手动写公司发展历程怎么可能写得完!干脆上传一大堆该公司财报给NotebookLM,不止AI从文档得知的背景信息会更完善、回答还会更有凭有据(Source-Grounded)。

第二个方法,就是!直接拿大家常用的Prompt模板来用,Dave Birss提供的Prompt模板以及Anthropic的Prompt Library都是作者经常用来参考的,通常热门模板都会符合前述的PTCF框架,能帮自己省下动脑想Prompt的力气。直接把好用模板复制粘贴到LLM,快速开启第一个提示,剩下的就通过对话的方式陆陆续续达成任务。

结语

AI技术的发展步伐飞快,相信在不久的将来,AI将会在各个领域发挥更加重要的作用,懂得"使用AI工具"势必将成为现在与未来的必备技能。只不过,AI功能虽然强大,我们仍得正确地使用才能发挥其最大效益。

在我的经验中,这篇文章介绍的:任务与解决问题导向、理解AI优劣势而不蒙着眼使用AI、区分搜索引擎与LLM用法差别,这三項是我實踐應用AI後、最重要的思維轉變。希望我的經驗能幫助你更好地了解AI工具,並在工作和生活中享受它們帶給我們的生產力躍進。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号