AI创作工具:数据分析与人工智能的完美结合

摘要: 了解如何AI创作工具对数据分析领域的影响,提高数据分析效率、提供分析灵感,探索未来人工智能软件应用。

AI创作工具:AI与数据分析的完美结合

从2023年开始,chat gpt等生成式人工智能的出现对数据分析这个行业有很大的冲击。一个是它能学会我现在对你们的分点叙述,我的语气,我的表述方式,而不再是一个被各种规则约束的刻板机器人。另一个是当下数据分析这类知识和相关的岗位,在商业应用上正好到一个转折点,叠加工具变化的影响,职位和行业的变化也就顺理成章。

在过去我所看过的,使用AI去做数据分析的内容和论文,主要停留在数据处理、数据可视化和数据解读几个层面,这几个层面属于数据分析师的工作流程,但还未触及核心。大众认为,它无法取代数据分析师的逻辑推理能力和创新力,也就是它没办法直接创造商业价值,那么这篇文章会颠覆你的认知。

当然,要想让chat gpt获得更顺畅的,能把问题从0~1解决的能力,需要大量的工作,本文基于我个人的能力和视角给出了一个解题思路,未来希望更多小伙伴也可以参与进来。

人工智能软件及其应用领域

在继续深入之前,我们需要提前约定好:这里所指的生成式人工智能是一种可用于内容与消费的人工智能的算法,包括chat gpt所属的大语言模型(LLM)。其它的AI知识,包括计算机视觉,知识图谱,这里不展开讨论。数据分析指的是广义的数据分析,也就是如上文所说的,对数据进行解释、处理、可视化等行为,都属于数据分析的环节。涉及数据建模、调优、数据科学算法等相关知识,这里不作高深的要求。

生成式人工智能对数据分析的影响

在这个定义的基础上,我个人认为生成式人工智能对数据分析的影响主要集中在下面四点:
1. 完全取代基础的工作需求,包括sql、python的编写
2. 完成基础的信息提炼和同步,减少人为传递带来的误差,提高效率
3. 极大的提高了学习效率,降低学习门槛
4. 能够对商业问题有一定的深入分析,提供分析灵感

再概括一下,就是:做数据分析变得更简单了,过去专业的数据分析岗的存在更受质疑。

AI帮助你正确提问

在开始任何学习之前,相信很多同学已经开始要对chat gpt发问,例如我们最常见的问题:
1. 你觉得数据分析的前景如何
2. 如何开始从0~1学习chat gpt
3. 数据分析师的工资有多高
4. 我该如何走上人生巅峰

这类问题,不仅是大家去问chat gpt的,也是来问我们的。每个初学者在一开始的时候会有很多问题,迷茫,不知道从何入手,所以这些问题通常是大家一开始问的问题。可能大部分同学是为了要一条路径,但是在chat gpt眼里,你可能希望它写一本武林秘籍。

但这是不可取的,例如我们来直接对它提问:

提问

这些内容在从业者眼中是不可信的,看似很标准的,规范的答案,但是这种缺乏背景输入的主观答案,大多是正确的废话甚至是胡编乱造的内容。这些话或许在某个帖子里那么说过,但是chat gpt无法判断正误,也无法了解当事人的写作背景,得出了错误的结论。

那有背景输入的情况又如何呢?可以来看下面的例子:

背景输入

所以你会发现,chat gpt并非带有主观意志的上帝,在面对主观问题的时候,他的观点是可以变的,因为所有的观点都来自于网络,它并不能带给你一个符合你需求的观点。

这是开始chat gpt的一个误区,大多数人止步于这一步,因为他们发现问题回答的不如自己的期望,觉得chat gpt无法解决问题。但如果对它使用“魔法”——提示词以后,你能明显感觉到区别:

提示词

这个回答的背后是数千字的提示词,这些提示词带着我个人的理解,如果换一个人效果就可能不同。从这个角度看,你会发现chat gpt似乎又有一些东西不能取代,例如说我们每个从业者的经验,灵感,细小的经验差异可能会带来的完全不同的体验。但毫无疑问的是,chat gpt能快速帮你抵达我们每个人的思维深处,我们的经验无法照顾到所有人,但有chat gpt在,相当于我把大脑放在这里,供你们查阅。

总结一下,我们AI学数据分析的第一课,一个是希望大家学会提问,同等级别的问题才能换来同等级别的答案,这要求你选会第一层才能问出第二层,而非在一开始的时候就想看到第一百层。第二个是,对于客观的常识,他大概率不会回答错误,但是对于主观题,他的能力受训练者的能力影响,你依然要去追求更厉害的大师或者更专业的知识库训练出来的模型。

上述结论也会导致一个结果:信息搜索形成的知识壁垒在减弱,但经验的壁垒却更高深。通俗点说就是,粗糙的土路变成了高速公路,原来开车和走路的差距不大,但现在开车和走路的差距天壤之别。看起来它在短时间抹平了信息差,你可以参与任何领域的学习,但是要想步入最深的殿堂会越来越困难,竞争也会更激烈。

会提问的能力会比被动的接受信息的能力要重要,如果你过去是一个别人说什么就学什么的人,那么很难适应AI环境下的竞争。

如何正确提问-不要相信chat gpt的话

在开始任何学习之前,相信很多同学已经开始要对chat gpt发问,例如我们最常见的问题:
1. 你觉得数据分析的前景如何
2. 如何开始从0~1学习chat gpt
3. 数据分析师的工资有多高
4. 我该如何走上人生巅峰

这类问题,不仅是大家去问chat gpt的,也是来问我们的。每个初学者在一开始的时候会有很多问题,迷茫,不知道从何入手,所以这些问题通常是大家一开始问的问题。可能大部分同学是为了要一条路径,但是在chat gpt眼里,你可能希望它写一本武林秘籍。

但这是不可取的,例如我们来直接对它提问:

提问

这些内容在从业者眼中是不可信的,看似很标准的,规范的答案,但是这种缺乏背景输入的主观答案,大多是正确的废话甚至是胡编乱造的内容。这些话或许在某个帖子里那么说过,但是chat gpt无法判断正误,也无法了解当事人的写作背景,得出了错误的结论。

那有背景输入的情况又如何呢?可以来看下面的例子:

背景输入

所以你会发现,chat gpt并非带有主观意志的上帝,在面对主观问题的时候,他的观点是可以变的,因为所有的观点都来自于网络,它并不能带给你一个符合你需求的观点。

这是开始chat gpt的一个误区,大多数人止步于这一步,因为他们发现问题回答的不如自己的期望,觉得chat gpt无法解决问题。但如果对它使用“魔法”——提示词以后,你能明显感觉到区别:

提示词

这个回答的背后是数千字的提示词,这些提示词带着我个人的理解,如果换一个人效果就可能不同。从这个角度看,你会发现chat gpt似乎又有一些东西不能取代,例如说我们每个从业者的经验,灵感,细小的经验差异可能会带来的完全不同的体验。但毫无疑问的是,chat gpt能快速帮你抵达我们每个人的思维深处,我们的经验无法照顾到所有人,但有chat gpt在,相当于我把大脑放在这里,供你们查阅。

总结一下,我们AI学数据分析的第一课,一个是希望大家学会提问,同等级别的问题才能换来同等级别的答案,这要求你选会第一层才能问出第二层,而非在一开始的时候就想看到第一百层。第二个是,对于客观的常识,他大概率不会回答错误,但是对于主观题,他的能力受训练者的能力影响,你依然要去追求更厉害的大师或者更专业的知识库训练出来的模型。

上述结论也会导致一个结果:信息搜索形成的知识壁垒在减弱,但经验的壁垒却更高深。通俗点说就是,粗糙的土路变成了高速公路,原来开车和走路的差距不大,但现在开车和走路的差距天壤之别。看起来它在短时间抹平了信息差,你可以参与任何领域的学习,但是要想步入最深的殿堂会越来越困难,竞争也会更激烈。

会提问的能力会比被动的接受信息的能力要重要,如果你过去是一个别人说什么就学什么的人,那么很难适应AI环境下的竞争。

开始数据分析-收罗工具

当我们在思想上统一之后,需要把工具先准备好。就像开始准备一个厨房,如果说统计学是菜谱,是切菜煮菜的千万种方式,那么工具就是各种厨具和装备。

在学习任何工具和装备之前,不管是不是用AI学的,都需要注意以下的问题:
1. 所有的工具为思想和业务服务,你用高科技烤箱做出来的鸡蛋始终是鸡蛋
2. 所有的工具都会从复杂到简单演变,如果你觉得越学越复杂,方向大概率就是错了
3. 同类工具之间大概率是相通的,学会一个很容易学会其它的工具

然后你可以开始问AI:我需要什么工具,他会给到:

收罗工具

这样的工具依然很多,而且你很难确定哪些是你需要学习的内容,所以涉及这种学习安排和带有主观答案的问题,依然要寻求提示词的帮助,例如添加提示词后:

提示词 提示词

并且,如果给到他具体的库表,他可以直接生成用于验证的sql逻辑或者python代码,你只需要进行简单的修改。

让chat gpt有数据分析思维-精准输入

数据分析思维是数据分析的核心竞争力,就像菜谱一样。

一个好的菜谱不仅有标准的规范,例如盐放多少克,糖放多少克,这就类比规范的统计学教案,知道当分析一个问题的时候,我们应该从哪些角度开始拆解;另一方面,千变万化的食材和饮食风格也是食谱吸引人的地方,这些类比实际的业务场景。同样一个订单变动的问题,电商行业和交通行业就有明显的差距。

在这个环节,学习者必须清楚的认识到,过去从某个人的身上学习一个行业的知识,在数据分析领域一定是错误的。每个分析师都有其个人的经验和经历,他们脑海中有针对某个行业或者某个问题的解决灵感,这些灵感输入提示词,最终形成一个更合格的分析思路。

在开始学习之前,对数据分析思维这类问题,同样也基于以下前提:
1. 思维的学习没有标准的答案,解决问题,不断钻研甚至挑战权威才是最好的学习方式
2. 思维的学习过程是碰撞的过程,输入比输出更重要,对提问能力的要求也更高
3. 思维的学习没有最终的结果,它更像是当你遇到新问题后能够产生源源不断的分析思路,最终解决,要保持终身学习的观念

基于此,我们开始通过AI学习数据分析思维的过程:

首先来个简单的,在没有提示词的前提下,我们问一个常规的数据分析面试问题:

在一个共享出行行业的业务背景下,如果我本月的订单比上个月下降了20%,应该如何做数据分析?

如果用这样的回答去应付面试,或者去学习数据分析,效果是非常差的。差就差在它“看似”回答了你很多问题,但并没有回答到点上。

以及,初学者如何自己评价这些答案呢?你觉得这个回答好吗?

这就回到了我们一开始的那个问题,你希望通过AI抹平信息差,但是缺少点评的环节,看似你获得了信息,但是信息的质量无从校验。

而且这个问题并不是由于你不会提问,这个问题是标准的面试题,无数应届生面试数据分析师的第一个问题就是这个,甚至出现了很多标准答案。但即使是对标标准答案,这个回答也不尽人意,更不用说在面试中脱颖而出了。

如果解决不了提问,那么chat gpt也就只能在工具层面取代一些工作流程,例如做一些可视化,数据处理等。它没办法解决网友提出的:通过数据分析洞察商业结论的目的。

通俗点说,我如果是老板,他没办法直接帮我赚钱啊。

基于这个想法,我开始往提示词里填入足够多的分析思路,这个过程类比“我在教gpt我是如何做分析的”。在这个环节,我开始认为chat gpt不应该是一个神级大脑的概念,他就是我们大脑的复制品,你的能力决定了chat gpt的能力。

于是请看下面的结果:

精准输入

在这个结果里,你需要关注几个细节:
1. 虽然看起来和上面的分点答题差不多,但其实是我拒绝了口语化的表述方式,希望在分析输出的层面更规范,更像一个专家,所以采用了相对正式的语气。
2. 它的回答里多了一些细节和指标,例如新用户的增长放缓,通过频次反推是用户下单频次下降还是总数下降。
3. 它所选择的几个角度,和这个行业的情况高度相关。

文字内的整个过程已经近似于我们思考的过程,也就是如果有一天,老板问你订单为什么下降的时候,你也会开始从这些角度思考。

所以如果仅仅是用于面试的话,上面的东西也算是够用了。

但我们的目标是,我希望它完全取代我,也就是当老板问出这个问题时,我坐在这里喝咖啡,结论由它给我出,我仅仅做最后的校验工作。

那么,我们需要在提问上下一点功夫:

精准输入

他会给到具体的分析过程,可以用来做检验:

精准输入 精准输入

并且按照我要求,他会按照表格的方式展示初始数据和结果,方便你自己运行做参考:

精准输入

一直到这里,你会发现你已经毫无阻碍的通过python完成了一次数据分析,包括软件如何下载,代码如何编写,结果如何验算。

更复杂的代码由你自己提问,通过对提示词的修改,他会不断的提示你还有哪些没有学会,给你推荐新的问题。但最核心的还是要自己知道如何提问,根据他输出的大纲一点点的深入挖掘,最终完成学习。

同时,chat gpt支持你输入图片和文件来进行数据分析工作,包括截图问他软件的功能,也可以上传excel数据案例让他完成分析。

但我个人的建议是,由他提供灵感,人类操作完成的效率是最高的。

到此,你已经准备好了工具,并且使用工具进行基本的数据分析(记得学完python的基础语法,能够完成递归、排序等算法最好)。对于过去市场上的要求而言,此时已经达到了应届生在技能层面的标准,这也是大部分市面上的培训班能达到的水平,这也回应了一开始说的,chat gpt能够快速抹平信息差,这些信息差指的是过去通过人工搜索收集整合出来的公开内容,它大大简化了搜索的部分,而方便你能够直达我们的经验深处。

但是在下面这个环节,才是竞争的最激烈的地方,给到他的输入多达三千字,才能够按照我一开始的设想回答问题:

精确输入

让chat gpt有数据分析思维,精准输入是关键。数据分析思维是数据分析的核心竞争力,它能够帮助你更好地理解和应用数据分析。通过精准的输入,你可以让chat gpt帮助你进行更深入的分析,并得出准确的结论。

结语

到这个环节,作为初学者的你,还会觉得数据分析这件事情困难吗?事实上,如果你无法追上chat gpt的分析能力,说明企业有更多理由使用chat gpt而不是你。并且拥有数据分析思路的他可以给你提供更多灵感,或者发现你发现不了的细节,如果数据集更复杂的话,或许会有更多的信息,这个就留到后面更新了~

感谢大家阅读此文,如果对AI+数据分析感兴趣的同学,可以联系bzwh321,加入我们的社区一起共建和讨论资料。我认为当前chat gpt的水平是超过市面上90%的培训班的,未来对数据分析的学习一个是像对待excel那样对待它,另一个是更关注专家脑海中的经验,把它沉淀下来,通过AI交互的方式获得更多的分析思路。

© 版权声明

相关文章