zooman
zooman

Likecoin验证人,关注科技、自然、阅读、电影及家庭教育

【失败的Chatgpt 代码解释器之旅】我从一次失败的Chatgpt任务中学到了什么?

又是一次失败的Chatgpt 代码解释器之旅。

不过从这次失败的经历中,我学到了和Code Interpreter打交道的几点经验,迫不及待的想要和你分享。

早上让同事从一份word文档中整理信息,汇总成一份人员信息表。表格数据量不大,但是逻辑和格式都很混乱。是流水账式的自然记录,一个人的信息分散在不同的段落,不同的信息还用各种字体和颜色进行强调。

同事给我发了一个畏难的表情。我想,这个任务也许可以让Chatgpt 代码解释器一试身手。

我把word文档和需要转换成的excel模板打包成一个压缩文件,上传到Code Interpreter插件。告诉chatgpt,“把这个压缩包里的word文件里面的XXXX信息,按照excel文件内的格式进行整理。”

Code Interpreter很顺利的提取到压缩包里的文件。

看起来这个Word文件中包含了关于XXXX的几个阶段的信息。我将解析这些信息,并尝试按照Excel文件的格式进行整理。我会尽可能地把信息对应到Excel的列中,但请注意,可能并不是所有的信息都可以从Word文件中获取。

给自己留有余地,是 Chatgpt的惯常风格,我不以为意,示意它开干,并提供转换后的文件的下载链接。

Chatgpt在经历五次错误尝试后,告诉我:

我已经成功整理了数据并保存为Excel文件。你可以通过下面的链接下载文件……

此时,距离我让同事整理信息,还不到5分钟。我满心期待的点击下载文件,心想,这会可以在同事面前炫一把了,也许他还没打开word文档吧,而我已经让这个神奇的AI助手搞定了任务。这样的效率,简直太美妙了。

然而, 现实却给了我一记响亮的耳光。下载过来的Excel表格,打开来全是错乱的文字,根本不是我想要的格式整齐的信息。

我耐心的告诉Chatgpt发生了什么,让后让它重新开始。

Chatgpt没有任何不耐烦,再次尝试。遇到错误的时候,它便一边自言自语的报告,一边默默改正,“我将尝试更精确地匹配日期格式,并再次尝试处理数据。”“我再次遇到了问题。”“我将修正我的代码,以便更准确地识别日期。”看它勤勉的样子,我毫不在意,它前面出现的错误。我相信,它这次的努力,必定会给我准确的信息。

然而,事实又给了我一次教训。Chatgpt还是输出一堆混乱的表格。

经过多次的错误后,我已经没有了向同事炫耀的心了,只想着怎么和Chatgpt一起,攻克这个“难题”。

我突然注意到,Code Interpreter插件在处理问题的时候,总是不管三七二一,便编写python程序,非常依赖用编程来解决问题,但是在处理文本的这件事上,chatgpt自身的语言能力,可比它编的程序要聪明的多。

为什么不让chatgpt先用大模型能力先对文件进行结构化处理,再编写程序转换成excel文件?

我修改prompt:分析这个压缩包中的word文件,列出文档中包含的所有人员名单,注意这是一个用chatgpt本身就可以很好处理的问题,你不必编写程序处理。

这个指令中,我一方面提示它不要编程,另一方面也简化了任务,让它只列出名单,看它能否完成任务,如果这一步顺利,那么下面再让它整理其他信息,也是水到渠成。

果然,这一会比编程顺利多了,chatgpt没有报错,就一个个列出了我要的名单。

但是,且慢,怎么列着列着就开始胡编了……

看来,chatgpt并没有正确提取word文档的内容。

我试着把word文档内的文本拷贝出来,在对话框中输入,让它再次在这个文本中提取名单,这会总算正确了。

那么前面的错误,到底是发生了什么问题呢?

我让chatgpt自己分析下原因:

这可能是由于我在处理原始Word文件时,存在一些挑战,如:
Word文件的格式和结构可能比较复杂,有各种格式、样式、表格等元素,这可能会对名字的提取造成困扰。
Word文件中的文本可能还包含了其他的非名字信息,如日期、注释等,这些信息可能会干扰名字的提取。
当您直接给我提供文本时,这些复杂的格式和结构都被移除了,只剩下了纯文本。这让我可以更直接、更准确地从文本中提取出名字。

我不确定,这是不是真正的问题所在,但是这也提醒我们,也许输入给chatgpt的文档,不包含复杂的格式,可能是个明智之举。

所以,当您使用Code Interpreter插件并上传文档时,考虑以下建议:

文档格式:尽可能提供具有结构化或半结构化格式的文档,例如Excel表格、CSV文件、JSON文件等。这些文件类型通常更易于解析和处理。

清晰的标签和标题:如果文档中包含表格或列表,确保每一列或每一项都有清晰的标题或标签。这将帮助AI理解数据的含义。

避免复杂的格式:如果可能,避免在文档中使用复杂的格式、样式或嵌套表格。这些可能会干扰数据解析。

数据质量:确保提供的数据是准确、完整和一致的。数据中的错误、遗漏或不一致可能会影响数据处理的结果。

提供足够的背景信息:如果文档中的数据需要特定的背景知识才能理解,或者需要特定的处理步骤,那么在提交文档时提供这些信息将非常有帮助。

保护隐私:如果文档中包含敏感信息,例如个人信息,确保先进行适当的脱敏处理。

而此时,同事已经把他人工整理好的文档,发给我了。我默默的终止了人工智能整理的努力。

但是,这次失败的Chatgpt 代码解释器之旅,也让我学到了不少。

1、理解文档结构:即使文档是非结构化的,也通常有一些隐性的模式或规律。作为用户,我们需要深入理解文档,找出这些模式,这样可以更好地指导AI工具如何处理和提取信息。

2、适应AI的处理模式:Code Interpreter插件通常倾向于使用Python来处理问题。这在许多情况下都是有效的,但在处理非结构化的文本信息时,chatgpt的语言能力可能更加有用。我们需要在使用过程中灵活切换,依据实际问题选择最适合的处理方式。

3、处理错误的策略:在使用AI处理信息时,可能会遇到错误或不符合预期的结果。我们需要学会适应这些错误,及时提供反馈,指导AI进行修正。每一次错误都是一个学习和改进的机会。

4、指导AI的关键:虽然AI工具具有强大的处理能力,但它们不是万能的。在一些特定的情况下,我们可能需要主动干预,为AI提供明确的指导。例如,在处理非结构化的文本信息时,我们可能需要指导AI使用chatgpt来理解和处理文本。

5、享受学习过程:使用AI工具不仅可以帮助我们解决问题,还可以让我们学到很多新的知识和技能。我们应该享受这个过程,从中获取乐趣和成长。

6、深入理解AI的能力:AI工具具有强大的处理能力,但也有其局限性。我们需要深入理解AI的能力和局限,以便更好地利用AI,同时也避免对AI的过度依赖。在使用过程中,我们需要保持一种批判性思考,不断地思考、反馈和改进。

7、理解AI的工作原理:AI工具的工作原理可能会影响其处理结果。例如,Code Interpreter插件在处理非结构化的文本信息时,可能会使用Python的程序来进行处理,而不是使用chatgpt的语言能力。了解这一点,可以帮助我们更好地理解处理结果,也可以帮助我们更好地指导AI工具。

8、保持耐心和决心:使用AI工具可能会遇到一些困难和挑战,我们需要保持耐心和决心,不断地尝试和学习,才能找到解决问题的最佳方法。

这就是我在使用OpenAI的Code Interpreter插件处理非结构化数据的旅程中学到的宝贵经验,我希望你也可以从中得到启发。

CC BY-NC-ND 4.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论