Likecoin验证人，关注科技、自然、阅读、电影及家庭教育

【失败的Chatgpt 代码解释器之旅】我从一次失败的Chatgpt任务中学到了什么？

2023 年 7 月 12 日

又是一次失败的Chatgpt 代码解释器之旅。

不过从这次失败的经历中，我学到了和Code Interpreter打交道的几点经验，迫不及待的想要和你分享。

早上让同事从一份word文档中整理信息，汇总成一份人员信息表。表格数据量不大，但是逻辑和格式都很混乱。是流水账式的自然记录，一个人的信息分散在不同的段落，不同的信息还用各种字体和颜色进行强调。

同事给我发了一个畏难的表情。我想，这个任务也许可以让Chatgpt 代码解释器一试身手。

我把word文档和需要转换成的excel模板打包成一个压缩文件，上传到Code Interpreter插件。告诉chatgpt，“把这个压缩包里的word文件里面的XXXX信息，按照excel文件内的格式进行整理。”

Code Interpreter很顺利的提取到压缩包里的文件。

看起来这个Word文件中包含了关于XXXX的几个阶段的信息。我将解析这些信息，并尝试按照Excel文件的格式进行整理。我会尽可能地把信息对应到Excel的列中，但请注意，可能并不是所有的信息都可以从Word文件中获取。

给自己留有余地，是 Chatgpt的惯常风格，我不以为意，示意它开干，并提供转换后的文件的下载链接。

Chatgpt在经历五次错误尝试后，告诉我：

我已经成功整理了数据并保存为Excel文件。你可以通过下面的链接下载文件……

此时，距离我让同事整理信息，还不到5分钟。我满心期待的点击下载文件，心想，这会可以在同事面前炫一把了，也许他还没打开word文档吧，而我已经让这个神奇的AI助手搞定了任务。这样的效率，简直太美妙了。

然而，现实却给了我一记响亮的耳光。下载过来的Excel表格，打开来全是错乱的文字，根本不是我想要的格式整齐的信息。

我耐心的告诉Chatgpt发生了什么，让后让它重新开始。

Chatgpt没有任何不耐烦，再次尝试。遇到错误的时候，它便一边自言自语的报告，一边默默改正，“我将尝试更精确地匹配日期格式，并再次尝试处理数据。”“我再次遇到了问题。”“我将修正我的代码，以便更准确地识别日期。”看它勤勉的样子，我毫不在意，它前面出现的错误。我相信，它这次的努力，必定会给我准确的信息。

然而，事实又给了我一次教训。Chatgpt还是输出一堆混乱的表格。

经过多次的错误后，我已经没有了向同事炫耀的心了，只想着怎么和Chatgpt一起，攻克这个“难题”。

我突然注意到，Code Interpreter插件在处理问题的时候，总是不管三七二一，便编写python程序，非常依赖用编程来解决问题，但是在处理文本的这件事上，chatgpt自身的语言能力，可比它编的程序要聪明的多。

为什么不让chatgpt先用大模型能力先对文件进行结构化处理，再编写程序转换成excel文件？

我修改prompt：分析这个压缩包中的word文件，列出文档中包含的所有人员名单，注意这是一个用chatgpt本身就可以很好处理的问题，你不必编写程序处理。

这个指令中，我一方面提示它不要编程，另一方面也简化了任务，让它只列出名单，看它能否完成任务，如果这一步顺利，那么下面再让它整理其他信息，也是水到渠成。

果然，这一会比编程顺利多了，chatgpt没有报错，就一个个列出了我要的名单。

但是，且慢，怎么列着列着就开始胡编了……

看来，chatgpt并没有正确提取word文档的内容。

我试着把word文档内的文本拷贝出来，在对话框中输入，让它再次在这个文本中提取名单，这会总算正确了。

那么前面的错误，到底是发生了什么问题呢？

我让chatgpt自己分析下原因：

这可能是由于我在处理原始Word文件时，存在一些挑战，如：
Word文件的格式和结构可能比较复杂，有各种格式、样式、表格等元素，这可能会对名字的提取造成困扰。
Word文件中的文本可能还包含了其他的非名字信息，如日期、注释等，这些信息可能会干扰名字的提取。
当您直接给我提供文本时，这些复杂的格式和结构都被移除了，只剩下了纯文本。这让我可以更直接、更准确地从文本中提取出名字。

我不确定，这是不是真正的问题所在，但是这也提醒我们，也许输入给chatgpt的文档，不包含复杂的格式，可能是个明智之举。

所以，当您使用Code Interpreter插件并上传文档时，考虑以下建议：

文档格式：尽可能提供具有结构化或半结构化格式的文档，例如Excel表格、CSV文件、JSON文件等。这些文件类型通常更易于解析和处理。

清晰的标签和标题：如果文档中包含表格或列表，确保每一列或每一项都有清晰的标题或标签。这将帮助AI理解数据的含义。

避免复杂的格式：如果可能，避免在文档中使用复杂的格式、样式或嵌套表格。这些可能会干扰数据解析。

数据质量：确保提供的数据是准确、完整和一致的。数据中的错误、遗漏或不一致可能会影响数据处理的结果。

提供足够的背景信息：如果文档中的数据需要特定的背景知识才能理解，或者需要特定的处理步骤，那么在提交文档时提供这些信息将非常有帮助。

保护隐私：如果文档中包含敏感信息，例如个人信息，确保先进行适当的脱敏处理。

而此时，同事已经把他人工整理好的文档，发给我了。我默默的终止了人工智能整理的努力。

但是，这次失败的Chatgpt 代码解释器之旅，也让我学到了不少。

1、理解文档结构：即使文档是非结构化的，也通常有一些隐性的模式或规律。作为用户，我们需要深入理解文档，找出这些模式，这样可以更好地指导AI工具如何处理和提取信息。

2、适应AI的处理模式：Code Interpreter插件通常倾向于使用Python来处理问题。这在许多情况下都是有效的，但在处理非结构化的文本信息时，chatgpt的语言能力可能更加有用。我们需要在使用过程中灵活切换，依据实际问题选择最适合的处理方式。

3、处理错误的策略：在使用AI处理信息时，可能会遇到错误或不符合预期的结果。我们需要学会适应这些错误，及时提供反馈，指导AI进行修正。每一次错误都是一个学习和改进的机会。

4、指导AI的关键：虽然AI工具具有强大的处理能力，但它们不是万能的。在一些特定的情况下，我们可能需要主动干预，为AI提供明确的指导。例如，在处理非结构化的文本信息时，我们可能需要指导AI使用chatgpt来理解和处理文本。

5、享受学习过程：使用AI工具不仅可以帮助我们解决问题，还可以让我们学到很多新的知识和技能。我们应该享受这个过程，从中获取乐趣和成长。

6、深入理解AI的能力：AI工具具有强大的处理能力，但也有其局限性。我们需要深入理解AI的能力和局限，以便更好地利用AI，同时也避免对AI的过度依赖。在使用过程中，我们需要保持一种批判性思考，不断地思考、反馈和改进。

7、理解AI的工作原理：AI工具的工作原理可能会影响其处理结果。例如，Code Interpreter插件在处理非结构化的文本信息时，可能会使用Python的程序来进行处理，而不是使用chatgpt的语言能力。了解这一点，可以帮助我们更好地理解处理结果，也可以帮助我们更好地指导AI工具。

8、保持耐心和决心：使用AI工具可能会遇到一些困难和挑战，我们需要保持耐心和决心，不断地尝试和学习，才能找到解决问题的最佳方法。

这就是我在使用OpenAI的Code Interpreter插件处理非结构化数据的旅程中学到的宝贵经验，我希望你也可以从中得到启发。

喜欢我的文章吗？
别忘了给点支持与赞赏，让我知道创作的路上有你陪伴。

加载中…

【失败的Chatgpt 代码解释器之旅】我从一次失败的Chatgpt任务中学到了什么？

推荐阅读

[生活中的AI]ChatGPT作为运营经理：一个月内从70到500关注者的Medium增…

探索Gen-2：如何生成16秒长的镜头

如何通过ChatGPT的Custom Instructions为您的聊天体验量身定制

让你这一分钟内生成专业时尚网站的AI神器，设计师的梦想工具

【Stable Diffusion】ControlNet Linerat应用：老照片修复

推荐阅读

[生活中的AI]ChatGPT作为运营经理：一个月内从70到500关注者的Medium增长实验

探索Gen-2：如何生成16秒长的镜头

如何通过ChatGPT的Custom Instructions为您的聊天体验量身定制

让你这一分钟内生成专业时尚网站的AI神器，设计师的梦想工具

【Stable Diffusion】ControlNet Linerat应用：老照片修复