刚刚发布时,ChatGPT引起了热议,用户们纷纷探讨其各种可能性,从翻译官到老师再到智者。然而,随着时间的推移,新鲜感逐渐褪去,讨论逐渐冷却。
然而,随着OpenAI推出的全新功能——代码解释器(Code Interpreter),ChatGPT社区再次热闹起来,用户们纷纷尝试各种创新应用:让ChatGPT编写游戏、制作视频,甚至担任数据分析师。
那么,什么是代码解释器呢?尽管名字可能让一些非编程背景的用户望而却步,但不用担心,因为这正是为你而设计的,前提是你是ChatGPT Plus用户。
代码解释器是OpenAI推出的三大扩展功能之一,类似于插件集和网页浏览功能,你可以在用户设置的Beta功能中启用。开启后,在GPT-4模型的下拉菜单中选择"Code Interpreter",即可激活该功能。一旦启用了代码解释器,对话框旁边会出现一个+号图标,你可以在这里上传不超过100MB的文件,接下来我们将介绍相应的用法。现在,一切准备就绪,只需一点点魔法即可。
5分钟学会编程
在短短五分钟内,一个完全不懂编程的新手也能够轻松地打造出一款星际飞船击落陨石的游戏,这可能听起来像是天方夜谭,但有了 GPT-4 的代码解释器,这一切变得触手可及。
Kris Kashtanova 这位开发者分享了她是如何实现的。首先,她在心中构思了游戏的基本框架,然后将她的设计需求输入给 ChatGPT:
写一个 p5.js 代码,制作一个小行星游戏,其中你可以通过鼠标控制一艘宇宙飞船,使用鼠标左键射击小行星。如果宇宙飞船与小行星相撞,游戏结束。当你成功击落所有小行星时,你就赢了!我还想能够使用我自己选择的贴图作为宇宙飞船和小行星的外观。
接下来,ChatGPT 会以五分钟内生成一段代码,你只需将其粘贴到 OpenProcessing 网站上,然后通过 AI 画图工具(如Midjourney、ClipDrop等)为游戏添加个性化纹理。这样,你的游戏 Demo 就诞生了,可以在线运行。如果在运行过程中出现问题,你可以将代码贴回给 GPT-4,它将扮演你的编程导师,逐一解释代码中的每个函数,以及如何使用10岁小孩的方式进行调试。通过反复的调试和优化,你就能成功完成一个小游戏。当然,值得注意的是,这五分钟仅适用于那些对游戏编程有一定概念的开发者。像 Kris Kashtanova 这样的开发者在构思游戏时已经明确了玩法、目标和操作等需求,因此 ChatGPT 在生成代码时能够事半功倍。总体而言,ChatGPT 确实在完成繁琐、枯燥的工作时展现了强大的能力,为创意迅速变为现实提供了可能性。
PDF文件格式
作为一种让打工人既爱又恨的文档格式,深受人们喜爱的原因在于其始终如一的排版稳定性。然而,这种喜爱却常常因为无法直接复制粘贴其中的文字而转为尴尬之感。
一般情况下,我们需要花费一定费用购买OCR阅读器,以便提取PDF文档的内容。但现在,您可以让ChatGPT来为您代劳。操作非常简便,只需点击对话框上的加号,上传您的PDF文件,然后输入提取文本的指令即可。ChatGPT会迅速将文档内容转写出来,非常方便。它不仅能提取规整文档型的PDF文件中的文字,还能识别图片中的文字,从而更加广泛地满足您的需求。
这一便捷的服务为您摆脱了购买OCR阅读器的烦恼,使得提取PDF内容变得轻松而便利。ChatGPT的多功能性使其成为处理各种文档提取需求的理想助手。
打造一位专属金融分析师
代码解释器拥有强大的绘图能力,博主Alex Ker充分利用了这一特性,将其打造成一位专属的金融分析师。以特斯拉的股票为例,您只需下载特斯拉历年的股票数据集,并将其上传至ChatGPT。
然后,您可以用自然语言向ChatGPT下达指令,
要求其绘制特斯拉的股票走势图,对数收益图,或者股票成交量图等等。
更为关键的是,如果您是金融领域的新手,对这些图表分析一无所知,或者对这些数据的涵义不甚了解,您可以直接向ChatGPT提问,要求其从头开始为您解析这些数据。
在ChatGPT的辅助下,您无需再费解金融分析师的专业术语,也能够做出相对准确的判断。这使得金融数据分析变得更加直观和易懂,为不同层次的用户提供了更为灵活的金融信息解读方式。
可视化图表
精美的可视化图表就像报告的精致外观,宛如绅士的西装或佛像的金衣,对于报告的专业性起到了至关重要的作用。通常情况下,分析员需要与Excel等制表工具进行反复博弈,才能制作出理想效果的图标。而现在,有了ChatGPT,只需通过三句简短的提示语就能轻松实现。
博主Prateek K. Keshari分享了他的使用方法。先来看看他的成果,Prateek只用了几句提示语就创建了一个可交互且美观的商业仪表盘,效果相当不错。具体做法是,他首先上传了Netflix的数据和Logo图片到代码解释器,然后输入了以下提示语:
这是Netflix的数据加上Logo图标。请为我生成一个可下载的文件,具备以下特点:
在页面顶部中央放置Logo的.html仪表盘
使用无衬线字体
页面和可视化采用Netflix的配色方案
使用plotly创建交互式图表
注意:页面的设计与功能同等重要。设计应该简洁,采用Netflix品牌颜色、投影和渐变。可视化图表应呈现网格布局。
这种简便而高效的方法使得制作精美的可视化图表变得轻而易举,为报告增色不少。
图片转变视频
将一张图像转变成视频,就像在《复仇者联盟》中灭霸响指瓦解效果一样,这个看似复杂的任务其实只需要一个Prompt,一个上传的图像,以及代码解释器的帮助即可完成。博主Chase Lean展示了如何将灭霸的照片上传到代码解释器,并通过ChatGPT的协助,将其转化成类似灭霸响指瓦解效果的动态视频。Chase Lean提供了详尽的指令:
你是否熟悉《复仇者联盟》中灭霸响指后的瓦解效果?我想将此效果应用于我上传的PNG图像。你能帮我将其制作成视频吗?使用透明层中的像素,将其分组为4×4像素的块。然后,给每个块分配一个索引。对于每一帧,随机选取一些块。然后将这些块向左平移。在每帧中持续执行此操作,直到所有块都离开图像,只剩下一张空白图。请使用Imageio库来协助。直接将帧保存到视频文件,而不是保存到列表中。
接着,ChatGPT将生成一系列代码,虽然可能包含一些错误,但通过一番调试和优化(大约一个小时左右),Chase Lean最终获得了符合需求的效果视频,可以直接进行下载。这种简单而高效的方法使得将图片转变为视频变得轻而易举,为创造出独特的效果提供了一条便捷之路。
「AI 如此强大,还需要人来参与吗?」
通过这些案例,我们可以看到代码解释器的引入犹如给ChatGPT赋予了行动的“手和脚”,使其能够创造比纯文本更为丰富的内容。代码解释器的高度可玩性使其成为一种强大的工具。Ethan Mollick来自沃顿商学院,在提前几个月体验代码解释器后,给予了积极的评价:“我们现在看到的案例只是代码解释器能力的冰山一角,未来人工智能将成为复杂知识工作的宝贵伙伴。我花了几周时间才拿到的博士学位,人工智能在几秒钟内就完成了,而且出现的错误通常比我的预期要少得多。”
Ethan Mollick将代码解释器比喻为一个“忘记自己能做什么的大师”,你所需做的就是用提示词提醒它,告诉它可以帮你制作GIF、视频,甚至是3D动画等操作。然而,如果AI可以做任何事情,那么作为人类的我们还有存在的必要吗?这个问题的答案是肯定的。从上述案例来看,那些能够善用AI“帮手”的博主们都是在其领域内的专家,正因为他们对任务有着足够的了解,才能提出明确的要求(Prompt),引导AI执行。
换句话说,要让AI帮忙,你首先得成为一个靠谱的“甲方”,思考如何去做,而不仅仅是请求AI去执行。代码解释器展示了一种新的工作可能性:未来,我们可能只需要专注于创意和思考,将实际执行的部分交给AI,从而使人类从繁重的工作中解脱出来。