OpenAI似乎对起名字没什么天赋。虽然“代码解释器”听起来像与编程有关,但实际上却完全不是。它能够通过Python代码批量处理数千张图片,因此得名。只需将要处理的图片压缩为不超过512MB的文件,然后直接上传到ChatGPT。
有了Code Interpreter,你再也不需要学习其他软件来批量处理图片了。你只需像与朋友对话一样描述需求,然后让它裁剪掉不必要的背景、将静态图片转换为生动的GIF、添加水印以保护版权,甚至识别人脸并模糊以保护隐私。
让我们通过实际案例来看看它的强大之处吧。
清理图像周围的空白背景
在将图片展示在网页或PPT上时,为了保持风格的一致性或提高加载速度,我们通常会删除图像主体周围的空白背景。
只需将要处理的图片压缩成一个包,上传到Code Interpreter,然后再写一个Prompt就可以了。
比如,我将以下三张待处理的图片压缩一下。
然后上传到Code Interpreter,再提交这样一个Prompt:
请删除压缩包中图片主体周围的空白空间或多余空间。
接下来我们看下Code Interpreter的处理过程:
明白了。我将处理ZIP文件中的图像,删除图像主体周围任何不必要的空白。
首先,我将从ZIP文件中提取图像并将其加载到内存中。然后,我将继续进行图像处理步骤。开始吧。
我已经处理了6张图像,并删除了每张图像周围不必要的空白。现在,我将把这些图像压缩回ZIP文件并提供下载链接。
处理后的图像已成功压缩为ZIP文件。
您可以从以下链接下载包含已处理图像的ZIP文件:
下载处理后的图像
点击ChatGPT提供的下载链接,即可下载处理好的图片。这是删除了多余白色背景后的三张图片:
GIF动画制作与水印添加:Code Interpreter轻松搞定!
GIF图像相比于静态图片更能吸引眼球,而且相对于视频,它还具有更小的文件体积。通过Code Interpreter,您可以将图片转换成循环动画的GIF,从而提高社交媒体上的互动性。
只需将待处理的图片压缩成一个包,上传到Code Interpreter,并编写一个简单的Prompt即可完成任务。
GIF动画制作:
请将ZIP包中的图片按名称顺序转换为GIF。生成的GIF应具有循环动画效果,每帧之间有500毫秒的帧延迟。
ChatGPT处理过程:
我已成功将图像转换为GIF,帧延迟为500毫秒。以下是您要求的GIF: [下载GIF](GIF下载链接)
水印添加:
该压缩包包含多个图像以及我的logo,文件名为“logo”。请将logo作为水印添加到每个图像中,位于图像右下角,距离边缘10个像素;保持原始宽高比;大小相对于图像宽度或高度的5%;透明度为50%;背景透明。最后,请提供处理后图像的下载链接。
ChatGPT处理过程:
最终两张图片的右下角都成功添加了水印。您可以通过修改Prompt来调整水印的大小、位置和透明度。请点击以下链接下载处理后的图像: [下载处理后的图像](处理后的图像下载链接)
除了水印,您还可以通过Code Interpreter批量为图片添加文字、引入其他图片等效果。请注意,目前Code Interpreter支持的最大文件大小为512MB。
隐私保护、人脸处理和图像降噪:Code Interpreter轻松应对!
人脸打马赛克:
在一些情境下,为了保护隐私或个人身份,我们可能需要对人脸进行马赛克处理。使用Code Interpreter,只需一句话即可完成这项任务。
原始美女肖像:
[美女图像1](链接1) [美女图像2](链接2)
该压缩包包含多张图像。请识别每张图像中的面孔,然后为每个图像的脸部创建马赛克。最后,请提供处理后图像的下载链接。
处理后的效果:
[处理后的美女图像1](处理后链接1) [处理后的美女图像2](处理后链接2)
人脸模糊与其他效果:
除了打马赛克,还可以选择模糊处理、覆盖其他图像或将识别出的人脸保存为另一图像。
图像降噪:
在弱光条件下拍摄的照片常常存在噪点,影响画质。使用Code Interpreter,可以轻松进行图像降噪。
原始照片:
[弱光照片](原图链接)
去除图像中的噪声,同时保留其纹理和细节。完成后,请分享处理后图像的下载链接。
ChatGPT处理过程:
为了去除图像中的噪声,我们可以使用多种方法,比如非局部均值去噪算法。让我们继续这个方法,然后您可以从以下链接下载去噪后的图像: [去噪后的照片](去噪后链接) 请查看图像并让我知道降噪效果是否令人满意。如果没有,我们可以尝试其他方法或者调整当前方法的参数。
如果处理结果不尽如人意,可以随时提供修改意见。请注意,上传的图像总文件大小不要超过512MB。
基础图像处理:Code Interpreter轻松实现缩放、裁剪、旋转和模糊!
图像缩放:
改变图像大小是常见的图像处理操作,而Code Interpreter使得这一任务变得异常简单。
将此图像缩放为800像素宽度,同时保持其纵横比。
请按原始尺寸缩小给定图像50%。
将图像放大2.5倍。
调整此图像大小为600像素高度,保持原始纵横比。
将此图像缩放至1920x1080像素分辨率。
图像裁剪:
图像裁剪允许我们选择感兴趣的区域,并丢弃其他部分。Code Interpreter通过简单的Prompt操作实现裁剪。
从点(100,100)开始裁剪图像,宽度为500像素,高度为300像素。
提取由坐标(300,200)到(800,600)定义的感兴趣区域。
从图像中心剪出一个边长400像素的正方形。
裁剪图像,使其聚焦于矩形定义的区域从左上角(0,0)到右下角(600,400)。
以中心为基准裁剪图像,隔离主体,半径为200像素。
图像旋转:
图像旋转是另一常见操作,Code Interpreter可以轻松实现不同角度的旋转。
将图像顺时针旋转90度。
逆时针旋转给定图像45度。
将图片绕中心旋转180度。
绕点(300,300)顺时针旋转30度。
沿水平轴旋转图像180度。
图像模糊:
图像模糊可以减少噪声,而Code Interpreter支持多种模糊技术。
对图像应用半径为5像素的高斯模糊。
使用3x3内核的中值滤波器模糊图像。
使用西格玛为2.0的高斯方法对图像进行模糊处理。
在水平方向应用运动模糊,内核大小为20。
柔化照片中的细节,应用模糊滤镜。
我的总结:
Code Interpreter目前支持的图像处理功能有限,使用的是内置的Python库。随着时间的推移,随着内置更多Python库,其功能将变得更为强大。
如果您对Code Interpreter的图像处理功能不满意,可以随时提供反馈。请注意,上传的图像总文件大小不得超过512MB。