用GPT-4O API轻松实现图像生成与编辑

GPT-4o2025-05-17 14:32:1817

GPT-4O API为开发者提供了强大的图像生成与编辑功能，支持通过自然语言指令快速创建或修改图像，用户只需输入文本描述，API即可生成高质量图像，或对现有图像进行风格转换、内容修复、背景替换等操作，其多模态能力结合了文本与图像理解，使生成结果更精准贴合需求，API还支持批量处理与自定义参数调整，适用于设计、营销、娱乐等多个场景，开发者可轻松集成到应用中，无需复杂代码，显著提升工作效率，无论是创意设计还是商业用途，GPT-4O API都能提供高效、灵活的解决方案，推动AI驱动的视觉内容创新。

OpenAI在2025年发布了GPT-4O，这次更新带来了一个强大的新功能——图像生成与编辑，你可以直接用文字描述来生成图片，甚至对现有图片进行修改，就像“用嘴P图”一样简单，如果你是一名开发者，通过GPT-4O API，可以轻松将这一功能集成到自己的应用中，下面，我们就来详细介绍如何使用GPT-4O API实现图像生成和编辑。

准备工作

你需要一个OpenAI的账号,并且确保已经获得了GPT-4O API的访问权限，如果你还没有API密钥，可以在OpenAI的官方网站申请，拿到API密钥后，你就可以开始调用GPT-4O的图像生成功能了。

生成图像

生成图像非常简单,你只需要向API发送一段文字描述，GPT-4O就会根据你的描述生成一张图片，你可以输入“一只戴着墨镜的狗在沙滩上晒太阳”，API就会返回一张符合描述的图片。

在代码中,你可以这样调用API：

import openai
response = openai.Image.create(
    prompt="一只戴着墨镜的狗在沙滩上晒太阳",
    n=1,  # 生成一张图片
    size="1024x1024"  # 图片尺寸
)
image_url = response['data'][0]['url']
print(image_url)

这段代码会返回生成图片的URL,你可以直接在浏览器中打开查看，或者下载到本地使用。

编辑图像

除了生成新图片,GPT-4O还可以对现有图片进行编辑，你可以上传一张照片，然后告诉API“把背景换成雪山”，它就会自动帮你修改图片。

编辑图片的代码示例如下：

response = openai.Image.edit(
    image=open("original.jpg", "rb"),  # 上传原图
    mask=open("mask.png", "rb"),  # 可选：指定修改区域
    prompt="把背景换成雪山",
    n=1,
    size="1024x1024"
)
edited_image_url = response['data'][0]['url']
print(edited_image_url)

如果你不需要精确指定修改区域,可以省略mask参数，GPT-4O会自动识别图片中需要修改的部分。

实际应用场景

GPT-4O的图像生成和编辑功能可以应用在很多地方。