跳至内容

图片

对于支持此功能的模型(如gpt-4o),可以向提示中添加图像。 使用defImages函数来声明图像。支持的图像格式会因模型而异, 但通常包括PNGJPEGWEBPGIF。同时支持本地文件和URL。

defImages(env.files)
播放

了解更多关于OpenAI Vision的信息。

网址

公开URL(不需要身份验证的)将直接传递给OpenAI。

defImages(
"https://github.com/microsoft/genaiscript/blob/main/docs/public/images/logo.png?raw=true"
)

本地文件会被加载并编码为数据URI。

缓冲区、二进制大对象、可读流

defImages 函数还支持 BufferBlobReadableStream

这个示例会截取bing.com的截图并将其添加到图片库中。

const page = await host.browse("https://bing.com")
const screenshot = await page.screenshot() // returns a node.js Buffer
defImages(screenshot)

详情

OpenAI支持"low"/"high"字段设置。"low"细节级别的图像将被降采样至512x512像素。

defImages(img, { detail: "low" })

裁剪

你可以从图像中裁剪出感兴趣的区域。

defImages(img, { crop: { x: 0, y: 0, w: 512, h: 512 } })

自动裁剪

您还可以自动移除图像边缘的统一颜色。

defImages(img, { autoCrop: true })

灰度

您可以将图像转换为灰度。

defImages(img, { greyscale: true })

旋转

您可以旋转图像。

defImages(img, { rotate: 90 })

缩放

您可以缩放图像。

defImages(img, { scale: 0.5 })

翻转

你可以翻转图像。

defImages(img, { flip: { horizontal: true; vertical: true } })

最大宽度,最大高度

您可以指定最大宽度和最大高度。GenAIScript会调整图像大小以适应这些限制条件。

defImages(img, { maxWidth: 800 })
// and / or
defImages(img, { maxHeight: 800 })