图片

对于支持此功能的模型（如gpt-4o），可以向提示中添加图像。使用defImages函数来声明图像。支持的图像格式会因模型而异，但通常包括PNG、JPEG、WEBP和GIF。同时支持本地文件和URL。

defImages(env.files)

了解更多关于OpenAI Vision的信息。

网址

公开URL（不需要身份验证的）将直接传递给OpenAI。

defImages(
    "https://github.com/microsoft/genaiscript/blob/main/docs/public/images/logo.png?raw=true"
)

本地文件会被加载并编码为数据URI。

defImages 函数还支持 Buffer、Blob 和 ReadableStream。

这个示例会截取bing.com的截图并将其添加到图片库中。

const page = await host.browse("https://bing.com")
const screenshot = await page.screenshot() // returns a node.js Buffer
defImages(screenshot)

OpenAI支持"low"/"high"字段设置。"low"细节级别的图像将被降采样至512x512像素。

defImages(img, { detail: "low" })

你可以从图像中裁剪出感兴趣的区域。

defImages(img, { crop: { x: 0, y: 0, w: 512, h: 512 } })

您还可以自动移除图像边缘的统一颜色。

defImages(img, { autoCrop: true })

您可以将图像转换为灰度。

defImages(img, { greyscale: true })

您可以旋转图像。

defImages(img, { rotate: 90 })

您可以缩放图像。

defImages(img, { scale: 0.5 })

你可以翻转图像。

defImages(img, { flip: { horizontal: true; vertical: true } })

您可以指定最大宽度和最大高度。GenAIScript会调整图像大小以适应这些限制条件。

defImages(img, { maxWidth: 800 })
// and / or
defImages(img, { maxHeight: 800 })