图片
对于支持此功能的模型(如gpt-4o),可以向提示中添加图像。
使用defImages函数来声明图像。支持的图像格式会因模型而异,
但通常包括PNG、JPEG、WEBP和GIF。同时支持本地文件和URL。
defImages(env.files)了解更多关于OpenAI Vision的信息。
网址
公开URL(不需要身份验证的)将直接传递给OpenAI。
defImages( "https://github.com/microsoft/genaiscript/blob/main/docs/public/images/logo.png?raw=true")本地文件会被加载并编码为数据URI。
缓冲区、二进制大对象、可读流
defImages 函数还支持 Buffer、Blob 和 ReadableStream。
这个示例会截取bing.com的截图并将其添加到图片库中。
const page = await host.browse("https://bing.com")const screenshot = await page.screenshot() // returns a node.js BufferdefImages(screenshot)详情
OpenAI支持"low"/"high"字段设置。"low"细节级别的图像将被降采样至512x512像素。
defImages(img, { detail: "low" })裁剪
你可以从图像中裁剪出感兴趣的区域。
defImages(img, { crop: { x: 0, y: 0, w: 512, h: 512 } })自动裁剪
您还可以自动移除图像边缘的统一颜色。
defImages(img, { autoCrop: true })灰度
您可以将图像转换为灰度。
defImages(img, { greyscale: true })旋转
您可以旋转图像。
defImages(img, { rotate: 90 })缩放
您可以缩放图像。
defImages(img, { scale: 0.5 })翻转
你可以翻转图像。
defImages(img, { flip: { horizontal: true; vertical: true } })最大宽度,最大高度
您可以指定最大宽度和最大高度。GenAIScript会调整图像大小以适应这些限制条件。
defImages(img, { maxWidth: 800 })// and / ordefImages(img, { maxHeight: 800 })