ai.onnx.ml - DictVectorizer

DictVectorizer - 1 (ai.onnx.ml)

版本

  • 名称: DictVectorizer (GitHub)

  • 领域: ai.onnx.ml

  • since_version: 1

  • 函数: False

  • support_level: SupportType.COMMON

  • 形状推断: True

此版本的运算符自ai.onnx.ml域的第1版起已可用。

摘要

使用索引映射将字典转换为数组。
给定一个字典,每个键在词汇表属性中查找,该属性对应于键类型。找到键的词汇表数组中的索引然后用于索引输出的一维张量‘Y’,并将字典‘X’中找到的值插入其中。
输入映射的键类型必须与定义的词汇表属性的元素类型相对应。 因此,输出数组的长度将等于索引映射向量参数的长度。 输入字典中的所有键必须存在于索引映射向量中。 对于输入字典中的每个项目,将其值插入输出数组中。 输入字典中不存在的任何键在输出数组中为零。
例如:如果string_vocabulary参数设置为["a", "c", "b", "z"], 那么输入{"a": 4, "c": 8}将产生输出[4, 8, 0, 0]

属性

  • int64_vocabulary - INTS :

    一个整数词汇数组。
    必须且只能定义一个词汇。

  • string_vocabulary - 字符串 :

    一个字符串词汇数组。
    必须且只能定义一个词汇表。

输入

  • X (异构) - T1:

    一个字典。

输出

  • Y (异构) - T2:

    一个一维张量,包含来自输入字典的值。

类型约束

  • T1 在 ( map(int64, double), map(int64, float), map(int64, string), map(string, double), map(string, float), map(string, int64) ):

    输入必须是从字符串或整数到字符串或数字类型的映射。键和值类型不能相同。

  • T2 在 ( tensor(double), tensor(float), tensor(int64), tensor(string) ) 中:

    输出将是输入映射值类型的张量。其形状将为[1,C],其中C是输入字典的长度。