torcharrow.Column¶
一个torcharrow.Column是一个一维的torch.Tensor类似的数据结构,包含单一数据类型的元素。它还支持非数值类型,如字符串、列表、结构体。
数据类型¶
TorchArrow 定义了以下列数据类型,这些类型位于模块 torcharrow.dtypes 中
(在下面的表格中缩写为 dt):
数据类型 |
数据类型 |
|---|---|
32位浮点数 |
|
64位浮点数 |
|
8位有符号整数 |
|
16位有符号整数 |
|
32位有符号整数 |
|
64位有符号整数 |
|
布尔值 |
|
字符串 |
|
列表 |
|
结构体 |
|
列类参考¶
- class torcharrow.Column¶
- Column.dtype¶
torcharrow.Column的数据类型
- Column.device¶
设备上分配或将分配
torcharrow.Column。
- Column.length¶
返回包括空值的行数
- Column.null_count¶
返回空值的数量
返回前n行。 |
|
返回最后n行。 |
|
将列转换为给定的数据类型 |
|
(实验性API) 返回索引i处的数据是否有效,即非空 |
|
返回带有附加值的列/数据框。 |
|
检查列中的每个元素是否包含在值中。 |
|
返回所有非空元素是否为真 |
|
返回是否有任何非空元素为真 |
|
根据输入对应关系映射行。 |
|
选择谓词为True的行。 |
|
根据输入对应关系将行映射到行列表,如果结果类型 != 项目类型,则需要 dtype。 |
|
类似于 map(),但每次调用可调用对象时处理的是小批量的行。 |
|
使用指定的方法填充空值。 |
|
返回一个删除了包含任何或全部空值的行的列/框架。 |
|
(实验性API) 从行/帧中移除重复值,但保留第一个、最后一个或不保留 |
|
将自身转换为箭头数组 |
|
转换为PyTorch容器(Tensor, PackedList, PackedMap等) |
|
转换为纯Python容器(标量或容器的列表) |
|
将自身转换为Pandas Series |
NumericalColumn 类参考¶
- class torcharrow.NumericalColumn¶
序列中每个元素的绝对值。 |
|
将每个值向上舍入到最小的整数 |
|
将每个值向下舍入到最大的整数值 |
|
将数据中的每个值四舍五入到指定的小数位数。 |
|
返回一个新列,包含元素的自然对数 |
|
生成描述性统计。 |
|
返回非空值的最小值。 |
|
返回非空值的最大值。 |
|
返回非空值的总和。 |
|
返回非空值的平均值。 |
|
返回数据的标准差。 |
|
返回数据中的值的中位数。 |
StringColumn 类参考¶
- class torcharrow.StringColumn¶
计算列中每个元素的长度。 |
|
从列中的每个元素中切片子字符串。 |
|
围绕给定的分隔符/定界符拆分字符串。 |
|
移除前导和尾随的空白字符。 |
|
如果字符串是字母字符串,则返回True,否则返回False。 |
|
如果所有字符都是数字,则返回 True,否则返回 False。 |
|
如果字符串中的所有字符都是字母数字(字母或数字),则返回True,否则返回False。 |
|
如果字符串中的所有字符都是数字,则返回True,否则返回False。 |
|
如果字符串仅包含十进制数字(从0到9),则返回True,否则返回False。 |
|
如果字符串中的所有字符都是空白字符,则返回True,否则返回False。 |
|
如果非空字符串为小写,则返回True,否则返回False。 |
|
如果非空字符串为大写,则返回True,否则返回False。 |
|
如果字符串的每个单词都以大写字母开头,则返回True,否则返回False。 |
|
将列中的字符串转换为小写。 |
|
将列中的字符串转换为大写。 |
|
测试每个字符串元素的开头是否匹配一个模式。 |
|
测试每个字符串元素的末尾是否匹配一个模式。 |
|
计算列中每个字符串中模式的出现次数 |
|
返回列中每个字符串的最低索引。 |
|
替换列中每个出现的模式。 |
|
确定每个字符串是否匹配正则表达式 |
|
测试每个项目是否包含在字符串中的模式;返回一个布尔值 |
|
为每个项目查找模式的所有出现(参见 re.findall()) |
ListColumn 类参考¶
- class torcharrow.ListColumn¶
计算列中每个元素的长度。 |
|
从列中的每个元素中切片子列表 |
|
(实验性API) 向量化映射。 |