pyspark.RDD.lookup

RDD. lookup ( key : K ) → List [ V ] [source]

返回RDD中键 key 对应的值列表。如果RDD具有已知的分区器,则此操作可以高效地完成,只需搜索键映射到的分区即可。

新增于版本 1.2.0。

Parameters
key K

查找的关键

Returns
list

key RDD 中的值列表

示例

>>> l = range(1000)
>>> rdd = sc.parallelize(zip(l, l), 10)
>>> rdd.lookup(42)  # slow
[42]
>>> sorted = rdd.sortByKey()
>>> sorted.lookup(42)  # fast
[42]
>>> sorted.lookup(1024)
[]
>>> rdd2 = sc.parallelize([(('a', 'b'), 'c')]).groupByKey()
>>> list(rdd2.lookup(('a', 'b'))[0])
['c']