在Spark Scala中对数组的每个成员应用函数


我在一个数据帧中有一个列,它是一个字符串数据类型数组。我需要提取字符串的一部分,因此我需要对数组中的每个元素应用正则表达式。所以我想使用scala Dataframe API来应用它。

regexp_extract($"myString","(\\d+)-(\\d+)",1).cast(LongType) 

在数组的每个成员上。

在一个字符串上做这件事很简单,但是如何在数组的每一项上做呢?

转载请注明出处:http://www.fortunesungroup.com/article/20230331/2403468.html