我在一个数据帧中有一个列,它是一个字符串数据类型数组。我需要提取字符串的一部分,因此我需要对数组中的每个元素应用正则表达式。所以我想使用scala Dataframe API来应用它。
regexp_extract($"myString","(\\d+)-(\\d+)",1).cast(LongType)
在数组的每个成员上。
在一个字符串上做这件事很简单,但是如何在数组的每一项上做呢?
转载请注明出处:http://www.fortunesungroup.com/article/20230331/2403468.html