首页 \ 问答 \ 在pyspark中列出到DataFrame(List to DataFrame in pyspark)

在pyspark中列出到DataFrame(List to DataFrame in pyspark)

 有人可以告诉我如何将包含字符串的列表转换为pyspark中的Dataframe。 我使用python 3.6与spark 2.2.1。 我刚刚开始学习spark环境，我的数据如下所示  
my_data =[['apple','ball','ballon'],['cat','camel','james'],['none','focus','cake']]
 
 现在，我想创建一个Dataframe，如下所示  
---------------------------------
|ID | words                     |
---------------------------------
 1  | ['apple','ball','ballon'] |
 2  | ['cat','camel','james']   |
 
 我甚至想添加数据中没有关联的ID列 

Can someone tell me how to convert a list containing strings to a Dataframe in pyspark. I am using python 3.6 with spark 2.2.1. I am just started learning spark environment and my data looks like below 
my_data =[['apple','ball','ballon'],['cat','camel','james'],['none','focus','cake']]
 
Now, i want to create a Dataframe as follows 
---------------------------------
|ID | words                     |
---------------------------------
 1  | ['apple','ball','ballon'] |
 2  | ['cat','camel','james']   |
 
I even want to add ID column which is not associated in the data

原文：https://stackoverflow.com/questions/48290759

更新时间：2023-01-26 11:01

最满意答案

 愿这可以帮助你：  
dataa <- data.frame(abs(rnorm(mean = 30, sd = 40, n= 100)))
names(dataa) <- c("v1")
dataa %>% mutate(v2 = as.numeric( (cumsum(as.numeric(dataa$v1>70)) <= 0) & (cumsum(as.numeric(dataa$v1<25)) >= 1)))

May this could help you :  
dataa <- data.frame(abs(rnorm(mean = 30, sd = 40, n= 100)))
names(dataa) <- c("v1")
dataa %>% mutate(v2 = as.numeric( (cumsum(as.numeric(dataa$v1>70)) <= 0) & (cumsum(as.numeric(dataa$v1<25)) >= 1)))

在pyspark中列出到DataFrame(List to DataFrame in pyspark)

最满意答案

相关问答

TCP/IP模型是一个________。[2023-10-02]

下列中不属于面向对象的编程语言的是?[2022-05-30]

在数组中找到符合特定条件的项目（Perl）？(Find the item in an array that meets a specific criteria if there is one (Perl)?)[2024-02-16]

Python：检查字符串是否符合特定格式(Python: check if string meets specific format)[2023-07-29]

在特定值下打印1，直到满足更高的值(Print 1 below specific value until meets a higher value)[2024-01-16]

在满足特定条件的数组中获取特定的散列(Grabbing a specific hash in an array that meets a specific criteria)[2022-06-02]

如果所有值都更高，则打印(print if all value are higher)[2022-03-23]

捕获特定变量并打印其值(Catch specific variable and print his value)[2023-05-05]

获得满足Javascript条件的数组中第一个元素的高阶方法？(Higher Order way of getting the first element in an array that meets a condition in Javascript? [closed])[2022-05-23]

如何检查数组中的所有值是否高于特定数量？(How to check if all values in an array are higher than a specific amount?)[2022-11-24]

相关文章

最新问答