pandas将dataframe列中的list转换为多列

admin

146293
文章

119
评论

2023年12月27日16:13:10评论38 views字数 1848阅读6分9秒阅读模式

pandas将dataframe列中的list转换为多列

在应用机器学习的过程中，很大一部分工作都是在做数据的处理，一个非常常见的场景就是将一个list序列的特征数据拆成多个单独的特征数据。

比如数据集如下所示：

data = [['John', '25', 'Male',[99,100,98]],
        ['Emily', '22', 'Female',[97,99,98]],
        ['Michael', '30', 'Male',[97,99,100]]]
df_data= pd.DataFrame(data,columns=['Name', 'Age', 'Gender','Score'])
df_data

pandas将dataframe列中的list转换为多列很多场景是需要将类似于Score的list序列特征，拆成多个特征值如这里的语、数、外的分数。

下面通过几个实例来将dataframe列中的list序列转换为多列。

1、一维序列拆成多列

可以通过在列上应用Series来进行拆分。

1 2	df_score=df_data['Score'].apply(pd.Series).rename(columns={0:'English',1:'Math',2:'Chinese'}) df_score

pandas将dataframe列中的list转换为多列

可以看到将Score的数组，拆分成了English、Math、Chinese三个特征字段了

1 2	df_data=df_data.join(df_score) df_data

pandas将dataframe列中的list转换为多列

2、二维序列拆成多列

用同样的思路也可以将二维序列的特征列拆成多列
如特征列是二维序列，序列里还有多个序列

data = [['John', '25', 'Male',[[99,100,98],[89,70]]],
        ['Emily', '22', 'Female',[[97,99,98],[99,96]]],
        ['Michael', '30', 'Male',[[97,99,100],[87,99]]]]
df_data= pd.DataFrame(data,columns=['Name', 'Age', 'Gender','Score'])
df_data

pandas将dataframe列中的list转换为多列

df_score=df_data['Score'].apply(pd.Series)
df_score_1=df_score[0].apply(pd.Series).rename(columns={0:'English',1:'Math',2:'Chinese'})
df_score_2=df_score[1].apply(pd.Series).rename(columns={0:'Biology',1:'Geography'})
df_score=df_score_1.join(df_score_2)
df_data=df_data.join(df_score_1).join(df_score_2)
df_data

pandas将dataframe列中的list转换为多列

另外一种情况就是序列里面只有一个序列的二维序列，数据如下所示：

data = [['John', '25', 'Male',[[99,100,98,89,70]]],
        ['Emily', '22', 'Female',[[97,99,98,99,96]]],
        ['Michael', '30', 'Male',[[97,99,100,87,99]]]]
df_data= pd.DataFrame(data,columns=['Name', 'Age', 'Gender','Score'])
df_data

pandas将dataframe列中的list转换为多列

这样也可以通过多次应用Series来进行拆分，也可以先explode()再应用Series来进行拆分。

1 2	df_score=df_data['Score'].apply(pd.Series)[0].apply(pd.Series).rename(columns={0:'English',1:'Math',2:'Chinese',3:'Biology',4:'Geography'}) df_score

pandas将dataframe列中的list转换为多列

1 2	df_score=df_data['Score'].explode().apply(pd.Series).rename(columns={0:'English',1:'Math',2:'Chinese',3:'Biology',4:'Geography'}) df_score

pandas将dataframe列中的list转换为多列

两者效果是一样的。

博客地址：http://xiejava.ishareread.com/

“fullbug”微信公众号

关注：微信公众号,一起学习成长！

原文始发于微信公众号（fullbug）：pandas将dataframe列中的list转换为多列

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

java二次反序列化链

冰蝎二开从0到1

【代码审计】有手就行的目录穿越定时任务getshell

hkcms搭建教程及后台模板注入

安全可靠测评工作指南（V3.0）发布

Git保姆级手册，看完这篇手册，你还不会用Git我就要哭了

远程开发引起的隐形风险与合规守护

Perl 语言基础入门

Rust标准黑客工具设计实现分析

插件前台任意文件读取漏洞复现与分析 (CVE-2025-2294)

发表评论

在线咨询

微信