pandas库学习(持续更新)
python pandas库学习
apply() 方法
pandas 中的 apply 方法是一个非常灵活且强大的工具,可用于对 Series 或 DataFrame 对象中的元素、行或列应用自定义函数。下面为你从多个方面详细介绍其用法。
1. 对 Series 对象使用 apply
Series 是一维带标签数组,apply 可对其中每个元素应用指定函数。
基础示例
1 | import pandas as pd |
在这个例子中,multiply_by_two 函数被应用到 Series 的每个元素上,将每个元素都乘以 2。
使用匿名函数(lambda 函数)
1 | import pandas as pd |
lambda 函数让代码更简洁,适合实现简单逻辑。
2. 对 DataFrame 对象使用 apply
DataFrame 是二维表格型数据结构,apply 可按行或列应用函数,通过 axis 参数控制。
按列应用函数(axis = 0)
1 | import pandas as pd |
这里 axis = 0 表示按列操作,函数会依次对每列进行计算。
按行应用函数(axis = 1)
1 | import pandas as pd |
axis = 1 表示按行操作,函数会依次对每行进行计算。
3. 传递额外参数
apply 方法允许传递额外参数给自定义函数。
1 | import pandas as pd |
在这个例子中,args 参数是一个元组,包含要传递给 add_value 函数的额外参数。
4. 处理缺失值
apply 方法会自动处理缺失值(NaN),它会将缺失值原样保留。
1 | import pandas as pd |
可以看到,NaN 值在处理后依然是 NaN。
5. 返回不同类型结果
apply 方法可以返回不同类型的结果,例如返回 Series 或 DataFrame
1 | import pandas as pd |
这里自定义函数返回一个 Series,apply 会将这些 Series 组合成一个新的 DataFrame。
综上所述,pandas 的 apply 方法为数据处理提供了极大的灵活性,能帮助你高效地对数据进行自定义操作。
读取tsv格式文件
我有如下图一个tsv格式文件:
我该怎么把指定的列提取出来呢
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Dedsec的博客!



