首页 > 科技 > Python量化交易,数据处理核心模块Pandas学习

Python量化交易,数据处理核心模块Pandas学习

Pandas是Python在数据处理方面功能最为强大的扩展模块了。在处理实际的金融数据时,一条数据通常包含了多种类型的数据,例如,股票的代码是字符串,收盘价是浮点型,而成交量是整型等。在C++中可以实现为一个给定结构体作为单元的容器,如向量(vector,C++中的特定数据结构)。在Python中,Pandas包含了高级的数据结构Series和DataFrame,使得在Python中处理数据变得非常方便、快速和简单。

Pandas不同的版本之间存在一些不兼容性,为此,我们需要清楚使用的是哪一个版本的Pandas。Pandas版本查看:


Pandas版本查看

Pandas主要的两个数据结构是Series和DataFrame,随后两节将介绍如何由其他类型的数据结构得到这两种数据结构,或者自行创建这两种数据结构,我们先导入相关模块:


Numpy, Pandas导入

从一般意义上来讲,Series可以简单地被认为是一维的数组。Series和一维数组最主要的区别在于Series类型具有索引(index),可以和另一个编程中常见的数据结构哈希(Hash)联系起来。
创建一个Series的基本格式是s = Series(data, index=index, name=name)


案列演示

可以在创建Series时添加index,并可使用Series.index查看具体的index。需要注意的一点是,当从数组创建Series时,若指定index,那么index长度要和data的长度一致:


案列演示

创建Series的另一个可选项是name,可指定Series的名称,可用Series.name访问。在随后的DataFrame中,每一列的列名在该列被单独取出来时就成了Series的名称:


案例演示

访问Series数据可以和数组一样使用下标,也可以像字典一样使用索引,还可以使用一些条件过滤:


案例演示

好了本篇文章暂时就学习到这, 大家点个关注点个赞, 下篇文章给大家继续拓展DataFrame的使用

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/287496.html