Python量化交易，数据处理核心模块Pandas学习-热点指南

Pandas是Python在数据处理方面功能最为强大的扩展模块了。在处理实际的金融数据时，一条数据通常包含了多种类型的数据，例如，股票的代码是字符串，收盘价是浮点型，而成交量是整型等。在C++中可以实现为一个给定结构体作为单元的容器，如向量（vector，C++中的特定数据结构）。在Python中，Pandas包含了高级的数据结构Series和DataFrame，使得在Python中处理数据变得非常方便、快速和简单。

Pandas不同的版本之间存在一些不兼容性，为此，我们需要清楚使用的是哪一个版本的Pandas。Pandas版本查看：

Pandas版本查看

Pandas主要的两个数据结构是Series和DataFrame，随后两节将介绍如何由其他类型的数据结构得到这两种数据结构，或者自行创建这两种数据结构，我们先导入相关模块：

Numpy, Pandas导入

从一般意义上来讲，Series可以简单地被认为是一维的数组。Series和一维数组最主要的区别在于Series类型具有索引（index），可以和另一个编程中常见的数据结构哈希（Hash）联系起来。
创建一个Series的基本格式是s = Series(data, index=index, name=name)

案列演示

可以在创建Series时添加index，并可使用Series.index查看具体的index。需要注意的一点是，当从数组创建Series时，若指定index，那么index长度要和data的长度一致：

案列演示

创建Series的另一个可选项是name，可指定Series的名称，可用Series.name访问。在随后的DataFrame中，每一列的列名在该列被单独取出来时就成了Series的名称：

案例演示

访问Series数据可以和数组一样使用下标，也可以像字典一样使用索引，还可以使用一些条件过滤：

案例演示

好了本篇文章暂时就学习到这, 大家点个关注点个赞, 下篇文章给大家继续拓展DataFrame的使用

Python 数据结构文章

本文来自投稿，不代表本人立场，如若转载，请注明出处：http://www.souzhinan.com/kj/287496.html

Python量化交易，数据处理核心模块Pandas学习

相关推荐