Pandas 教程

Pandas 教程,Pandas 是一个专门用于数据分析的开源Python库。目前,所有使用python语言研究和分析数据集的专业人士,在做相关统计分析和决策时,Pandas 都是他们的基础工具。

Pandas 教程

历史起源

2008年,Wes McKinny一人挑起了Pandas库的设计和开发工作。

2012 年,他的同事Sien Chang加入开发,他两一起开发了Python社区最为有用的库之一 – Pandas

数据分析工作需要一个专门的库,它能够用最简单的方式提供数据处理、数据抽取和数据操作所需要的全部工具,开发Pandas正是为了满足这个需求。

Wes MicKinny选择以Numpy库作为Python库Pandas的基础进行设计,可以说,该选择对于Pandas的成功和它的迅速扩展起着非常重要的作用。事实上,选择Numpy为基础,不仅使Pandas能和其他大多数模块相兼容,而且还能借力Numpy模块在计算方面性能高的优势。

另外一个意义深远的决定是为数据分析专门设计了两种数据结构。实际情况是,Pandas 没有使用Pandas已有的内置数据结构,也没有使用其他库的数据结构,而是开发了两种新型的数据结构。这两种数据结构的设计初衷是用于关系型或带标签的数据。用它们管理与SQL关系数据库和Excel工作表具有类似特征的数据很方便。

阅读前提

  • python 基础知识
    Python是一种动态的、面向对象的脚本语言,最初被设计用于编写自动化脚本,随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。

  • Numpy 基础知识

相关知识

  • Pandas 数据处理
    本教程介绍数据处理,将数据转换为DataFrame格式后,你就可以对其进行处理了,数据处理的目的是准备数据,便于分析。数据处理可以使要寻找的信息以更加清晰的方式呈现出来,把数据处理成易于可视化的形式。

  • Pandas 数据读取与写入
    本教程将介绍Pandas从多种存储媒介(比如文件和数据库)读取数据的工具,还将学到直接将不同的数据结构写入不同格式文件的方法,无需考虑所使用的技术。本教程的主要内容为pandas的多种I/O API函数,它们为把大多数常用格式的数据作为DataFrame对象进行读写提供了很大的便利。

文章目录

赞(0)

评论 抢沙发

评论前必须登录!