大数据分析进阶之python财经数据抓取
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大数据分析进阶之python财经数据抓取
大数据分析进阶之python财经数据抓取
•Python常用数据分析包:
Pandas:数据分析
Nltk:自然语言处理
Scikit:人工智能和机器学习
Numpy/scipy:矢量数据和科学计算
Sympy:符号计算
Gpu:并行超速运算
Opencv:图像视频处理
TVTK/mayavi:可视化
•财经数据接口包
•Pandas
Python Data Analysis Library 或是基于NumPy 的一种工具,是python的一个数据分析包。
Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。
Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。
Pandas返回的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。
使用pandas自带财经数据接口,能够获取雅虎财经、世界银行等财经数据。
•TuShare
TuShare是一个免费、开源的python财经数据接口包。
主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程,能够为金融分析人员提供快速、整洁和多样的便于分析的数据,为他们在数据来源方面极大地减轻了工作量,使他们更加专注于策略和模型的研究与实现上。
TuShare返回的绝大部分的数据格式都是pandas DataFrame类型,非常便于用pandas/NumPy/Matplotlib进行数据分析和可视化。
使用TuShare自带财经数据接口,能够获取新浪财经的证券、宏观等财经数据。
使用TuShare自带财经数据接口,能够获取即时新浪财经数据、新浪股吧数据、个股信息地雷数据等数据。
接口简单易懂,返回的数据格式规整,非常便于处理分析!
•数据挖掘实验室
持续追踪大数据和数据新闻前沿,通过自然语言处理、机器学习、R等大数据处理手段和D3、Echarts等数据可视化方法,玩转大数据驱动新闻。