(完整版)Python量化代码

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

# coding: utf-8
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from __future__ import division
# 获取数据函数
def get_stock_data(stock_code, index_code, start_date, end_date):
"""
:param stock_code: 股票代码，例如‘sz000002’
:param index_code: 指数代码，例如‘sh000001’
:param start_date: 回测开始日期，例如‘1991-1-30'
:param end_date: 回测结束日期，例如‘2015-12-31’
:return: 函数返回其他函数的各参数序列
"""
# 此处为存放csv文件的本地路径，请自行改正地址.注意windows和mac系统,斜杠的方向不一样
stock_data = pd.read_csv(r'G:\财通实习\历史日线数据_样本%282013 2014年数据%292\all_trading_data\stock data\sh600000.csv', parse_dates=['date'])
benchmark = pd.read_csv(r'G:\财通实习\历史日线数据_样本%282013 2014年数据%292\all_trading_data\index data\sh000001.csv', parse_dates=['date'])
date = pd.date_range(2016-01-01,2016-03-15) # 生成日期序列
# 选取在日期范围内的股票数据序列并按日期排序
stock_data = stock_data.ix[stock_data['date'].isin(date), ['date', 'change', 'adjust_price']] stock_data = stock_data.ix[stock_data['date'].isin(date), ['date', 'change', 'adjust_price']]
# 选取在日期范围内的指数数据序列并按日期排序
date_list = list(stock_data['date'])
benchmark = benchmark.ix[benchmark['date'].isin(date_list), ['date', 'change', 'close']] benchmark.sort_values(by='date', inplace=True)
benchmark.set_index('date', inplace=True)
# 将回测要用到的各个数据序列转成list格式
date_line = list(benchmark.index.strftime('%Y-%m-%d')) # 日期序列
capital_line = list(stock_data['adjust_price']) # 账户价值序列
return_line = list(stock_data['change']) # 收益率序列
indexreturn_line = list(benchmark['change']) # 指数的变化率序列
index_line = list(benchmark['close']) # 指数序列
return date_line, capital_line, return_line, index_line, indexreturn_line
# 计算年化收益率函数
def annual_return(date_line, capital_line):
"""
:param date_line: 日期序列
:param capital_line: 账户价值序列
:return: 输出在回测期间的年化收益率
"""
# 将数据序列合并成dataframe并按日期排序
df = pd.DataFrame({'date': date_line, 'capital': capital_line})
df.sort_values(by='date', inplace=True)
df.reset_index(drop=True, inplace=True)
rng = pd.period_range(df['date'].iloc[0], df['date'].iloc[-1], freq='D')
# 计算年化收益率
annual = pow(df.ix[len(df.index) - 1, 'capital'] / df.ix[0, 'capital'], 250 / len(rng)) - 1
print '年化收益率为：%f' % annual
# 计算最大回撤函数
def max_drawdown(date_line, capital_line):
"""
:param date_line: 日期序列
:param capital_line: 账户价值序列
:return: 输出最大回撤及开始日期和结束日期
"""
# 将数据序列合并为一个dataframe并按日期排序
df = pd.DataFrame({'date': date_line, 'capital': capital_line})
df.sort_values(by='date', inplace=True)
df.reset_index(drop=True, inplace=True)
df['max2here'] = pd.expanding_max(df['capital']) # 计算当日之前的账户最大价值df['dd2here'] = df['capital'] / df['max2here'] - 1 # 计算当日的回撤
# 计算最大回撤和结束时间
temp = df.sort_values(by='dd2here').iloc[0][['date', 'dd2here']]
max_dd = temp['dd2here']
end_date = temp['date']
# 计算开始时间
df = df[df['date'] <= end_date]
start_date = df.sort_values(by='capital', ascending=False).iloc[0]['date']
print '最大回撤为：%f, 开始日期：%s, 结束日期：%s' % (max_dd, start_date, end_date)
# 计算平均涨幅
def average_change(date_line, return_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:return: 输出平均涨幅
"""
df = pd.DataFrame({'date': date_line, 'rtn': return_line})
ave = df['rtn'].mean()
print '平均涨幅为：%f' % ave
# 计算上涨概率
def prob_up(date_line, return_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:return: 输出上涨概率
"""
df = pd.DataFrame({'date': date_line, 'rtn': return_line})
df.ix[df['rtn'] > 0, 'rtn'] = 1 # 收益率大于0的记为1
df.ix[df['rtn'] <= 0, 'rtn'] = 0 # 收益率小于等于0的记为0
# 统计1和0各出现的次数
count = df['rtn'].value_counts()
p_up = count.loc[1] / len(df.index)
print '上涨概率为：%f' % p_up
# 计算最大连续上涨天数和最大连续下跌天数
def max_successive_up(date_line, return_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:return: 输出最大连续上涨天数和最大连续下跌天数
"""
df = pd.DataFrame({'date': date_line, 'rtn': return_line})
# 新建一个全为空值的series,并作为dataframe新的一列
s = pd.Series(np.nan, index=df.index)
= 'up'
df = pd.concat([df, s], axis=1)
# 当收益率大于0时，up取1，小于0时，up取0，等于0时采用前向差值df.ix[df['rtn'] > 0, 'up'] = 1
df.ix[df['rtn'] < 0, 'up'] = 0
df['up'].fillna(method='ffill', inplace=True)
# 根据up这一列计算到某天为止连续上涨下跌的天数
rtn_list = list(df['up'])
successive_up_list = []
num = 1
for i in range(len(rtn_list)):
if i == 0:
successive_up_list.append(num)
else:
if (rtn_list[i] == rtn_list[i - 1] == 1) or (rtn_list[i] == rtn_list[i - 1] == 0):
num += 1
else:
num = 1
successive_up_list.append(num)
# 将计算结果赋给新的一列'successive_up'
df['successive_up'] = successive_up_list
# 分别在上涨和下跌的两个dataframe里按照'successive_up'的值排序并取最大值
max_successive_up = df[df['up'] == 1].sort_values(by='successive_up', ascending=False)['successive_up'].iloc[0]
max_successive_down = df[df['up'] == 0].sort_values(by='successive_up', ascending=False)['successive_up'].iloc[0]
print '最大连续上涨天数为：%d 最大连续下跌天数为：%d' % (max_successive_up, max_successive_down)
# 计算最大单周期涨幅和最大单周期跌幅
def max_period_return(date_line, return_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:return: 输出最大单周期涨幅和最大单周期跌幅
"""
df = pd.DataFrame({'date': date_line, 'rtn': return_line})
# 分别计算日收益率的最大值和最小值
max_return = df['rtn'].max()
min_return = df['rtn'].min()
print '最大单周期涨幅为：%f 最大单周期跌幅为：%f' % (max_return, min_return)
# 计算收益波动率的函数
def volatility(date_line, return_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:return: 输出回测期间的收益波动率
"""
from math import sqrt
df = pd.DataFrame({'date': date_line, 'rtn': return_line})
# 计算波动率
vol = df['rtn'].std() * sqrt(250)
print '收益波动率为：%f' % vol
# 计算贝塔的函数
def beta(date_line, return_line, indexreturn_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:param indexreturn_line: 指数的收益率序列
:return: 输出beta值
"""
df = pd.DataFrame({'date': date_line, 'rtn': return_line, 'benchmark_rtn': indexreturn_line}) # 账户收益和基准收益的协方差除以基准收益的方差
b = df['rtn'].cov(df['benchmark_rtn']) / df['benchmark_rtn'].var()
print 'beta: %f' % b
# 计算alpha的函数
def alpha(date_line, capital_line, index_line, return_line, indexreturn_line):
"""
:param date_line: 日期序列
:param capital_line: 账户价值序列
:param index_line: 指数序列
:param return_line: 账户日收益率序列
:param indexreturn_line: 指数的收益率序列
:return: 输出alpha值
"""
# 将数据序列合并成dataframe并按日期排序
df = pd.DataFrame({'date': date_line, 'capital': capital_line, 'benchmark': index_line, 'rtn': return_line,
'benchmark_rtn': indexreturn_line})
df.sort_values(by='date', inplace=True)
df.reset_index(drop=True, inplace=True)
rng = pd.period_range(df['date'].iloc[0], df['date'].iloc[-1], freq='D')
rf = 0.0284 # 无风险利率取10年期国债的到期年化收益率
annual_stock = pow(df.ix[len(df.index) - 1, 'capital'] / df.ix[0, 'capital'], 250 / len(rng)) - 1 # 账户年化收益
annual_index = pow(df.ix[len(df.index) - 1, 'benchmark'] / df.ix[0, 'benchmark'], 250 / len(rng)) - 1 # 基准年化收益
beta = df['rtn'].cov(df['benchmark_rtn']) / df['benchmark_rtn'].var() # 计算贝塔值
a = (annual_stock - rf) - beta * (annual_index - rf) # 计算alpha值
print 'alpha：%f' % a
# 计算夏普比函数
def sharpe_ratio(date_line, capital_line, return_line):
"""
:param date_line: 日期序列
:param capital_line: 账户价值序列
:param return_line: 账户日收益率序列
:return: 输出夏普比率
"""
from math import sqrt
# 将数据序列合并为一个dataframe并按日期排序
df = pd.DataFrame({'date': date_line, 'capital': capital_line, 'rtn': return_line})
df.sort_values(by='date', inplace=True)
df.reset_index(drop=True, inplace=True)
rng = pd.period_range(df['date'].iloc[0], df['date'].iloc[-1], freq='D')
rf = 0.0284 # 无风险利率取10年期国债的到期年化收益率
# 账户年化收益
annual_stock = pow(df.ix[len(df.index) - 1, 'close'] / df.ix[0, 'close'], 250 / len(rng)) - 1 # 计算收益波动率
volatility = df['rtn'].std() * sqrt(250)
# 计算夏普比
sharpe = (annual_stock - rf) / volatility
print 'sharpe_ratio: %f' % sharpe
# 计算信息比率函数
def info_ratio(date_line, return_line, indexreturn_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:param indexreturn_line: 指数的收益率序列
:return: 输出信息比率
"""
from math import sqrt
df = pd.DataFrame({'date': date_line, 'rtn': return_line, 'benchmark_rtn': indexreturn_line})
df['diff'] = df['rtn'] - df['benchmark_rtn']
annual_mean = df['diff'].mean() * 250
annual_std = df['diff'].std() * sqrt(250)
info = annual_mean / annual_std
print 'info_ratio: %f' % info
# 计算股票和基准在回测期间的累计收益率并画图
def cumulative_return(date_line, return_line, indexreturn_line):
"""
:param date_line: 日期序列
:param return_line: 账户日收益率序列
:param indexreturn_line: 指数日收益率序列
:return: 画出股票和基准在回测期间的累计收益率的折线图
"""
df = pd.DataFrame({'date': date_line, 'rtn': return_line, 'benchmark_rtn': indexreturn_line}) df['stock_cumret'] = (df['rtn'] + 1).cumprod()
df['benchmark_cumret'] = (df['benchmark_rtn'] + 1).cumprod()
# 画出股票和基准在回测期间的累计收益率的折线图
df['stock_cumret'].plot(style='k-', figsize=(12, 5))
df['benchmark_cumret'].plot(style='k--', figsize=(12, 5))
plt.show()
# 调用get_stock_data函数读取数据
date_line, capital_line, return_line, index_line, indexreturn_line = get_stock_data('sz000002', 'sh000001', '1991-1-30',
'2015-12-31')
# 年化收益率
annual_return(date_line, capital_line)
# 最大回撤
max_drawdown(date_line, capital_line)
# 平均涨幅
average_change(date_line, return_line)
# 上涨概率
prob_up(date_line, return_line)
# 最大连续上涨天数和最大连续下跌天数
max_successive_up(date_line, return_line)
# 最大单周期涨幅和最大单周期跌幅
max_period_return(date_line, return_line)
# 收益波动率
volatility(date_line, return_line)
# beta值
beta(date_line, return_line, indexreturn_line)
# alpha值
alpha(date_line, capital_line, index_line, return_line, indexreturn_line) # 夏普比率
sharpe_ratio(date_line, capital_line, return_line)
# 信息比率
info_ratio(date_line, return_line, indexreturn_line)
# 画出累积收益率曲线图
cumulative_return(date_line, return_line, indexreturn_line)。