实证研究、CSMAR数据库与量化投资1
Download
Report
Transcript 实证研究、CSMAR数据库与量化投资1
实证研究、CSMAR数据库与量化投资
主讲人:凌宗平
数据应用事业部
深圳市国泰安信息技术有限公司
实证研究
CSMAR数据
量化投资
交流内容
Empirical Research
Evidence or study relies on practical experience rather than theories.
以事实、实际情况和收集到的数据为对象,通过分析、计算、实
验、研究,解释和预测社会科学实务,回答“实际是什么”的问题。
什
么
是
实
证
研
究
为什么要实证研究?
在社会科学面前,实证研究方法具有其他研究方法难以比拟的优势。
这是因为
通过对理论研究进行数据验证,实证研
究避免了传统理论研究中的唇枪舌战,
取而代之的是利用模型设计和大样本检
验,对理论研究做出客观、公正的评判。
在经济金融领域80%的研究论文采用实证研究方法!
实证研究流程
确定研究选
题
理论推导
提出研究假
设
感兴趣,现实意义
文献阅览,
归纳综述
研究设计
数据收集
实证检验分
析
提出研究结
论
确定研究模型, 统计工具选择,
厘清数据指标, 程序编写实证
数据搜集整理, 结果整理分析
异常数据处理
选题在于创新
构思源于积累
故事贵在有趣
博览文献- CNKI、 Els
evier 、Google schoo
lar
敢于挑战权威
选题
理论
看得见的成功,看
不见的努力!
工具—Matlab、SPSS、STATA
设计-描述性、回归分析等
设计
文中自有黄金屋,颜如玉?
实证研究的要素
假设
结论
推理
实证的
要素
检验
模型
数据
建模
计算 14%
5%
论证 研究者时间花销
检验
2%
4%
数据收
集、整理
59%
推理
14% 假设
2%
时间去哪了?
数据
无法实证研究
精准数据
结论不准确,研究无意义
权威数据
研究结果得不到认可
专业数据
花大量时间处理数据
怎么办?
国际实证研究界的选择
从国际经验来看,美国实证学术研究的飞速发展得益于CRSP 、COMPUSTAT 等
专业学术研究数据库的支持。
CRSP是由美国芝加哥大学证券价格研究中心建置,主要来
源为纽约证券交易所、美国证券交易所及纳斯达克证券交易
所的上市股票,其日交易、月交易及年交易的相关数据,例
如美国股票价格、NYSE/AMEX、 S&P 500和Nasdaq股票
指数、股票交易量、物价指数、基金、公债价格、公债指
数、股票收盘价等历史资料,与美国企业活动资讯、企业沿
革、购并及联盟状况、资本回收、现金流量等基本财务数
据。
COMPUSTAT 是由美国Standard & Poor's 公司发行,收录北美近20
年及全球近12年上市公司的财务数据,另外也提供了北美回顾版,提供
400家公司自1950年起之财务数据。本数据库提供160种范本报表、及
上市或下市公司财务数据等讯息。并且整合最新或历史性之主要财务数
据以制作所需之报表和图表。应用的研究领域包括资产分析、计量分
析、竞争者分析、公司资本结构、财务比率、合并与购并、R&D、资本
及存货投资、股市报酬及资本市场效率等主题。
工欲善其事,必先利其器!
中国的CRSP、COMPUSTAT在哪儿?
专业性
数据设计符合规范
化、标准化,数据库
的整体架构与实证学
术研究方法、模型紧
密集合,数据的内容
及表现形式满足学术
研究的需要,检索方
便,易于验证。
准确性
数据不准确,研究的
可靠性就无从谈起,
研究结论就会受到质
疑,数据的准确性是
得出有效研究结论的
根本保证。
完整性
完整的数据有助于正
确描述事物的本质。
体现在数据项目、指
标、时间区间等诸多
方面。
延续性
事物是不断发展的,
数据的延续和数据库
的不断扩展可以帮助
研究者对事物发展的
追踪、分析,拓宽研
究思路。
CSMAR
中国经济金融系列研究数据库
国泰安公司借鉴CRSP、COMPUSTAT、TAQ、ISDA等国际知名数据
库的成熟经验开发。
被诺贝尔获得者Robert William Fogel 高度认可
作为大中华地区唯一的数据提供商加入美国沃顿商学院WRDS研究数
据服务体系
学术研究数据和资讯类数据的比较
学术研究数据
资讯类数据
用途
实证学术研究
投资者即时市场操作
数据特点
侧重于数据的深度和广度,强调对原
始数据的深层专业加工、整理,属精
准数据。并结合实证研究专题,按研
究方向对海量数据进行分门别类,满
足不同研究者的需求,帮助研究者最
快和最方便的构建研究模型。
侧重于实时信息和数据的原发性,
没有对原始数据进行深层加工,仅
仅是对数据做了初次收集。
代表
国泰安CSMAR、美国CRSP、
COMPUSTAT
Bloomberg 、路透终端、国泰安资
讯系统
CSMAR的构成
14个系列
92个数据库
20,000多个字段
CSMAR的特点
国际标准
结构化数据建模
结构设计借鉴芝加哥大学CRSP、标准普
尔Compustat、纽约交易所TAQ、
ISDA,Thomson、GSIOnline等国际
知名数据库的专业标准。
非结构化资源建模
借鉴国际IMS的Learning Resource
Metadata(学习资源元数据规范)、
IEEE LTSC(学习技术标准委员会)的
LOM(学习对象元数据模型)、OCLE
(Online Computer Library
Center)Dublin Core的Dublin Core
元数据标准。
CSMAR的特点
国际标准
全面完整
数据内容
覆盖了宏观经济、行业经济、上
市公司、股票市场、基金、债
券、股指期货、商品期货、港股
等领域,包括结构化的财务报
表、交易行情以及非结构化的新
闻资讯、研究报告、公司公告数
据等。
时间区间及容量
宏观经济:1949年至今,
上市公司及股票交易:1990年至
今,
基金数据:1998年至今,
商品期货:1998年至今,
股指期货:2010年至今
高频:2000年至今
CSMAR的特点
国际标准
全面完整
基础衍生
深度衍生
提供股票交易的多维个股及市场回报率
衍生字段,不同计算角度的财务比率指
标,债券研究的久期、凸度字段等
深度衍生
量化因子数据库,9大类,206个因
子,提供阿尔法预测分析;
风险控制模型数据库,34个风控因
子,提供风险预测、投组构建、绩效分
析;
量化新闻数据库,国内5000个数据源
的提炼,提供给计算机模型读的新闻资
讯。
CSMAR的特点
国际标准
全面完整
深度衍生
快速及时
采集
24×7不间断滚动更新
自动化为主的数据采集模式,提升采
集效率
高频数据
行情数据精确到毫秒
传输中采用了FAST压缩算法更高效、
快速
低频数据
UTS dataexpress 实时传输+自行
开发的快速定制通讯组件
数据2分钟送达客户
CSMAR的特点
国际标准
全面完整
深度衍生
快速及时
质量精准
美国沃顿商学院,选用CSMAR数据作为
大中华区唯一的数据提供商,纳入其沃顿
研究服务体系(WRDS),为全世界的高校
学者提供研究数据服务。
摩根斯坦利,选用CSMAR数据作为基
础,编制MSCI-A股指数(第一个精确反
映中国股票市场行业结构的A股指数),
为全世界的投资者提供投资数据服务。
1,000多家国内外高校、金融机构客户的
共同选择,16,000篇研究论文的精确鉴
证,还有不计其数的投资交易人员的一致
青睐。
国内外一流专
家学者的支持
国内外顶级金
融机构的认可
三种数据提供方式
终端查
询系统
网络版
查询系
统
www.gtarsc.com
多用户使用
简捷和随时随地
的数据服务
其他平
台API
接口
程序语句访问
强大的外生兼容性
用CSMAR数据库发表的实证论文
截至2014年4月3日,中
国知网检索到引用
CSMAR数据的论文多达
16,490篇
股票市场系列
应用CSMAR发表及可支持的研究论文示例
序号
题名
众里寻“股” 千百度——股票收益率与百度搜
1
索量关系的实证探究
序号
数据库名称
1
2
3
4
5
6
7
8
中国股票市场交易数据库
中国股票交易高频数据库
中国证券市场大宗交易数据库
中国股票市场大笔交易数据库
中国证券市场指数研究数据库
中国股权分置改革研究数据库
中国股票停复牌研究数据库
中国证券市场特别处理与特别转让股票研究数
据库
融资融券研究数据库
9
2 货币政策与股票收益率的非线性影响机制研究
金融研究
3 相对杠杆与股票收益: 来自A 股市场的证据
管理科学
作者
赵龙凯, 陆子昱, 王
2013/04
致远
张小宇, 刘金全, 刘
2013/01
慧悦
2013/05
龚朴, 张兆芹
4 公司治理质量, 投资者信心与股票收益
会计研究
2012/02
雷光勇, 王文, 金
鑫
金融研究
2012/02
刘红忠, 何文忠
5
6
7
8
9
10
中国股票市场上的“隔夜效应” 和“午间效应”
研究
证券市场收益率分布时变性的经济学分析及其我
国的经验证据
什么导致了处置效应: 基于不同市场环境的模拟
研究与经验检验
投资者情绪与股票收益: 总体效应与横截面效应
的实证研究
现金分红对股票收益率波动和基本面信息相关性
的影
对我国股票收益率与通货膨胀率关系的解释:
1992—2007
来源
金融研究
统计研究
世界经济
年/期
李腊生, 翟淑萍, 关
敏芳
李学峰, 王兆宇, 苏
2011/12
晨
2011/11
南开管理评论
2010/03
金融研究
2010/10
金融研究
蒋玉梅, 王明照
宋逢明,姜琪,高峰
明
韩学红, 郑妍妍, 伍
2009/03
超
序号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
公司研究系列
数据库
CSMAR®中国上市公司财务报表数据库
中国上市公司年、中、季报公布日期数据库
中国上市公司财务报表附注数据库
中国上市公司财务指标分析数据库
中国上市公司财务报告审计意见数据库
中国上市公司分析师预测研究数据库
中国银行财务研究数据库
中国上市公司首次公开发行研究数据库(A 股)
中国上市公司首次公开发行研究数据库(B 股)
中国上市公司增发配股研究数据库
中国上市公司红利分配研究数据库
中国上市公司股东研究数据库
中国上市公司治理结构研究数据库
中国上市公司违规处理研究数据库
中国上市公司并购重组研究数据库
中国上市公司关联交易研究数据库
中国上市公司银行贷款研究数据库
中国上市公司国有股拍卖与转让研究数据库
中国民营上市公司数据库
中国海外上市公司研究数据库
中国上市公司资产评估数据库
中国上市公司业绩预告数据库
上市公司对外担保研究数据库
中国上市公司机构股票池研究数据库
内部控制数据库
社会责任数据库
内部人交易数据库
机构投资者研究数据库
应用CSMAR发表及可支持的研究论文示例
序号
1
冷漠是理性的吗? 中小股东参与、公司治理与投资者保护
经济学(季刊)
2013/01
2
CEO财务经历与资本结构决策
会计研究
我国非上市公司治理机制有效性的检验——来自我国制造
金融研究
业大中型企业的证据
基于资源配置的公司治理策略分析——以2006~2010年上
会计研究
市的公司为例
基于地区差异视角的外部治理环境与盈余管理关系研究—
南开管理评论
—兼论公司治理的替代保护作用
环境信息披露制度、公司治理和环境信息披露
会计研究
股权结构与企业R&D投入关系的实证研究——基于A股制造
中国软科学
业上市公司的数据分析
所有权性质、公司治理与控制权私人收益
管理评论
股权结构、公司治理对股权代理成本的影响——基于中国
金融研究
上市公司2001~2006年数据的研究
2013/05
作者
孔东民; 刘莎莎; 黎文靖; 邢
精平
姜付秀; 黄继承
2013/02
郑志刚; 殷慧峰; 胡波
2012/01
黄志忠
2012/04
李延喜; 陈克兢; 姚宏; 刘伶
2012/07
毕茜; 彭珏; 左永彦
2010/05
任海云
2010/07
吴冬梅; 庄新田
2009/02
李明辉
2009/04
汪平; 孙士霞
2009/12
许文彬; 刘猛
3
4
5
6
7
8
9
题名
10 自由现金流量、股权结构与我国上市公司过度投资问题研究
11
来源
年/期
当代财经
我国上市公司股权结构对现金股利政策的影响——基于股
中国工业经济
权分置改革前后的实证研究
基金研究系列
序号
1
2
3
数据库
中国商品期货市场研究数据库
股指期货研究数据库
中国权证市场研究数据库
应用CSMAR发表及可支持的研究论文示例
序号
2
题名
中国开放式基金真的存在“赎回异象”吗?——对开
放式基金业绩和资金流入关系的实证检验
中国开放式基金业绩持续性研究
3
中国开放式基金发行的影响因素分析
1
来源
年期
作者
投资研究
2013/09
莫泰山
经济问题
2012/02
经济学动态
2012/03
俞雪飞; 刘亚
冯旭南; 李心愉;
陈工孟
徐信忠; 张璐; 张
峥
行业配置的羊群现象——中国开放式基金的实证研
金融研究
2011/04
究
我国开放式基金业绩持续性、经理选股和择时能
5
经济管理
2011/02
力——基于2005~2009数据
6 开放式基金投资风格漂移量化指标应用研究
证券市场导报
2011/05
我 国 开放 式 证券投资基 金与 QFII“处 置效 应”比
7 较——基于“买卖周期时间”统计量视角的实证研
证券市场导报
2010/09
究
基金管理公司内部治理及其效应分析——以开放式
8
审计与经济研究
2010/01
基金为样本
9 基于SFA效率值的我国开放式基金绩效评价研究
数量经济技术经济研究 2009/04
10 “封转开”基金绩效比较研究
金融研究
2009/07
4
林兢; 陈树华
宋光辉; 许林
李学峰; 何林泽;
沈宁
肖继辉; 彭文平
朱波; 宋振平
林乐芬; 黄翀
衍生研究系列
应用CSMAR发表及可支持的研究论文示例
序号
序号
1
2
3
数据库
中国封闭式基金研究数据库
中国开放式基金研究数据库
中国证券市场基金评价研究数据库
题名
来源
数理统计与管
理
年期
作者
2013/02
沈虹
1
基于综合流动性度量指标的中国期货市场流动性溢价研究
2
中国期货市场处置效应研究
宏观经济研究
2013/10
3
2013/04
2012/05
刘庆富; 华仁海
5
我国商品期货市场价格行为的混沌特征研究
求索
重大风险事件对中国商品期货市场的冲击效应——基于学生 数量经济技术
分布的随机波动模型
经济研究
中国农民利用期货市场影响因素研究:理论、实证与政策
管理世界
许志; 干沁雨;
徐加根
胡振华; 陈雯
2010/05
6
上海期货市场收益和波动的周日历效应研究
2008/02
马龙龙
郭彦峰; 黄登仕
; 魏宇
蒋舒
史美景
程淑芳
华仁海; 刘庆富
蒋贤锋; 史永东
; 李慕春
张鹤; 黄琨
4
管理科学
中国期货市场的有效性:过度反应和国内外市场关联的视角
金融研究
股指期货对现货市场的信息传递效应分析
当代经济科学
我国期货市场有效性的实证检验
统计与决策
国内外期货市场之间的波动溢出效应研究
世界经济
期货市场保证金调整的市场风险控制作用及制度改革——来
11
金融研究
自大连商品交易所的实证分析
12 国内外金属期货市场价格联动的比较研究
世界经济
7
8
9
10
2007/02
2007/04
2006/05
2007/06
2007/02
2007/07
应用举例——真实数据解读《中国股市有效性的实证分析》,金融研究,
2003,清华大学经济管理学院
市场有效性,是大多数金融模型的基础假设。本文以1998-2002年的数据
进行实证分析,得出的结论是中国股市不满足有效性假设,投资者的行为并
不完全是理性。大家可以想象得到,当时中国股市还很不成熟,而且投资者
大多散户,投资的理论及知识也比较缺乏。随着中国股市的不断发展,比如
完成了股改、推出股指期货、投资的股票越来越丰富、信息的披露越来越规
范、投资者的文化水平也越来越高,是否我们的股市现在就满足有效性假设
了呢?这里我们用2009-2013年的数据,进行实地检验一下。
文献阅读
Fama, E. & French, K. 1993, ‘Common risk factors in the returns on stocks and bonds’, Journal of
Financial Economics, vol. 33, pp. 3–56.
J. M. Karpoff. The relation between price changes and trading volume: a survey, Journal of Financial and
Quantitative Analysis, 22(1987), 109-126.
John Y. Campbell, Sanford J. Grossman and Jiang Wang, Trading volume and serial correlation in stock
returns, Quarterly Journal of Economics, 108(1993), 905-939.
C. Hiemstra, J. D. Jones, Testing for linear and nonlinear Granger causality in the stock price-volume
relation, Journal of Finance, 49(1994), 1639-1664.
Tarun Chordia, Bhaskaran Swaminathan, Trading Volume and Cross-Autocorrelation in Stock Return,
Journal of Finance, 55(2000), 913-935.
Kalok Chan,Wai-Ming Fong. Trade size, order imbalance, and the volatility-volume relation, Journal of
Financial Economics, 57(2000), 247-273.
Tarun Chordia, A. Subrahmanyam, and V. Ravi Anshuman, Trading activity and expected stock returns,
Journal of Financial Economics, 59(2001), 3-32.
范从来, 徐科军:中国股票市场收益率与交易量相关性的实证分析,管理世界,7(2002), 31-36
范龙振 何华 俞世典 Fama-French 三因子模型在中国股票市场的实证检验
文献综述并提出假设
对中国股市上交易活动与股票收益率之间关系的已有研究主要是从市场角度考虑交
易量与收益率之间的关系,没有考虑交易金额与证券预期收益之间的关系。
也没有讨论中国股票市场上换手率及其二阶矩与证券预期收益之间的关系。
中国股市上存在着显著的市值效应、账面市值比效应、市盈率效应和价格效应。
那么,若同时考虑这些对股票收益率有显著影响的因子,在中国证券市场上交易活
动与股票预期收益率的关系又会怎样呢?
研究设计
以交易金额和换手率度量交易活动的水平,用Fama-Macbeth回归分析市
值、账面市值比、交易金额、换手率、价格、动量因子这些指标对股票
回报率的影响
SIZE(市值):第t-1个月上市公司的月个股总市值;
BM(账面市值比):上一年公司的股东权益合计与该年12月份股票市值之比;
VOL(交易金额):第t-1个月股票的月个股交易金额;
TURN(换手率):股票在第t-1个月的交易股数与其在该月的流通股数之比;
PRICE(价格):第t-1个月股票价格;
RET26(Momentum因子):第t-6个月到第t-2个月股票月收益率之和
RET(超额收益率):第t个月股票的月收益率减去同期的无风险收益率。
数据指标定位
从CSMAR交易数据库中提取研究模型中各指标计算所需的数据项:证券代码、
交易日期、交易月份、考虑红利再投资的月个股收益率、月个股总市值、月个
股收盘价、月个股交易金额、月个股交易股数、月个股流通市值。
从CSMAR财务数据库中提取了实证研究中所用到的各上市公司年报中的
财务数据项“股东权益合计”
数据提取、异常处理
时间区间:从1993年1月到2001年12月
样本范围:所有沪深A股交易股票
剔除样本:1,ST、PT股票,退市股票;
2, 交易首月股票;
统计工具:SAS
实证统计检验
因变量
交易金额
回归系数 T-检验值
换手率
p-值
回归系数 T-检验值
p-值
截距
0.07372
SIZE
-0.00774 -2.60816 0.0111
-0.01244 -4.24833 0.0001
BM
0.00841
0.00737
3.32457 0.0014
2.08668 0.0405
0.04499
1.97630 0.0520
1.80657 0.0751
PRICE
-0.00557 -0.68207 0.4974
-0.00484 -0.58443 0.5608
VOL
-0.00692 -2.68911 0.0089
/
TURN
/
-0.00693 -1.91227 0.0599
RET26
0.01948
2.03627 0.0455
0.01835
1.82679 0.0719
研究结论总结
除了股票价格的回归系数不显著外,上表的结果表明,相对于我们所
选取的样本数据,仍有很强的市值效应、账面市值比效应与Momentum效
应。
更为重要的是:
关于交易金额的回归系数不但为负,且在0.5%的水平上是显著的;
同样,关于换手率的回归系数亦为负,并在5%的水平上是显著的。
因此,在中国股市上,交易金额和换手率在上一个月取值的大小对股
票在当月收益率的变化有显著的负面影响。
论文及研究报告框架
论文内容:
1.引言
2.文献综述和研究假设;
3.研究设计;
4.实证结果;
5.结论;
6.参考文献
可选的研究热点:资本市场异象
有效资本市场假说
投资“异象”的出现
套利行为、套利成本和套利风险——错误定价一定会被纠正
行为金融学
参考文献:
Barberis, N., Thaler, R., 2003. A survey of behavioral finance. In: Harris, M., Stulz, R.
(Eds.), The Handbook of the Economics of Finance. George Constantinides, North-Holland
陆正飞、姜国华、张然,2008《会计信息与证券投资实证研究:重点文献导读》,人
民大学出版社
有效市场假说
所有与股票相关
的信息
公开可得信息
的信息集合
过去价格的信息集合
学术研究表明:
中国的证券
市场:弱效率市
场
美国的证券
市场:半强式效
率市场
投资“异象”的案例
比较著名的奇异现象有:
(1)“日历效应”,即一月份股票的收益率显著高于其
它月份;
(2)“星期一效应”,即星期一的收益率明显比一周中
其它日子为低;
(3)“盈利公告效应”,即股票价格在盈利公告之后受
其内容影响,在较长时期内持续走高或走低;
(4)“规模效应”,即小市值股票的收益显著高于大市
行为金融学
行为金融学研究什么时候、什么情况
下、为什么价格会偏离,或继续偏
离,证券的内在价值
心理上的偏见 (beliefs,违背Bayes
Law)
过于自信
过于乐观
过度反应
反应不足
羊群效应
自我归功
发布消息的四个原则
1. 如果你有几个好的消息要发布,应该把它们分
开发布;
2. 如果你有几个坏消息要公布,应该把它们一起
发布;
3. 如果你有一个大大的好消息和一个小小的坏消
息,应该把这两个消息一起告诉别人;
4. 如果你有一个大大的坏消息和一个小小的好消
息,应该分别公布这两个消息。
增值服务
除整体数据库、查询系统等标准化的产
品外,我们还为您提供“量体裁衣”式
的个性化研究服务,以满足您对个性化
研究数据的需求。
数据定制与数据挖掘服务提供基于
CSMAR®系列研究数据库的数据定制服
务,以及基于基础数据之上经过计算、
调整等加工而成的衍生数据定制服务。
数据补充与调整服务如果您在研究的过
程中已经收集了部分数据,我们可以根
据您的需要对数据进行补充与调整,做
成完整的适合您需要的数据库。
调研数据服务协助您采集、加工需要调
研方能得到的非公开数据。
培训
衍生计算
问卷调查
数据定制
数据采集
讲座
会议
量化投资
什么是量化投资?
量化投资是一种跨学科的金融投资方法,借用统计学、数学、物理、计算机
学、生物学、行为科学和认知科学的方法,来研究金融价格的变化,并归纳总
结这些变化的规律形成数量化模型,再根据这些模型,利用计算机技术完成数
据处理、分析建模、决策下单,执行整个流程的系统化、程序化的投资方式。
特点:纪律性,系统性,及时性,准确性,分散化
量化投资的历史及代表
1971年,美国巴克莱投资管理公司发行了世界上第一只指数基金,这标志
着量化投资的开始,接着,量化投资成为美国市场中最重要的投资方法之
一,到2009年,其比重已经上升到了30%以上。
量化投资旗帜性的人物,西蒙斯,从1989年到2006年之
间,其管理的量化投资基金年化收益率高达38.5%。主要
通过数学模型和策略来捕捉市场机会,由策略来做出自动
化的投资决策交易指令。
1999年至2013年全球对冲基金数量与规模
3000
14000
12000
2500
基
金
规 2000
模
(
单
位 1500
:
十
亿
)
10000
8000
6000
1000
4000
500
2000
0
0
1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
基金规模(单位:十亿)
基金数量
基
金
数
量
2004至2013年我国量化投资基金数量与规模
350
50
45
300
40
基
金
数
量
250
35
30
200
25
150
20
15
100
10
50
5
0
0
2004
2005
2006
2007
2008
2009
公募、券商基金规模(单位:十亿)
2010
2011
基金数量
2012
2013
亿基
)金
规
模
(
单
位
:
十
市场需求——金融量化投资工程师(Quants)
工作岗位:衍生品定价、投资交易、模型验证、模型研究、程序开发、风险管理、、、
人才缺口——200,000人才缺口(麦肯锡调查)
就业领域——
投资银行:风险管理、资产管理、固定收益、公司债券、衍生品投资、、、
基金公司:绩效评估、风险控制、资产配置、策略师团队、基金经理、、、
证券公司:集合理财产品设计、资产管理、量投模型研究、私筹理财、、、
量
化
投
资
的
流
程
•构想模型(来自论文,交易经验等)
步骤1 •确定模型方向和目标
•准备数据(交易品种,数据指标)
步骤2 •确定模型变量
•设计&构建模型(模型开发)
步骤3 •模型训练/回测
步骤4
步骤5
步骤6
步骤7
•模型参数优化(Optimization)
•模拟交易(Paper Trading)
•真钱演示交易(Demo Trading)
•规模交易(LiveTrading)
量化投资成功的关键
策略
数据
量化投资
核心要素
平台
量化投资策略分类
将市场上的可投资的量化
投资工具(债券、股票、
期货、ETF等)这分为资
产投资工具,及金融衍生
品投资工具的话,那么量
化策略的范畴可以分为方
向性策略、相对价值策
略、事件驱动策略、多策
略组合策略四大类
量化投资所需的数据
一、实时数据
1)所有可交易品种的实时交易价格、委托价量数据
二、历史数据
1)低频率的基本面数据,包括公司财务、宏观经济行业数据等
2)高频率的日内交易数据,包括分笔、分时交易数据
三、衍生数据
1)量化因子,寻找超额收益
2)风控模型因子,衡量风险、绩效归因分析;
3)量化新闻,大数据挖掘
国泰安实时行情数据方面
沪深L1
所有主流交易所实时行情
覆盖国内2大证券交易
所和4大期货交易所
新增全量大商所,沪深L2数
据,以及股指期货历史行情数
据,采用双线备份传送
以终端和API的方式提供
大商所
L2
上海L2
国泰安高
频数据库
商品期
货L1
深圳L2
股指期
货
国泰安历史高频数据方面
中国最完整的高频数据方案
沪深L1
股指期货
指数
港股
GTA
高频数据
商品期货
包含中国证券市场所有品种(股
票、基金、债券、权证、股指期
货、商品期货,港交所证券)在
内的各类分笔、分时高频数据,
及基于高频数据传输、更新、应
用软件
应用研究
时间区间:2003---至今
国泰安衍生数据方面
序号
分 类
说
明
1
宏观因子
包括CPI、M1、M2、进出口总额、GDP等和宏观经济相联系的指标。
2
行业因子
包括行业分类等指标,目前仅包含证监会2001标准和2012标准的行业分类。
3
基本面因子
包括公司每股收益、 每股净资产、实际市盈率、分析师预测市盈率等。
4
市场因子
5
技术因子
包含常见的技术指标因子以及股票的日换手率、流通市值等股票交易指标。
6
行为因子
包括羊群效应、风险偏好、市场反应程度、行业信息熵和行业超市场动量。
7
高频因子
基于高频数据得到的指标,如资金流、买卖不平衡、已实现波动率。
8
衍生物因子
上市公司可转债等相关指标
9
事件因子
10
复合因子
包含情绪因子和市场技术因子。情绪因子表征了投资者参与资本市场的情绪,技术因子可
以对市场进行择时。
包括定向、非定向增发实际发行总股数、定向、非定向增发实际募集总金额、解禁股数占
总股本比例、 董监高前三名薪酬总额等和公司事件变动相关的指标。
专家选股指标,包括巴菲特因子、奥'肖格内斯增长因子、风格选择动量因子和分析师预测
一致性回报反转因子等需要复合计算的指标。
量化投资策略研究与交易平台
回测
历史绩效
国泰安
&
历史数据
回测系统
参数调优
国泰安量化研究平台
• QTS行情源
• 基本面数据
• 高频数据
样本内检验、训练
数据API
策略逻辑
样本外检验
国泰安
虚拟交易
所仿真交
易
国泰安
虚拟柜台
模拟
交易
国泰安量化投资/金融工程实训实验室系列
200多所学校合作建设了各类金融、量化投资实验室
从校园到社会,
从实证研究到量化投资学生培养
国泰安一直是你忠实的朋友!
THANK YOU
[email protected]
深圳市国泰安信息技术有限公司