指数组合优化方式、模子取使用

admin 2019年06月06日 nibo6666 39次阅读 查看评论 购买链接

  除了进一步明白逃踪组合中个股i的比例αi和βi,并对买卖成本束缚付与节制仓位调整数量的内涵外,环节的是正在上述模子中插手一个基于市场冲击成本考虑的流动性赏罚束缚,即:

  为仓位调整所带来的买卖成本;V为初始资金规模,其值等于每次调整前一日收盘后的逃踪组合市值取因指数调整而被调出的个股悉数卖出而带来的买卖成本的差额。

  此中(ΔA/A)为市场成交金额的变化比例,e为市场冲击成本关于成交金额的平均弹性,因而(ΔA/A)×e为市场冲击成底细对其本身的平均变化比例。把市场冲击成本占成交金额变化额的比例记为1(或为肆意正小数,好比η,但由于d的取值取η相关,正在这个束缚的不等式两边能够同时约去η,因而这里能够记为1),则1×(ΔA/A)×e为市场冲击成本占成交金额变化额的平均比例,这个平均比例再按照个股分歧的流动性分析评价值进行线性分摊就获得个股分歧的市场冲击成本占其成交金额变化额的比例,这就是Δi的经济寄义。

  这是当今国外研究文献中常见的一种模子,所以称之为一般模子,是取改良后的流动性赏罚束缚模子相对应的一个概念。起首是方针函数。优化复制的思惟是通过权沉的优化再设置装备摆设来寻找一个含有部门成份证券的最优的逃踪组合,并使得该组合相对标的指数的一些查核尺度最优。这里的查核尺度一般有两个,一是逃踪误差,二是超额收益,因为本研究中设定的方针是逃踪指数,而不是打败指数,因而只考虑逃踪误差,不考虑超额收益。正在Roll(1992)、Buckly和Korn(1998)、Cornnor和Leland(1995)以及Larsen和Resnick(1998)等人的文献中把逃踪误差(简称TE)定义为Rpt和RIt之差的方差,Beasley、Meade和Chang(2001)分歧意这种定义,若是Rpt-RIt为一个,则其方差为零,则基于这种定义的逃踪误差为零,明显这种定义忽略了这种环境下的Rpt取RIt之间的误差,因而他们采用了误差平方和的均值平方根的定义。本研究中对逃踪误差的定义取Beasley等人分歧,即方针函数如下:

  2)资金规模,即持有的逃踪组合市值加上仓位调整成本等于初始资金规模:

  优化抽样复制和分层抽样复制所分歧的是前者让计较机从动抽样,后者则正在优化计较之前先辈行抽样,但非论如何两者正在以上优化模子上大致是分歧的。限于篇幅,两者的区别就不赘述。

  3、从买卖成本看,分层抽样最小,其次是优化抽样,最初是完全复制。同样10亿元规模的最后资金,整个逃踪下来,分层抽样的买卖总成本为4,461,460元,优化抽样为4,501,820元,而完全复制为4,943,540元,完全复制别离比分层抽样和优化抽样超出跨越482,080元和441,720元。可见完全复制的高精度是以较大的买卖成本为价格的。而分层抽样剔除了30只问题证券,损害了复制精度但却削减了逃踪成本。可见逃踪误差和逃踪成本之间也存正在着彼此抵消的关系。

  1、优化抽样和分层抽样无论正在样本内仍是正在样本外的逃踪结果都相当不错。样本内时间区间为半年且按照最小买卖手数取整的环境下,优化抽样和分层抽样的样本内日均逃踪误差正在6.6128e-5至1.9053e-4之间,样本内半年累积逃踪误差正在0.0069至0.0205之间,指数取逃踪组合收益率相关系数正在0.9888至0.9995之间;样本外5日、10日、30日、60日以及截至下次调全日的日均逃踪误差正在1.0828e-4至7.5426e-4之间,累积逃踪误差正在0.0022至0.0196之间,相关系数正在0.9874至0.9999之间。

  使用MATLAB言语编程而成的遗传算法东西箱比力多,比力常用的有Sheffield传授于1994年编写的1.2版本的遗传算法东西箱、还有C.R.Houck、J.A.Joines以及M.G. Kay等人于1998年编写的基于MATLAB5.x的遗传算法东西箱等。最新版本的MATLAB7.0(Release 14)曾经加载有遗传算法取间接搜刮东西箱模块。因为MATLAB7.0中的遗传算法取间接搜刮东西箱模块比力合用于处理无束缚优化问题,对非线性束缚的非线性规划问题的求解效率很低。本研究正在分析比力了各东西箱的好坏之后,选择了C.R.Houck、J.A.Joines以及M.G.Kay等人的遗传算法东西箱来处理本课题中的优化求解问题。

  本研究从2002年7月1日上证180指数初次发布之日起进行,别离考查了四个组合(初度建仓以及随后的三次调整)的逃踪结果,并把流动性赏罚束缚模子下的计较成果取一般模子下的计较成果进行比力,此外还使用遗传算法对流动性赏罚束缚模子进行求解,次要结论如下:

  Gunter Bamberg 和Niklas Wagner(2000)等人起首对线性回归法使用于最优逃踪组合的求解问题进行研究,成果发觉无论是利用复权调整后的股价仍是未复权调整的股价以及利用收益率仍是累积收益率成立的线性回归模子,都将违反古典线性回归最小二乘法的一些典范假设。然而Gunter Bamberg和Niklas Wagner认为这不影响回归方式正在求解最优指数组合问题中的使用,他们采用鲁棒回归法来避开最小二乘法的假设,并使用DAX指数进行了查验。成果表白,当样本区间的市场指数波动较大时,使用鲁棒回归法来计较最优逃踪组合结果较好。Francesco Corielli和Massimiliano Marcellino(2002)则基于动态要素模子考虑了指数成份股动态变化的特征,也通过最小化样本期内丧失函数的方式来处理逃踪组合的最优化问题。他们以EuroSTO50指数为样本做了研究,正在具体的算法上利用了蒙特卡洛模仿来求解最优的成份股权沉。Dirk Eddelbuttel和Marseilles则用到了夹杂遗传算法来处理寻找最优的逃踪组合问题。他们对DAX指数进行研究的结论表白,通过选择少量的成份股并通过逃踪误差的最小化来寻找最优权沉方面涉及到的复杂的算法问题完全能够由夹杂遗传算法加以处理。

  其αi中为逃踪组合中个股i的最小持有比例,实践中αi代表个股i的最小持有程度;βi为逃踪组合中个股i的最大持有比例,则有0≤αi≤βi≤1,βi了逃踪组合中个股i的风险敞口;

  此外,研究者还测验考试利用其它一些更复杂的方式来进行建模和求解,如J.E. Beasley、de和T.J.Chang(2001)以及M. Gilli和E.K llezi(2001)等人采用式算法(HA)、Paolo Dai Pra、Wolfgang J.Runggaldier、和Marco Tolotti(2002)则操纵随机节制和顺向优化法、David D. Yao、Shuzhong Zhang、和Xun Yu Zhou(2003)等人采用随机线性二次节制法(SLQ)并操纵半限量规划(SDP)等方式求解。虽然这些方式并不常用,但其使用无疑使得指数复制问题的研究更为深切。可见跟着最优化理论的成长和计较机手艺的改革,更多、更复杂的新理论取新方式能够被使用到指数基金以及更广意义上的指数类金融产物的设想和办理上来,这也恰是当前国际上相关指数复制问题研究的一个热点和趋向。

  Δ时间间隔的弹性Rc,Δ是指自t起正在Δ时间间隔内,股票价钱偏离Pt的幅度为c并初次前往Pt的时间。

  本部门从内地证券市场的具体现实出发,并以上证180指数为标的进行研究,对若何设定指数逃踪方针、若何限制束缚前提、若何进行数学计较以及对三种复制方式的现实复制结果上的分歧以及若何改良个股和组合的流动性程度等给出结论。

  即Δ时间间隔的市场宽度定义,此中H、L别离为达到换手率α的最高价取最低价,t和Δ别离指正在Δ时间间隔内初次达到α换手率的时间;

  之后则操纵距离评价法对这三个目标进行分析评价,得出个股的流动性分析目标,再正在抽样复制中,以个股流动性分析目标和调整畅通市值目标进行分析排序并分析考虑行业的分离性和代表性等要素加以抽样,从而力求提高指数组合的全体流动性。

  指数组合优化问题从狭义上讲就是标的指数的优化复制(正在本研究中指数组合优化取指数优化复制是一个概念)。指数复制的方式大体能够分为两类:即完全复制和不完全复制(即优化复制)。顾名思义,完全复制是采办标的指数中的所有成份证券,而且按照每种成份证券正在标的指数中的权沉确定采办的比例,以建立逃踪组合从而达到复制指数的目标。而优化复制则是通过权沉的优化再设置装备摆设来寻找一个含有部门成份证券的最优的逃踪组合,所谓的最优就是使得该组合相对标的指数的逃踪误差最小或其它事先设定的尺度最优。优化复制的方式又能够进一步细分为分层抽样复制(以下简称分层抽样)和优化抽样复制(以下简称优化抽样)两种。前者是两阶段优化法,即第一阶段是抽样,按照必然的尺度选出样本证券;第二阶段则是权沉的优化再设置装备摆设,通过对最优化算法的使用,求出逃踪组合内各样本证券的最优权沉,使得组合的表示取标的指数分歧,即逃踪误差最小,同时较小的调整频次和逃踪成本。取之分歧,优化抽样复制则没有进行的抽样,而是让计较机来回覆哪些成份证券该采办,若是优化求解出来的某种成份证券的权沉值为零,就剔除该成份证券;不为零,就买入该证券并按计较出来的权沉值设置装备摆设资产,因而优化抽样复制属于单阶段优化法。可见指数组合优化具体指的就是指数的优化抽样复制和分层抽样复制。

  为了比力,本文对完全复制问题也一并加以研究。而撇开实务中的动态调整不谈,完全复制中逃踪组合的建立方式就是组合调整时,买入标的指数的所有成份证券,并按照每种成份证券该时辰正在标的指数中的权沉值来确定每种成份证券的采办比例。因为考虑到资金规模的束缚,因而必需求解如下非线性方程组:

  注:上海证券买卖所副总司理刘啸东博士对本文亦有贡献,特此称谢!

  逃踪组合的初度建仓即创设问题中,因为qi=0,因而通过定义权沉变量

  然而从以上文献的简要回首中能够看出,研究者更多地把次要精神放正在了逃踪误差、优化模子以及求解算法上,忽略了对分歧复制方式和其分歧复制结果的对比研究,更环节的是很少考虑个股以及组合全体的流动性问题,然而这些都很是主要而又现实,实务操做中无论是指数产物设想、指数套利仍是实施指数化投资策略都必需起首决定采纳哪种复制方式,并且都要考虑个股和组合的流动性问题。因而本研究力求正在这些方面有所改良,具体是本研究将同时考虑三种复制方式:优化抽样、分层抽样和完全复制,而且除了使用序贯二次规划法外,还将用到遗传算法进行优化求解,同时对成果加以比力。此外还将基于市场微不雅布局理论的一些研究并操纵高频成交数据对个股的流动性问题进行分析评价,并正在抽样复制中,以个股流动性目标抽样,力求提高指数组合的全体流动性。进而正在此根本上,对原模子进行改良,插手基于市场冲击成本考虑的流动性赏罚束缚,旨正在没有恶化逃踪误差的环境下,让模子优化计较的成果能把更多的资金设置装备摆设正在更有流动性的资产上。

  跟着证券价钱指数的成长取演变,指数衍生品立异日益成为了当今全球金融市场上的一大亮点。指数基金、指数期货、指数期权、指数权证以及融合了浩繁基金产物劣势的、被誉为第三代投资基金的买卖所买卖基金(ETFs)等正在比来的几年中都获得了长脚的成长。因而指数组合优化问题就变得日益主要,由于对指数基金、ETFs来讲,其产物本身

  2)市场深度:即正在不影响当前价钱下的成交量。从市场深度来看,流动性好意味着正在当前价钱下投资者能够大量买入或抛出股票。市场深度的不雅测值是某一时辰做市商正在委托簿报出的委托数量,本研究中对此界定如下:Δ时间间隔的深度Dc,Δ,是指自t时始到股票价钱初次超越区间[Pt-c,Pt+c]时的换手率,c为价钱波动幅度;

  然而这两种方式具体若何使用,其正在复制结果上又有何分歧,包罗取完全复制比有何分歧,这是本研究所要切磋的问题。此外还要考虑个股以及组合全体的流动性问题,由于这是实务办理中一个很是主要问题,间接决定了指数复制的成败。因而本研究力求从国内证券市场的具体现实出发,并以上证180指数为标的对所有这些问题进行研究。

  本研究中的数据来历于上海证券买卖所供给的日成交数据和1分钟成交数据。因为上证180指数对成份股的现金分红不做调整,即让价钱天然回落,对指数不做批改,因而本研究中正在做复权处置时也对个股的现金分红不做调整,即计较未考虑现金分红的复权日买卖数据。正在此根本上,再计较指数和个股的日收益率数据。1分钟成交数据则用于抽样复制入彀算个股的流动性目标。正在具体计较上,本研究所有涉及到的优化计较是基于Matlab6.5优化东西箱的编程手艺进行的,完全复制中则基于Matlab6.5编程来求解非线性方程组,抽样复制中的抽样工做则是正在SAS8.2下进行的。优化计较顶用到的算法的根基思惟是用于处理非线性束缚下的非线性优化问题的序贯二次规划法(SQP),能够选择的参数包罗尺度算法取大规模算法、Levenberg-Marquardt搜刮法取Gauss-Newton搜刮法等;SQP的思惟以及相关参数的寄义拜见Matlab6.5的帮帮文件和相关优化计较的文献材料。限于篇幅,数据处置过程以及优化计较编程正在此也不赘述。

  1)市场宽度:即买卖价钱偏离市场无效价钱的程度,它是投资者领取的流动性升水。市场宽度的不雅测值是做市商的买卖差额,只要当这个差额为零时,才可认为这个市场完全达到流动性。因为我国内地的证券市场是指令驱动市场,没有做市商的买卖报价,因而对市宽度的权衡需要基于内地证券市场的现实环境进行变通,本研究中对此界定如下:

  8、虽然插手流动性赏罚束缚之后,组合的逃踪误差有了必然的变化,但组合的总体流动性较着提高了。测算成果显示,相对于一般模子的成果,流动性赏罚束缚模子环境下资金更多地设置装备摆设于更有流动性的资产上。可见,流动性赏罚束缚模子达到了预期的结果,即正在没有严沉恶化组合逃踪误差的环境下,使得模子优化计较的成果能把更多的资金设置装备摆设正在比力有流动性的资产上。

  3)买卖成本,即仓位调整所带来的买卖成本不克不及跨越初始资金规模的必然比例。因指数调整而被调出的个股需悉数抛出,因而而带来的买卖成本是个给定值,无法优化。可以或许加以考虑的是因指数调整而被调入的个股以及保留正在指数内的个股的仓位变更所带来的买卖成本,其不克不及跨越初始资金规模的必然比例,其中为c。

  此外模子中的一些参数设定如下,即最后的资金规模为10亿元,买卖成本(包罗佣金、印花税等的分析)为买卖市值的0.003(即模子中的γ值),优化复制中c的取值为0.0005,抽样复制中c的取值为0.0004,即仓位调整所带来的买卖成本别离不跨越初始资金规模的0.0005和0.0004,流动性赏罚因子Δi以及d的取值见上述模子的申明,权沉βi为0.1,下界αi正在优化抽样复制中为零,正在分层抽样复制中则限制其取值以每股起码的持无数量,限于篇幅αi值的设定及模子推导就不赘述。

  1)组合内个股集中度,即组合内单只股票的持无数量不得跨越必然的比例,也不克不及小于必然的比例:

  此中qi为组合调整之前的个股持有量,创设问题中qi为零,γ为买卖中涉及到的佣金、印花税等费率的分析比例,而

  Δi就是个股的流动性赏罚因子,Δipi|qi-qi|是个股i仓位调整所惹起的赏罚值,总的赏罚值不克不及跨越初始资金规模的必然比例,其中为d。Δi的取值则由下式给定:

  7、从仓位变更对市场的冲击成本看,虽然没有间接怀抱,但从个股仓位调整占该股畅通股比例的描述性统计中能够大致领会一点。创设时,这个比例正在千分之二摆布,调整时则正在万分之四摆布,并且因为答应分阶段建仓,分层抽样中还考虑了个股的流动性,因而冲击成本该当比力小。

  6、从逃踪组合中个股的集中度看,分层抽样较高,优化抽样其次,而完全复制最分离。不外无论哪种方式,个股占组合总市值的比例都正在能够接管的范畴之内。分层抽样中因为考虑了行业的分离性和代表性,因而虽然个股集中度略高一点,也不影响组合的分离化。

  现实上就是一个指数组合(只是其买卖模式和产物架构有所分歧),而对指数期货、指数期权等其它指数类金融产物来讲,通过建立指数组合来进行以对冲买卖为次要目标的指数套利操做是规避金融风险的必不成少的操做手法。

  即正在分层抽样复制中设想一套抽样方式来选出比力有流动性的股票,从而达到提高个股取组合全体流动性的目标。因而起首得权衡出个股的流动性,然后按照指数复制的其它要求设想抽样方式从而既要个股的流动性,又能很好地复制指数。本研究中将基于市场微不雅布局理论的一些研究并操纵高频成交数据对个股的流动性问题进行分析评价,评价目标包罗个股的市场宽度、市场深度以及市场弹性等三个方面,具体计较公式如下:

  本部门起首正在总结国外研究文献的根本上提出了合适我国国内证券市场现实的指数组合优化模子,进而出于对个股和组合流动性改良的目标,提出了基于市场冲击成本考虑的流动性赏罚束缚模子做为新的指数组合优化模子,使得正在没有恶化逃踪误差的环境下,让模子优化计较的成果能把更多的资金设置装备摆设正在更有流动性的资产上。

  本研究中以上证180指数为标的指数,按照180只成份股每次调整前半年的汗青成交数据并同时考虑资金规模、买卖成本、组合分离化和流动性赏罚束缚等前提后来建立逃踪组合,而且一曲持有逃踪组合曲到上证180指数发生调整时,逃踪组合也响应进行调整。优化抽样中间接把180只股票的数据代入模子进行优化计较,而分层抽样中则最终是抽样150只股票,再进行优化计较。然后进行资产设置装备摆设和组合模仿,看看逃踪组合正在之后的5个买卖日、10个买卖日、30个买卖日、60个买卖日和截至下次指数调全日期间相对于上证180指数的表示。

  遗传算法最早由John Holland于1975年提出来,其模仿的遗传选择和天然裁减的生物进化过程,以一种群体中的所有个别为对象,并操纵随机化手艺指点对一个被编码的参数空间进行高效的搜刮,因此遗传算法是一种基于生物天然选择取遗传机理的随机搜刮算法。取保守搜刮算法分歧,遗传算法从一组随机发生的称为种群的初始解起头搜刮过程。种群中的每一个个别是问题的一个解,称为染色体。染色体是一串符号,好比一个二进制字符串。这些染色体正在后续迭代中不竭进化,称为遗传。正在每一代顶用顺应度函数来丈量染色体的黑白,生成的下一代染色体称为儿女。儿女是由前一代染色体通过交叉或变异运算构成的。正在新的一代构成过程中,按照顺应度的大小选择部门儿女,裁减部门儿女,从而连结种群大小是个。顺应度高的染色体被选中的概率较高。如许颠末若干代进化之后,算法于最好的染色体上,这个最好的染色体就是待求问题的最优解或次优解。

  此中:T是基于汗青期间即样本内时间区间0,1,2,…,T来调查股票取指数的价值变化,T+1代表一个决策时点,正在该时点把当前组合调整为一个新的逃踪组合;Pit代表t时辰(t=0,…,T)个股i(i=1,2,…,N)的价钱,In(Pit/Pi,t-1)即个股对数收益率Rit;Pi代表逃踪组合调整(或建立)时辰的个股当日收盘价;It代表t时辰指数的点位,In(It/It-1)即指数对数收益率Rit;qi为决策变量(即待求变量),代表T+1时点个股i的持无数量。

  9、虽然遗传算法(GA)正在序贯二次规划法(SQP)计较成果的根本上都有所改良,但改良的幅度很是小。并且并没有比纯真使用SQP求解的成果好。可见SQP算法曾经比力好地找到了模子的最优解,GA算法可以或许改良的余地很小。

  4)因为创设时(初度建仓),买卖成本是规模的必然比例的一个,所以对买卖成本无需加以束缚,原束缚3打消;

  本研究中除了用到序贯二次规划法(SQP)外,还将用到遗传算法(GA)进行优化求解,一是GA算法凡是环境下比SQP算法较有可能找到全局最优解;二是通过分歧算法的使用,比力其正在优化求解,特别是本课题的优化求解中的具体使用和优化结果上有何分歧,切磋使用GA来改良指数组合优化结果的可行性。

  Roll(1992)正在Markowitz成立的均值-方差模子的根本上较早研究了指数复制中的组合逃踪误差最小化问题,其通过最小化组合收益率取标的指数收益率之差的平方和,即逃踪误差波动率的最小化来改良组合对标的指数的复制结果。Y.Tabata和E. Takeda(1995)也正在Markowitz的无效鸿沟和均值-方差模子的根本上研究了指数基金的优化问题。其对逃踪误差的定义取Roll的分歧,分歧的是Y.Tabata和E.Takeda正在Markowitz的无效鸿沟的根本上成长出了一套优化算法,并操纵该算法进行了研究。取Roll、Y.Tabata和E.Takeda等人的研究分歧,Markus Rudolf、Hans-Jurgen、Wolter和Heinz Zimmermann(1999)把逃踪误差定义为组合收益率取标的指数收益率之间的差值,并因而提出了4个线性的逃踪误差最小化模子,别离是均值绝对离差MAD)模子、均值绝对向下误差(MADD)模子、最小最大化(MinMax)模子、向下最小最大化(DMinMax)模子,并把以上4个线性模子使用于美国、日本、英国、、法国、六国的股票市场指数和摩根斯坦利本钱国际指数(MSCI)的指数逃踪尝试,成果表白线性规划模子优于二次规划模子,把逃踪误差定义为线性关系的组合收益率取标的指数收益率之间的差值也比保守的二次平方和的定义更接近现实。

  2、从复制精度看,完全复制最高,其次是优化抽样,最初是分层抽样。完全复制的逃踪误差最小,优化抽样其次,分层抽样最大,并且样本外时间越长,完全复制正在押踪误差上的劣势越较着。而分层抽样因为剔除了30只问题证券从而提高了逃踪组合的质量,但却以损害复制精度为价格,其相对于优化抽样和完全复制来讲,逃踪误差加大。可见样本股数目取逃踪误差之间存正在着一种此涨彼伏、彼此抵消的关系。

  5、资产设置装备摆设时因为最小买卖手数的而进行取整,从现金差额看,其影响几乎能够忽略不计。平均现金差额正在两三千元摆布,占总资金规模的百万分之三摆布。而取整给样本内逃踪误差带来的影响虽然因时间段的分歧而有所差别,但大都环境下取整加大了样本内的逃踪误差,加大的幅度正在创设问题中是10%摆布,正在调整问题中是3%摆布。

  3)市场弹性:即由买卖惹起的价钱波动消逝的速度,弹性通过时间来暗示,它暗示价钱偏离均价后初次前往所需要的时间,本研究中对此界定如下:

  4、其它前提不变的环境下,样本内的时间窗越长,逃踪结果越好。第三次调整中因为上证180指数纳入2003年11月18日才上市的长江电力()(600900)为成分股,因而样本内的时间同一从2003年11月18日起算至2004年1月2日,只要32个买卖日,时间短,样本内的逃踪误差就大,并进而影响到样本外的逃踪结果。可见,其它前提不变的环境下,样本内的时间窗越长,逃踪结果越好,并且样本内逃踪结果越好,样本外的表示也越好。

  相关链接:

« 上一篇 下一篇 » admin原创文章,转载请注明出处! 标签:遗传算法工具箱

说两句吧:

必填

选填

选填

«   2019年9月   »
1
2345678
9101112131415
16171819202122
23242526272829
30
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
    友情链接