1. 首页
  2. 基金

大数据对于基金选股有帮助吗?可以有哪些结合的方向?

大数据指数编制依赖的数据源大都是由互联网巨头或垂直领域的主流社区提供,并结合了传统的基本面指标来选择标的。本质上,大数据的作用是丰富了传统量化模型的因子,而大数据指数的目标是获得相对于宽基指数的超额收益。有的大数据指数可以认为就是一个量化的Smart Beta策略。

从目前大数据指数的编制方法上看,可分为情绪类、行业景气类和专家跟随类。情绪类指数的策略是运用文本挖掘等大数据技术感知投资者集体的情绪,并通过集体情绪与市场历史走势的相关性确定选股策略;行业景气类指数的策略是通过对个人消费数据、公司交易数据的分析,先于财报了解到行业的基本面变化趋势;专家跟随类指数的策略则是对大量民间高手的观点进行综合,利用集体的智慧做出决策。

大数据的意义在于为量化指标打开了全新的大门,传统的各类量化指标,无论是基于价格还是基于财务数据都会存在一定的滞后性,无法用更具领先性的手段来了解行业和市场。而采用了大数据技术的行业及个股判断,则可以在一定程度上改善这一情形:利用搜索因子可掌握投资者情绪,利用电商数据可实时得知各行业的基本面动向,利用大V数据集合了集体的智慧。这几种大数据理论上都可以用来预测未来市场情况。

3.各支大数据指数的业绩和风险对比

下图的收益与风险对比是基于各指数发布后的数据进行的,由于大多数指数的发布时间比较集中,因此以上数据的对比结果有较好的参考价值。

可以看到雪球智选、雪球社交投资精选、淘金100这3个指数在年化收益率方面遥遥领先。累计收益率淘金100最高;但基于雪球数据的两个指数风险收益比更佳。不过,所有指数的年化波动率都远高于沪深300指数(沪深300近两年年化波动率12.8%,中证500年化波动率17.6%),风险程度偏高。

一切尽在图中。请看图。

4.不同数据(策略)类型对获取收益和风险的作用

从收益风险水平这两个维度进行对比,情绪类的收益最低、风险最高;专家跟随类的收益最高、风险最低;行业景气类居中。

情绪类大数据指数适用于市场情绪高涨时的市场,在行情低迷的时候,大众情绪往往是一个反向指标。这类指数因较大程度体现出了投资者情绪,属于高Beta基金,仅适合风险偏好较高的投资者在中短期配置。

行业景气类指数以中证淘金大数据100为代表,依靠电商数据对行业景气程度进行分析,偏向基本面研究,因此适合在回归基本面时的市场环境中配置,也可作为长期的权益类资产配置。

专家跟随类则以中证雪球100指数为代表,目前该类指数尚未落地为ETF。该类指数的特点是集合雪球论坛大V的股票组合组成股票池,再采用量化指标对股票池打分选股组成指数。理论上,该类指数结合了前两类指数的特点,因为大V在选股时兼顾了市场情绪与行业基本面。该选择方法对论坛大V的水平要求较高,一旦大V对市场判断有误,指数将表现较差。不过从目前实际运行的结果来看,由于指数反映了大量大V的综合选股结果,不会受少数大V误判的影响,收益较稳定,风险也较可控。投资者可根据该类指数的成分股建立股票池,通过投资大V公认的优质个股获取超额收益。

5.过度拟合的问题

我们对指数正式发布前的数据也进行了分析。前面提到,大数据本质上是丰富了量化选股模型的因子。因此,大数据指数的构建也无法避免传统量化模型构建过程中的一些问题和误区。我们把大数据指数发布前的表现看作是该量化模型的回测结果,发布后的表现看作样本外的实盘结果,并将回测结果与实盘结果进行了对比。

通过对比指数发布前后的Sharpe和超额年化收益率(相对沪深300)可以看到,所有模型的回测时Sharpe和超额年化收益率都远高于实际Sharpe和超额年化收益率,只是程度不同。不过,由于大部分模型的回测结果包含了上一轮牛市,市场风格也发生了大幅的变化,因此业绩在时间轴上的纵向比对只能从定性的角度说明存在过度拟合的情况。

总之,尽管基于大数据因子的模型的超额收益在统计上有显著性,但历史数据终究不能决定未来。模型的未来收益一方面取决于模型的质量(以及是否有过度拟合),另一方面取决于未来的市场风格。不过,我们认为基于大V数据的策略可能会适应各种市场风格,因此在未来的表现会更稳定。

在大数据指数和大数据基金的宣传中,往往给投资者展示优异的历史业绩回报,而当进入实际运作期后业绩却平平。因此,投资者在选择大数据指数ETF时,应该重点关注指数发布后的业绩,不可仅根据其历史测试业绩而进行投资。

6.大数据指数对于普通投资者的工具性价值

单就大数据指数而言(后续我们会分析主动管理型的大数据基金),对普通的个人投资者是一种很好的投资工具。

1)大数据ETF作为权益类资产配置工具

通过以上的业绩分析,我们已经能够清晰地看到,能够较稳定地跑赢市场的大数据指数是存在的。因此,这类指数所对应的ETF可以作为权益类资产的配置,长期持有或分批定投。它可以让你在资产配置时有更丰富的选择,避免无奈地接受沪深300这类主流β的单调而反复的蹂躏,也能避免主动管理类基金的各种不可预见的坑。

不过,对于普通指数而言,投资者通过其编制方法能够较为清晰的定位指数的投资方向,并且指数的样本股通常也公开透明。而大数据基金指数基于海量信息的挖掘,所投资的标的股以大数据分析结果为导向,通常没有简单明了的逻辑,投资者无法清楚定位指数的投资方向。此外,部分大数据指数并不对外公布其持仓样本股,也增加了投资人对指数的了解难度。介意者慎投。

2)指数成分股帮助股票筛选

大部分大数据指数都公布成分股。对于比较喜欢自己折腾的投资者,或者想要跟随雪球大V数据进行投资的投资者,可以利用指数成分股构建优选股票池,再加上自家土产的各种投资方法,形成自己的策略。因为大多数投资者的选股能力是低于指数的,因此在统计意义上,这种做法要比自产股票池的收益要好(只是需要投资者稍微让渡一些对自己账户的自主操纵感)。

7.后续

后续还将对多个主动型的大数据基金的业绩进行分析,看看这类基金的表现是否能够超过宽基指数和大数据指数。另外,我们还运用大数据指数的成分股构建了适合普通投资者的量化投资策略(优选个股、减少持仓数量、控制波动率),这个策略是否足够惊艳到战胜以上所有呢?有时间再更新。

广告:

原创文章,作者:花样财经,如若转载,请注明出处:https://www.massflowmeter.cn/101/101.html

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注