背景介绍:



        果仁网推出股指对冲功能,应果仁邀请,本人准备写一些关于如何构建对冲阿尔法策略组合的系列帖子。

        本人在一家小型对冲私募工作,研究对冲阿尔法策略,此系列由于本人才疏学浅,粗陋之处,尚请见谅。



        各位朋友如果有问题需要咨询,可以联系QQ2270788668或微信FooltrdeNow。

        如果有资金愿意合作,请直接联系果仁客服QQ3432772199。



下面是阿尔法多因子模型系列之一:专业水平测试题的因子部分的参考答案(网上大神的答案汇总),大家共同学习。

1A股市场驱动因子能分为哪几大类?

l  从大的角度讲,可以说风格因子行业因子

l  我们将那些被认为是可以影响到股票价格变化的因子称为市场驱动因子。这些因子可以是宏观的,如利率、货币投放量、GDP等;也可以是微观的,如公司的季报、年报中反应出的财务状况、盈利能力等;一般来说,市场驱动因子包括有:估值(包括各种财务模型下的不同估值)、成长性、股票规模、宏观经济政策、市场情绪等。值得注意的是,在模型的回归检验中,以上因子不一定都是显著的,我们应当综合考量该因子在逻辑上是否有意义以及显著性水平来判断是否采用/剔除一些因子。

l  我个人倾向于以下简单的分类方式:量价因子、基本面因子和外部响应因子。量价因子包含一些简单的指标,例如成交量、换手率和日内最高/最低价等;有一些量价因子则较为复杂,例如一些技术分析因子和数据挖掘得到的统计因子;基本面因子通常是一些反映企业经营状况(市盈率、负债率等)和经营特征(行业因子)的变量。其包括来自于企业自身公布的报表,也可以是其它专业机构发布的一致预期预测(Consensus Forecast)。外部响应因子则取决于交易选择的证券池。例如如果一个机构是只做股票类证券的交易,那么和债券市场相关的指标对他们而言就是外部响应因子;如果一个机构是做全球资产配置,涉及多个市场和不同类型的证券,那么像某些国家和地区的通胀率、GDP等,对这个机构来说才是外部响应因子。


        我的答案:根据资金规模、预测方法与适用群体划分为三类,

        技术面因子(也就是量价因子,换手率高,资金容量小,使用技术分析预测,适用于散户单个策略);

        基本面因子(也就是财务因子,换手率中,资金容量中,使用基本分析预测,适合私募机构做组合策略);

        宏观面因子(也就是经济因子,换手率低,资金容量大,使用宏观分析预测,适合大型机构做资产配置,典型是桥水全天候)


2. 常见的因子类别?

l  有行业、技术、基本面、财务信息、市场情绪等类别。

l  风格因子又可以分为基本面因子技术类因子,诸如估值、质量等属于基本面因子,这些因子的计算原料均取自财务报表,而技术因子则一般仅用价格和成交量这两个基础数据来计算。当然还有一些其他用的比较多的因子,比如分析师预期、大数据以及高频因子等。

l  量价因子通常对行情变化非常敏感,能够有效捕捉市场的趋势,但简单因子因为广为人知,其影响早已体现在证券价格中(有效市场理论);一部分技术分析因子由于流传甚广,可能存在一定的自我实现效应,但同样地,其影响可能已体现在证券价格中;而另一部分技术分析的描述接近于玄学,存在一定的模糊性;通过数据挖掘获得的,意义不明的统计因子容易出现多重比较谬误(multiple comparison fallacy)的问题。基本面因子通常被做长期资产配置或者信奉价值投资理念的投资者采用。而在应用中过程中,存在以下困难:1 )基本面因子数据获得时间点不统一(取决于企业发布报表的时间和机构发布预测的时间);2 )相比量价因子,其数据噪声大、缺失值多,数据质量取决于审计机构的专业性和企业的诚信程度;3 )因子取值的分布通常远远偏离正态分布,对于离群值的判断不能用标准差这个常用的统计量; 4 )一致预期的数据采集难度较大。外部响应因子在某些情况下有很强的解释力,但在建模过程中,由于不同因子的量纲千差万别,通常要先估计其响应系数,因此会引起变量误差(error-in-variables)的问题,另外,部分外部响应因子来源于政府发布的数据,其可能存在采样质量差,而且数据被人工删改等问题。


        我的答案:见上一题


3. 除了最常用的回归法,还有没有其他方法可以进行单因子测试?各自优劣是什么?注:下面问题均针对回归法。

l  其他常用的方法比如有直接计算因子rankIC,通过IC来检验因子的预测效果和对股票的区分度;另外还有用分组法来测试因子效果,选取不同分位因子构建投资组合,然后对比各分组收益表现。

l  我不确定这里是否是要求通过哑变量的数据处理方法对一些因子进行检验,一般而言,对于一些难以量化的因子,我们可以通过设置01矩阵来检验其因子在不同水平下的显著性。

l  在不使用回归的前提下,如果我们希望测试单因子对于预期收益率的预测能力:1 直接计算其信息系数(Information CoefficientIC),并应用精炼预测公式(refined forecast)进一步预测其效果;2 构建因子对应的投资组合,其构建方法可以简单也可以复杂,例如选择不同的证券池和不同的中性化处理方法,计算其累计收益率;3 如果希望捕捉非线性关系,也可以考虑使用距离相关系数(distance correlation)或者最大信息系数(Maximum Information Coefficient)等统计量。但任何非线性关系的分析和应用都存在过拟合的风险。在不使用回归的前提下,如果我们希望测试该因子是否适合于风险预测模型:可以计算该因子的自相关系数、和模型其它因子的共线性程度、和基准组合的相关程度等。

        我的答案:分组法(果仁的排名分析)、信息系数(过去收益序列预测未来收益的能力,也就是收益序列的自相关性)

4. 单因子测试是否需要纠正版块、市值偏离等问题?如何纠正?

l  是否行业中性和市值中性取决于个人,行业中性和市值中性可以帮我们更好地理解收益的来源,也许某个财务因子表现好,但很可能是其与市值因子相关性极高。行业的纠正可以使组合中各行业的占比和基准保持一致,市值的纠正可以在优化限制条件中加入市值暴露为零的限制条件,或者简单的按市值加权构建组合。

l  应根据回归模型对比的标的来选择是否要纠正。举例来说,如果我要检验行业内某一只股票对应行业内其他股票在某个因子上是否存在超额收益,则不需要纠正板块偏差;如果要检验的是某股票对应上证综指是否在某个因子上存在超额收益,则应当纠正板块差异。具体的纠正方法根据指标的不同应有所不同,按照收益率举例,可以采用单个股票价格求对数,再平减板块价格对数来进行纠正。

l  对于收益预测而言,是否需要纠正取决于你对该因子的判断。如果你认为该因子对于行业的预期收益率没有预测能力,就应该实现行业中性,反之不应该实现行业中性;市值偏离是否需要纠正亦是同理。对于基于净值的业绩归因而言,中性化处理是必须的。市场和市值和影响力很大,不进行中性化处理的话,因子之间的共线性会导致系数估计的方差变大。


         我的答案(仅针对阿尔法对冲策略组合而言):行业中性取决于策略组合的顺序,如果先做行业策略(把基准指数分成几大行业,划分股票池,分别做出对应行业策略),然后通过行业配比与基准指数相同,则单因子测试无需行业中性(因为组合阶段会完成行业中性),如果先做因子策略(股票池不划分行业),则在单因子测试阶段需要行业中性,市值中性不在单因子测试阶段,在组合策略阶段完成(当然单因子测试阶段要有完备性,即大市值策略与小市值策略都要有)


5. 行业归属因子是否应选择动态变化的数据?

l  是,因为同一家公司在不同时期可能主营业务发生变化,导致的行业分类会发生变化,若用静态的数据一方面不合理,另一方面是隐含的用到了未来数据。

l  是。因为不同的因子对于不同的行业可能是显著/非显著的、可能是正相关/负相关的。由于A股市场存在借壳、主营业务改变、收入构成改变等等情况的发生,导致行业归属发生改变,如按照静态行业归属对股票进行量化是存在极大风险的。

l  应该。答案如几位老师所言,不使用动态数据会出现使用未来数据的问题。

 

        我的答案:同以上几位


6. 混业经营的上市公司,其行业因子有哪些处理方式?利弊?

l  一个常见的处理方法是继续用虚拟变量来代表行业因子,只是对于混业经营的公司而言不是简单地01,而是根据某个财务指标(比如营业收入占比)来决定各行业的分配比例。

l  可以按照其财报中的营收等财务指标进行权重分配,在行业归属因子中采用多个哑变量来体现。对于混业经营中,其经营业务相关度较高的,可以不做区分,用其中最主要的来替代。

l  对于混业经营的上市公司,其行业因子不能简单使用取值为 0 1 的哑变量(dummy variable)来表示。此时对行业因子暴露度的处理有两个思路:1 继续使用哑变量代表行业因子,而虚拟变量的权重可以直接使用等权重,或通过一些财务数据分析来确定;2 不再使用哑变量,而使用连续变量表示行业因子。其暴露度可以通过该上市公司的收益率对行业收益率做多元回归决定。第 1 种方法受数据噪音干扰减少,但可能存在欠拟合(underfitting);第 2 种方法受数据噪音干扰较大,可能存在过拟合的问题。而且选择什么变量进行回归存在主观性。

 

          我的答案:同以上几位(真心说,我不如第三位)


7. 行业因子采用GICS、证监会、申万、中信等第三方数据更好?还是利用相关性、聚类分析等算法来动态确定更好?各自利弊?

l  个人建议用市场通用的第三方数据更好,比如申万;相关性和聚类分析等算法有可能存在伪回归的风险,缺乏踏实可靠财务经营逻辑,而且第三方数据都会根据公司的经营状况进行动态更新,在市场上也会形成一致预期。

l  个人强调被引入变量的逻辑性,也就是说,不应当仅仅根据变量是否显著来决定选取与否,这样的话,模型仅仅是空中楼阁。因此,在对股票进行行业分类时,应主要采用第三方数据较好。在真正进入实盘阶段,还应要结合行业分析员、财报分析来判断,是否使用了错误的回归模型,来避免投资错误。采用大数据的方法来对股票进行行业分类是数据探索的一种方式,他可能会发现一些存在潜在相关性的股票集合,但在发现这种可能性后,还应当根据实际情况来判断是否是伪回归来决定是否采信,而不是盲目的拿来结果就用。

l  就其使用而言,行业因子一般都是模型中风险控制的维度。它的选择应当符合市场上大部分投资者的认知。我个人的观点是,用复杂统计分析或机器学习来构建行业因子一来没有必要,二来由于引入额外的数据和分析步骤,模型的误差也会随之增加。


          我的答案:同以上几位(行业因子拿来用就行,别自作聪明另搞)


8. 规模因子(Size,也叫市值因子)为什么在中国具有如此重大的影响?选择长期暴露小盘股有哪些利弊?

l  一是小盘股的壳资源效应;二是小盘股可操作性强,在A股市场散户居多而且内幕交易盛行;三是小盘股成长性更高,如三因子中提到,长期来看,小盘股确实较大盘股有超额收益。流动性危机比如1412月份,而且注册制实施后,Size因子肯定不会一直表现这么抢眼。

l  A股市场中,小盘股存在筹码集中价格容易操纵,便于坐庄的特点。往坏的方面讲,由于中国市场对基金经理的净值要求比较高,基金经理往往可以通过合作来操纵重仓的小盘股的价格来达到完成业绩指标的目的,这也往往是一些妖股产生的原因,这里就部展开讨论了。我认为暴露小盘股的最大弊端是流动性问题。往往回测很美,但没有交易量。另外就是价格波动大,回测模型的估计参数不稳健。

l  就一般而言,中国A股市场的四个特点导致小盘股更受青睐,市值因子影响巨大:1 证券市场不规范,内幕交易盛行。部分机构投资者(所谓庄家)和公司股东存在不当的合作关系,利用小盘股股价易于操纵的特点获利;2 相比成熟的证券市场,中国股票市场个人投资者比例偏高,个人投资者而且对股票市场的认识不成熟,希望通过投资股价变化更快的小盘股短时间内获利;3 大盘股对应的通常为大型国有企业,其分红意愿不强,投资者难以通过价值投资的方式获得收益;4 此外,《主动投资组合管理》的一个理论分析和模拟给出了一个很有意思的角度:如果做空个股受限,只能通过基准组合实现对冲的话,阿尔法对冲策略的优化结果通常是在小盘股上持有正头寸,而在大盘股上持有负头寸。这个结论也适用于A股市场。


          我的答案:楼上三位把话说完了,我无话可说

 

9. 市值因子应该怎么取?取市值本身、市值对数、市值平方根有什么区别,哪种更好?你认为流通市值和市值哪个信号更强?

l  市值取对数会拉近个股间的差距,很多股票就近乎与等权重;至于哪一个好,得看实际的回测效果,从个人经验和直觉来看流通市值的代表性更强。

l  我不太明确这里的市值因子是指价格、还是流通量、还是价格和流通量的乘积;我认为,该因子用两者的乘积是比较好的变量。在接受以上前提的情况下,一般可以采用其本身、对数。去本身的情况下,模型的因变量应当是价格类的;取对数的情况下,应当是涨跌幅度类的;对于二级市场,能流通的市值影响更大,对于一些一级半市场的投资者而言,可以考虑总市值。

l  取市值平方根计算或市值对数,会减少个股之间市值暴露度的差距。具体哪一种因子计算方式更好,流通市值还是市值哪一个更好,可以通过因子测试验证。就直觉而言,流通市值是一个更能精确地反映股票市值变化的变量,效果可能更好。

 

          我的答案:市值因子溢价归根结底就是盘子小流动小形成的风险溢价,按体现这个的思路来处理就行,具体方法不重要


10.换手率应该怎么计算?如遇长时间停牌,如何处理?

l  对于个股一般用成交量/总流通股本来计算换手率,对于一个策略而言换手率一般是来衡量手续费的高低,常用每天双边交易总额/前一天收盘总资产来计算。停牌没有交易,可以简单置零处理。

l  这个因子的变化情况一般第三方数据都会给出。如果长期停牌,一般不建议在复牌初期介入。我们应当认识到量化分析存在自己的局限性,这里不适宜采用量化的方法来做分析判断。

l  换手率一般定义为 交易量/流通股本。由于换手率一般是衡量股票流动性的指标,所以根据多因子模型的调整频率,可以用周换手率、月换手率或年换手率作为指标或者流动性因子。对于长时间停牌的股票,我个人认可的处理方法是剔除该股票。因为停牌通常意味着有重大消息要发布,其复牌后的收益出现异常波动的可能性较大。这种消息面因素导致的特异收益 (specific return) 通常是无法被多因子模型解释的,所以会给模型的参数估计带来额外噪音。

 

          我的答案:果仁怎么算我就怎么算,咋的,这么简单的事还要自己搞一套???


11.若某一因子包含长期平均数据(比如5年平均净利润),而中间有数据缺失的片段(比如最近5年中有2年的年报缺失),应该如何处理?现有两种参考方法:设为空值,或取现有数据的平均值充作长期均值。哪种更好?还是无所谓?

对于缺失值的处理没有完美的方法,不同的情况应不同分析;以文中例子来说,要计算5年平均的净利润,若企业的利润是线性增加的,那么取现有数据则会高估平均利润,同样若企业利润时线性减少的,那么取现有数据则会低估平均利润,具体情况要具体分析。

l  首先假设缺失值所在的时间周期内公司业务等财务数据不存在重大变化;采用空值的话,在数据连续性上存在断点,而采用平均值的话容易导致因子不显著,或者该因子被低估。我的建议是根据该因子的变化趋势采用插值法。如果假设不成立,应根据最新的数据重新回归建模。

l  作为例子,假设我们在处理一个盈利因子,其第23年的数据缺失,考虑三种情况:1 存在缺失值的企业盈利线性增加;存在缺失值的企业盈利线性减少;存在缺失值的股票经营情况来回波动。如果企业盈利线性增加,剔除缺失值再取平均会导致盈利因子暴露度被高估;如果企业盈利线性减少,剔除缺失值再取平均会导致盈利因子暴露度被低估;如果在5年时间区间内企业盈利大幅波动,剔除缺失值再取平均对盈利因子暴露度的暴露度误差的影响无法估计。对于缺失值的处理没有一劳永逸的方法。其合适的处理方式依赖于数据特点、缺失情况(个别缺失还是大段缺失)、我们计算的目标是什么,等等。因此必须要对具体的问题和数据仔细斟酌,才能找到相对合适的处理方法。

 

          我的答案:这是果仁的数据处理问题,要是数据不满意,各位亲,让果仁网赔偿(核桃仁、花生仁、苹果仁。。。,一人一颗,不许抢)


12.财务数据应该在哪个时点进行更新?比如月频的多因子模型,年报公布时间可能为3月或4月,是在3月底的时候即时更新那些已出的数据,还是在4月底统一更新使用?

l  为了更好获得信息的时效性,通常的做法是随时公布随时更新。

l  如果能做到自动更新数据的,那肯定是更新的越早越好。如果需要手动且工作量太大,可以在一个时间统一更新。从模型效果的角度来讲,更新的频率越高越及时就越能保证模型捕捉价格的有效性,很多时候是成本问题。

l  在用历史数据对基本面因子取值进行计算的时候,我们应当保证因子所包含的信息和当时市场上投资者获得的信息一致。对于题目中的例子,如果企业是在 3 月份公布年报,则这些股票的因子暴露度应当在 3 月底进行更新;对于没有公布年报的企业,因子暴露度则维持原来的取值。

           我的答案:这个顺便问一句果仁,财报数据有进库的时间标记吗?财报修改会不会有影响形成未来函数(在4月底使用了5月才修改的财报数据),不过我猜果仁没有数据处理能力,是直接买来的数据,把数据提供商的处理标准在论坛上公布一下吧


13.有哪些指标可以用来衡量单因子测试的结果?

l  回归法中,用t绝对值均值,|t|>2占比,t序列方差,beta均值,beta方差等,构建组合法中,用信息比IR、夏普值、最大回撤、换手率等通用指标。

l  假设回归多因子方程:Y=a1x1+a2x2+a3x3+e,其中,e服从N0σ);x1x2x3分别为可能有效的因子,从统计上讲,若因子有效,则该因子前的被估计参数ai应显著的不等于0。即在T检验下,P((a-0/Stda≥97.5%或者≤2.5%(在95%的置信区间下)。还是要强调的是:不要单单看显著性是否显著,还要观察变量的逻辑意义。

l  如果希望判断但因子的预测能力,最常见的基本指标是信息率(Information Ratio, IR)。一些业绩评价的常用指标,例如夏普比率,最大回撤等也可以用于单因子效果判断。


          我的答案:各位亲,虽然俺是学数学的,但早忘了好多,建议只看夏普值与IR信息比率(收益与风险的均衡指标)、IC信息系数(有没有预测未来的能力,完美的回测结果,但IC不行,表明你是完美的拟合了过去,策略在未来没有用)、换手率(对大资金有很大区别),至于其他指标,亲,等你资金过亿(达到第一个小目标)再考虑

 

14.依据单因子测试结果,如何对因子的有效程度进行排序?或者说,如何用单一指标衡量因子有效性?

l  若评估风险因子,则用abs(mean(t))/std(t),若评估alpha因子,则用IR

l  如使用多元回归,P值越大,说明越显著,有效性越高。

l  用问题13的指标对因子进行排序则可。在排序的时候,更常见的方法是采用多个股票池对因子进行多次测试 —— 橘生淮南则为橘,生于淮北则为枳。

 

          我的答案:各位亲们,在策略界面,果仁再不出单因子的各类测试排序结果,你们就把果仁吃了吧(一人一粒,排队,美女优先。。。。)


15.所谓的“alpha因子风险因子,应该怎么进行区分?

l  风险因子更在乎于对股票收益来源的解释,从经济金融角度讲也是合乎投资逻辑,从统计角度讲,如上一题列示,abs(mean(t))/std(t)是显著的,比如大于2的比例非常高;而alpha因子的要求更高,统计上可以表示为mean(t)/std(t)是显著的,直观上讲是说,风险因子对方向没有要求,只要求因子值对股票的解释性、区分度,而alpha因子则要求因子方向保持稳定且要显著,这样才能获取稳定的超额收益。

l  alpha因子是指在对冲了系统性风险后,能够被模型解释的,具有超额收益的因子。这里不太清楚,风险因子是指能代表系统性风险并需要对冲的因子,还是指波动率(即统计上的方差)较大的因子。

l  alpha 因子通常是对特定证券的预期收益率有预测能力的因子;而风险因子通常是投资者认为他们的信息或者策略对于该维度没有预测能力,并希望实现中性化处理的因子 (先验),或对投资组合的风险存在显著边际贡献的因子 (后验)。由此可见,一个因子是 alpha 因子还是风险因子,部分取决于投资者的信息和经验—— 此之蜜糖,彼之砒霜。


          我的答案:让我赚钱的因子就是阿尔法因子,让我亏损的因子就是风险因子(咳、咳、咳,这回答让我回到了菜场老大妈的水准线),其实还是按实践标准来,大家都普遍使用的因子就是风险因子(很多原来的阿尔法因子在流行后就没有超额收益了,成了风险因子),如果少数人用还能赚钱的因子的就是阿尔法因子

 

16.你理解中有效且有逻辑的因子应该包括哪些?有逻辑但效果较差的因子应该包括哪些?如果采用某种方法组合出一个古怪的因子解释力很强,但是看不出因子的经济意义,你该怎么办?

l  有效且有逻辑的因子比如有估值、市值;有逻辑效果差可能是因子已经反映在价格里面,也有可能是市场并不是那么有效(尤其A股);对于复杂因子,可以通过归因分析来细看因子的风格偏向。

l  A股市场,有效且有逻辑的因子特别是中高频量化模型中,应包括市场情绪因子;我的逻辑在于:股票在短期中反应了人们的预期,当预期一只股票会涨,大家都去买入,那股票就上涨了。效果较差的因子应包括财务模型中的一些因子,因为中国市场中,投机、政策性比较强,羊群效应显著。

l  如果我知道有效又有逻辑的因子,那当然不能告诉你了;有逻辑但效果差的话,可能是因为该因子的效应已经体现在证券价格中(有效市场理论)。对于表达式非常复杂难解的因子,可通过计算其对特征组合的暴露度来判断其经济学意义。


           我的答案:果仁的因子都是有效有逻辑的(这明显是托啊,哈哈。。。),有逻辑效果差的因子,明显大家都普遍使用,已经没有超额溢价的因子,解释力很强没有经济意义的因子,适合小资金、高频、短线,西蒙斯的高频因子不管经济意义,只管赚钱,如果是大资金长线模型,那必须有经济意义


17.如何打磨旧的因子,提高其有效性?

l  一个简单的想法是多测试旧因子的不同使用场景,比如估值因子在不同行业间的表现差异;又或者构建动态情景模型(dynamic contextual alpha model),在不同情境下看旧因子的表现;当然最直接的是进行旧因子的择时。

l  举例来说,有一个旧的因子A,它以前的逻辑是PA变大,则Y也变大)>60%;在一段时间失效后,他的逻辑可能变为了PA变大,且B变小,则Y也变大)>60%,那么,去深入挖掘这种更进一步的条件概率下的显著性,我想或许是一种可能的办法。

l  一个思路是,把旧因子和新因子进行组合。在旧因子的预测能力未完全衰减至0,且和新因子存在相关性的前提下,旧因子可以增强新因子的预测能力,或者对冲其风险。


          我的答案:从不打磨旧因子,只等待旧因子重新起作用,为什么?人性永远不变,总是循环,比如价值因子,总有几年失效的时候,那就等到价值因子起作用时,再用这个策略,比如老巴在网络泡沫那几年收益不行,网络泡沫破裂后,收益立即暴涨,价值因子再起作用,这世上没有完美的,耐心等待属于自己的策略的春天

 

18.构建因子的新信息源如何寻找?有哪些思路?

l  比如现在市场上很火的高频转低频因子;又或者一些还没有被其他投资者利用到的数据(非结构化,需要很轻的技术把这些数据变为结构化的因子形态),比如热度数据、情感数据、支付数据等大数据领域。

l  通过公司内部。公司外部的会议、交流互相启发;阅读文献,掌握国内外的动向。


          我的答案:同上一题,我喜欢根据人性出发的因子,比如低估值,人性永远不会变,总在恐惧时砍仓,导致下跌过度,价值投资人人都知道,几十年执行不走样的没几个


19.现在常用的因子都是易于量化的因子,对于基本面因子、事件驱动因子、市场情绪因子等不易量化的因子,有无合适的处理方法?

l  具体问题具体分析,不好量化的因子可以根据经验直接分层打分来处理。

l  基本面因子存在数据无变化,没有Varuance的缺点;事件驱动因子没有良好的量化模型(在这里我认为var模型或许是一种可能的建模方式,注:不是Var at Risk);市场情绪因子不存在很好的第三方数据来源,可能要靠自己写爬虫程序。对于基本面因子,或许可以认为引入常数项来解决;事件驱动我认为在物理上的波动传导模型或许有借鉴的意义,但需要去研读相关的文献;市场情绪的爬虫没有做过,不敢说。


          我的答案:这个我真不擅长,我愚蠢所以我自豪