第一部分:小白零基础搞懂——什么是因子
1. 因子最通俗定义
因子:就是给股票定好坏的「一条单一评判标准」。你平时选股,心里会想这些:- 这家公司赚钱能力强不强?
- 现在股价估值贵不贵?
- 最近股价走势是不是强势?
- 公司负债高不高,会不会暴雷?
- 大机构、北向资金有没有在买?
2. 生活化类比(一秒听懂)
把全市场几千只股票,当成几千个应聘者。你招人要看:- 学历好不好
- 人品稳不稳定
- 工作上进心强不强
- 薪资要求合不合理
3. 股市里五大类核心真实因子
所有量化因子,都逃不出这5大类:1.成长因子
营收、净利润同比增速——看公司是不是越赚越多,业绩有没有持续变好。2.价值因子
市盈率PE、市净率PB、股息率——看股价贵不贵、性价比高不高,有没有被低估。3.质量风控因子
ROE、毛利率、资产负债率、经营现金流——看公司经营稳不稳、财务健不健康,会不会暴雷。4.量价动量因子
近10日/20日涨幅、换手率、波动率——看股价趋势强不强、交易活跃度高不高,有没有资金关注。5.资金机构因子
机构持股、北向持股、股东户数变化——看主力资金认不认可,有没有大资金在悄悄布局。你听过的所有炒股指标,全部都属于这五类里的某一个因子,没有例外。4. 单因子是什么?
只拿一个标准选股票,就是单因子。比如:只买市盈率最低的、只买最近涨得最多的、只买ROE最高的。单因子最大致命缺陷
- 只看便宜(价值因子):越便宜越跌,很多低价股是因为公司基本面走下坡路,属于“垃圾股”;
- 只看涨幅(量价因子):纯追高,容易高位接盘,一旦行情反转,亏损速度极快;
- 只看高ROE(质量因子):很多高ROE是靠高负债堆出来的,看似赚钱强,实则暗藏暴雷风险。
第二部分:什么是多因子?为什么一定要多因子
1. 多因子通俗定义
同时用好几个不同维度的因子,一起交叉筛选股票,就叫多因子。不再只看单一优点,而是同时考察:成长好不好+估值贵不贵+财务稳不稳+趋势强不强+资金认不认可。2. 多因子的核心底层逻辑
- 防偏科:不允许某一项致命缺陷被其他优点掩盖(比如估值便宜,但财务暴雷,直接淘汰);
- 互相验证:多个维度同时向好,说明股票不是偶然炒作,可靠性更高,赚钱概率更大;
- 降低风险:行情切换时,单一因子会失效(比如牛市动量因子好用,熊市就失效),多因子能互补,更抗跌、更稳定;
- 去主观化:不靠感觉、不靠消息,靠固定数据规则选人,避免情绪化决策(追涨杀跌、贪心恐惧)。
3. 生活化类比
单因子:只看长相处对象,忽略人品、性格、能力,容易遇人不淑;多因子:长相过得去+人品靠谱+性格稳重+踏实上进,多条标准同时把关,优中选优,避开大坑。第三部分:进阶关键——因子使用前必须做的严谨处理
(这里是小白和专业量化的分水岭)1. 区分因子方向(必须做,第一步)
所有因子只有两种属性,必须先统一方向,否则逻辑会混乱:- 正向因子:数值越大越好→ 营收增速、ROE、机构持股、涨幅;
- 负向因子:数值越小越好→ 市盈率、市净率、资产负债率、流通市值。
2. 必须做行业中性化(核心严谨规则,第二步)
核心逻辑:银行天生估值低、科技天生估值高;钢铁股天生市值大、小盘股天生市值小,直接把不同行业的股票放在一起对比,毫无意义,会导致策略无脑扎堆某一个行业(比如只选银行股),不是选股厉害,是靠行业红利。行业中性=只在同一个细分行业内比优劣同行业比估值、同行业比成长、同行业比市值,确保公平对比,避免行业偏见。小白实操(果仁专用,不用懂复杂逻辑):用果仁的`HAvg`(行业均值)、`HRankScore`(行业内排名),就能轻松实现行业中性,不用自己计算。不做会怎样?策略只会无脑抱团某一个行业,一旦这个行业行情走弱,整个策略会直接崩盘,回测收益看似高,实盘必亏。>一句话:中性化=公平比赛,同班同学只跟同班比,不跨班欺负人3. 异常值缩尾化(Winsorize,建议必做,第三步)
啥意思?把股市里「极端离谱的数值」(比如一字涨停导致的动量暴增、市值极小的壳股、财报异常暴冲的股票)限制住,不让它乱带节奏、扭曲整个因子分数。小白实操(果仁专用):不用自己算复杂公式,直接用果仁的`HWinsorize(因子, 0.01, 0.01, 2)`函数,就能一键干掉极端值(1%上下缩尾,二级行业内处理),避免个别妖股捣乱。不做会怎样?一个极端值(比如某只股票单日暴涨100%)会直接把整个多因子分数带偏,导致排名混乱,选出来的全是妖股、垃圾股,回测失真。>一句话:缩尾=干掉离谱变态值,不让个别股票捣乱整体排名,保证策略稳定4. 归一化 / 标准化(二选一,必须做,第四步)
这是新手最懵的“XX化”,不用记复杂定义,记住“统一标准、公平对比”就够:啥是归一化?把不同大小、不同单位的因子,统一压缩到0~1之间(比如把市值因子、动量因子,都变成0到1之间的数值)。啥是标准化?和归一化目的一样,只是方式不同:把因子数值调整为“均值归零、波动统一”,避免某一个因子数值太大,霸占话语权。为啥一定要做?举个最直白例子(小白一看就懂):- 市值因子原始数值:0.5~3(波动范围小);
- 动量因子原始数值:0.2~10(波动范围极大)。
5. 排名分映射(果仁最实用、最简单的终极处理,小白首选)
啥意思?不用自己算复杂的归一化、标准化,直接用果仁的HRankScore函数,把所有因子统一变成0~100分(行业内排名,分数越高,股票越优质)。核心好处(小白必看)- 自动实现行业中性(只在同行业内排名);
- 自动实现同向排序(分数越高,因子越优质);
- 自动完成归一化/标准化(分数统一0~100,量纲一致);
- 不受原始数值大小影响,避免极端值干扰;
- 相乘、加权都公平无比,不用自己做任何复杂处理。
第四部分:深度精讲——什么是多因子协同
1. 多因子协同专业定义(通俗版,小白能懂)
把多个低相关、不同维度、经过同向化+行业中性化+缩尾+标准化的因子,用固定规则组合成一个复合总分,用这个总分给全市场股票排名,优中选优、约束短板,这套“从因子处理到组合选股”的完整体系,就是多因子协同。关键点拆解(严谨不编造,实战通用):- 必须跨五大类组合:不把同类型因子堆一起(比如同时用“营收增速”和“净利润增速”,都是成长因子,高度相关,等于白做);
- 必须预处理:方向统一、行业中性、标准化打分,缺一不可;
- 必须规则组合:不是随便加、随便乘,有固定的逻辑模式(只有两种核心模式)。
2. 多因子协同两种核心模式(仅这两种,实战通用,小白能区分)
模式一:相乘协同(硬核严选模式,小白首选)
公式逻辑(通俗版):因子1排名分×因子2排名分×因子3排名分核心规则:木桶原理,有一项拉胯,整体直接低分淘汰(比如某只股票成长、价值都好,但财务有暴雷风险,分数会直接变低)。要求所有因子都在线,不允许有明显短板,宁缺毋滥。适合场景:稳健选股、熊市防御、少踩雷、长期持有(小白最适配,风险低)特点:选股精而少、回撤小、容错率高,实盘适配性强,不容易踩坑。模式二:加权平均协同(宽容进攻模式,进阶者用)
公式逻辑(通俗版):(因子1×权重+因子2×权重+因子3×权重)求和平均核心规则:允许偏科,某一项弱一点,其他几项很强,可以把总分拉上去(比如某只股票估值偏高,但成长和资金都极强,总分依然会很高)。适合场景:牛市行情、抓强势股、做波段弹性(进阶者用,小白慎用)特点:选股数量多、进攻性强,但容错率低、容易混入有短板的标的,行情差时回撤大。补充:不同行情的切换逻辑(实战必备)
- 牛市/趋势行情:用加权平均协同,兼顾弹性,抓强势股;
- 熊市/震荡行情:用相乘协同,严控风险,避雷为主;
- 中性行情:两种模式均可,优先相乘(小白更稳)。
3. 为什么叫「协同」?(小白秒懂)
不是简单堆砌指标,而是“各管一块、互相配合、互相约束、互补短板”:- 成长因子:负责看业绩,确保公司能赚钱;
- 价值因子:负责看估值安全,确保不买高位股;
- 质量因子:负责防雷,确保公司财务健康;
- 量价因子:负责看趋势,确保有资金关注、不逆势;
- 资金因子:负责看主力认可,确保股票有资金支撑。
4. 严谨的多因子协同标准流程(完整闭环,机构/果仁通用)
- 从五大类里挑选低相关单因子(避免同类型堆叠);
- 区分正向/负向,统一方向(负向因子取倒数);
- 做一,二级行业中性(用果仁HAvg/HRankScore);
- 异常值缩尾处理(用果仁HWinsorize),避免极端值干扰;
- 全部转为行业内排名分HRankScore,统一量纲;
- 选择 相乘 / 加权 做协同复合因子(小白优先相乘);
- 前置垃圾股硬过滤(剔除ST、僵尸股、无法交易股);
- 用复合因子排名选股、做回测验证;
- 分段样本外检测(比如分2020-2022年、2023-2024年两段回测),防止过拟合(避免历史赚钱、实盘亏钱)。
5. 多因子协同常见坑(小白必避,补充细节)
- 同类别因子堆叠(比如同时用营收增速、净利润增速,都是成长因子,高度相关,等于白做);
- 不做预处理,直接用原始因子相乘/加权(数值乱打架,策略失效);
- 只做行业中性,不做缩尾(极端值带偏排名,选到妖股);
- 权重设置太主观(比如随便给某一个因子设80%权重,变成单因子独角戏);
- 不做前置过滤(混入ST、僵尸股,回测收益虚假,实盘无法交易)。
第五部分:果仁网实操自定义多因子协同案例(小白可直接套用)
结合前文讲到的流程、函数,参考“小贝塔 800 投资策略分享”核心逻辑,重点修改排名因子,采用多因子协同逻辑,来修改“小贝塔800投资策略”,添加多因子协同复合因子后(后面我会分享这个因子),优化结果如下图:小贝塔800-多因子协同-案例展示一、多因子协同复合因子公式
该因子由三个独立一级行业中性因子相乘协同组合而成:HRankScore((1/收盘价)/HAvg(1/收盘价,1),1,1) * HRankScore((1/ln(总市值))/HAvg(1/ln(总市值),1),1,1) * HRankScore((后复权收盘价/Ref(后复权收盘价,10))/HAvg(后复权收盘价/Ref(后复权收盘价,10),1),1,1)二、三个独立因子拆解
因子 1:一级行业内相对低价
HRankScore((1/收盘价)/HAvg(1/收盘价,1),1,1)人话解释:在同一个一级行业里,通过 1/收盘价 反向处理,把“股价越便宜” 变成正向指标;再和一级行业均值对比,剔除行业整体贵贱差异;最终用HRankScore做全市场正向排名,分数越高,代表股价在行业内相对越便宜。这样既避开了 “银行天生低价、科技天生高价” 的僵尸行业陷阱,又精准拿到了行业内的估值洼地,避免 “为了便宜买垃圾股” 的误区因子 2:一级行业内相对微盘
HRankScore((1/ln(总市值))/HAvg(1/ln(总市值),1),1,1)人话解释:在同一个一级行业内,先对总市值做对数压缩,避免极端大市值标的影响均值;再通过 1/ln(总市值) 反向处理,把 “市值越小” 变成正向指标;接着和一级行业均值对比,最后用HRankScore做全市场排名。分数越高,代表标的在行业内市值相对越小、弹性越强。盘子越小,资金拉涨需要的成本越低,震荡市反弹时的涨幅潜力也越大,同时一级行业对比也避免了无脑选 “垃圾小市值股” 的风险因子 3:一级行业内 10 日相对动量
HRankScore((后复权收盘价/Ref(后复权收盘价,10))/HAvg(后复权收盘价/Ref(后复权收盘价,10),1),1,1)人话解释:在同一个一级行业的低价 + 小市值标的里,先计算近 10 日走势强度(后复权收盘价 ÷10 日前收盘价),再和一级行业均值对比,剔除整个行业普涨带来的 “虚假强势”;最后通过HRankScore排名。分数越高,代表标的在行业内短期走势相对越强,说明已经有资金提前布局,不用你进去熬漫长的潜伏期,在震荡市中能更快捕捉到启动信号。三、协同逻辑说明
三个因子相乘得到综合总分,对所有股票按综合总分从大到小排序,直接选取排名最靠前的标的即可。分数越高 = 同时满足:同行业更低价 + 更小市值弹性 + 近期趋势走强,也就是我们要的 “优质低价股”。相乘协同采用 “木桶效应” 逻辑,只要有一个因子拉胯(比如行业内走势偏弱、市值过大),整体总分就会大幅降低,自动淘汰有短板的标的,确保选出的是无短板、适配震荡行情的稳健标的。四、重点说明:为什么用一级行业,不用二级行业?
这里补充完整逻辑,小白也能理解:1、样本量严重不足,均值会失真
本策略经过前置严格筛选后,股票池仅剩下 300 多只标的。全市场一级行业约 30个,300 只股票分摊下来,平均每个一级行业有 10-15 只个股,样本充足,计算行业均值时不会被极端个股带偏。而二级行业有 100 多个,300 只股票摊下来,很多冷门二级行业仅 1-2 只甚至 0 只标的,行业均值完全被单只股票决定,失去了中性化对比的意义,回测会出现 “假强势股”,实盘无法复用。
2、二级行业会出现 “孤股效应”,对比毫无价值
如果一个二级行业里只有 1 只股票,它自己就是行业均值,再怎么除以行业均值都没有对比价值,HRank 排名会彻底失效,回测逻辑混乱,震荡市中极易出现回撤失控的情况。
3、精简小池子强行拆二级,会破坏前置筛选的价值
你的股票池不是全市场几千只标的,而是已经剔除了 ST、流动性差、市值过小、基本面异常的标的,本身就做了一轮优中选优。再强行拆二级行业,只会把本来就不多的优质标的拆得更碎,不仅无法提升对比精度,反而会丢失行业中性的效果。
4、一级行业已经足够适配,性价比最高
对于 300 只左右的精选股票池,一级行业中性既能做到跨行业风格中性,避免无脑扎堆单一赛道;又能保证每个行业样本充足、均值稳定,在震荡市中回测更稳健、不容易过拟合,实盘复用性更强,是小白入门的最优选择。
第六部分:总结感悟
看懂这套多因子协同逻辑之后,你会发现:机构量化其实一点都不神秘,也没有想象中那么高大上。说白了机构量化并没有什么独门黑科技,核心逻辑就那么几套:把选股思路拆成成长、价值、质量、量价、资金五大类因子,再做好行业中性、排名打分、多因子协同组合,用固定规则代替主观感觉,用历史回测验证逻辑好坏。以前我们觉得量化高深、遥不可及,只是因为没人把底层逻辑掰开、用大白话讲清楚。其实散户借助果仁网,不用编程、不用高深数学,照样能复刻机构的多因子选股思路,自己搭建稳健靠谱的量化策略。投资的本质,从来不是追消息、凭感觉,而是建立一套可复制、可回测、能风控的理性规则。如果觉得本文对你有帮助,记得点赞收藏,也可以在评论区留言。我希望大家在投资的路上稳步前行,慢慢实现理性盈利~
