果仁-飞     果仁策略 公众号  2026年5月8日



转发文章,发现这篇文章对我帮助极大,也希望在果仁网得到充分讨论,如有不合规之处,请见谅或删除。


(全文干货密集,花了我两周时间来排版编写,新手可先看第五部分实操案例,再回头补理论;老手可直接跳至公式复制使用)很多散户炒股,靠感觉、靠消息、靠心情涨跌;量化炒股,靠因子、靠规则、靠历史数据验证本文从最基础概念,一步步讲到专业级多因子协同,零基础能看懂,做量化回测也能直接套用逻辑,全程无瞎编、无虚理论,帮你彻底脱离“凭感觉炒股”,走进数据化、有规则的理性选股之路。

第一部分:小白零基础搞懂——什么是因子

1. 因子最通俗定义

因子:就是给股票定好坏的「一条单一评判标准」。你平时选股,心里会想这些:
  • 这家公司赚钱能力强不强?
  • 现在股价估值贵不贵?
  • 最近股价走势是不是强势?
  • 公司负债高不高,会不会暴雷?
  • 大机构、北向资金有没有在买?
你心里每一条独立的判断标准,在量化里就叫一个「因子」。

2. 生活化类比(一秒听懂)

把全市场几千只股票,当成几千个应聘者你招人要看:
  • 学历好不好
  • 人品稳不稳定
  • 工作上进心强不强
  • 薪资要求合不合理
每一条单独的招聘条件=一个因子

3. 股市里五大类核心真实因子

所有量化因子,都逃不出这5大类:

1.成长因子

营收、净利润同比增速——看公司是不是越赚越多,业绩有没有持续变好。

2.价值因子

市盈率PE、市净率PB、股息率——看股价贵不贵、性价比高不高,有没有被低估。

3.质量风控因子

ROE、毛利率、资产负债率、经营现金流——看公司经营稳不稳、财务健不健康,会不会暴雷。

4.量价动量因子

近10日/20日涨幅、换手率、波动率——看股价趋势强不强、交易活跃度高不高,有没有资金关注。

5.资金机构因子

机构持股、北向持股、股东户数变化——看主力资金认不认可,有没有大资金在悄悄布局。你听过的所有炒股指标,全部都属于这五类里的某一个因子,没有例外。

4. 单因子是什么?

只拿一个标准选股票,就是单因子。比如:只买市盈率最低的、只买最近涨得最多的、只买ROE最高的。

单因子最大致命缺陷

  • 只看便宜(价值因子):越便宜越跌,很多低价股是因为公司基本面走下坡路,属于“垃圾股”;
  • 只看涨幅(量价因子):纯追高,容易高位接盘,一旦行情反转,亏损速度极快;
  • 只看高ROE(质量因子):很多高ROE是靠高负债堆出来的,看似赚钱强,实则暗藏暴雷风险。
一句话:单因子选股=只看一个优点,忽略致命短板,本质是靠运气炒股,长期必亏。

第二部分:什么是多因子?为什么一定要多因子

1. 多因子通俗定义

同时用好几个不同维度的因子,一起交叉筛选股票,就叫多因子。不再只看单一优点,而是同时考察:成长好不好+估值贵不贵+财务稳不稳+趋势强不强+资金认不认可。

2. 多因子的核心底层逻辑

  • 防偏科:不允许某一项致命缺陷被其他优点掩盖(比如估值便宜,但财务暴雷,直接淘汰);
  • 互相验证:多个维度同时向好,说明股票不是偶然炒作,可靠性更高,赚钱概率更大;
  • 降低风险:行情切换时,单一因子会失效(比如牛市动量因子好用,熊市就失效),多因子能互补,更抗跌、更稳定;
  • 去主观化:不靠感觉、不靠消息,靠固定数据规则选人,避免情绪化决策(追涨杀跌、贪心恐惧)。

3. 生活化类比

单因子:只看长相处对象,忽略人品、性格、能力,容易遇人不淑;多因子:长相过得去+人品靠谱+性格稳重+踏实上进,多条标准同时把关,优中选优,避开大坑。

第三部分:进阶关键——因子使用前必须做的严谨处理

(这里是小白和专业量化的分水岭)

1. 区分因子方向(必须做,第一步)

所有因子只有两种属性,必须先统一方向,否则逻辑会混乱:
  • 正向因子:数值越大越好→ 营收增速、ROE、机构持股、涨幅;
  • 负向因子:数值越小越好→ 市盈率、市净率、资产负债率、流通市值。
✅关键操作:负向因子不能直接用,必须反向处理(最常用的是取倒数,比如1/市盈率、1/总市值),把它变成“越大越好”,和正向因子保持一致。不做会怎样?因子互相打架,好股票得分反而低,选出来的全是垃圾股(比如把市盈率高的股票当成“好股票”)。>一句话:同向化=统一评判标准,大家都往一个方向使劲,不内耗

2. 必须做行业中性化(核心严谨规则,第二步)

核心逻辑:银行天生估值低、科技天生估值高;钢铁股天生市值大、小盘股天生市值小,直接把不同行业的股票放在一起对比,毫无意义,会导致策略无脑扎堆某一个行业(比如只选银行股),不是选股厉害,是靠行业红利。行业中性=只在同一个细分行业内比优劣同行业比估值、同行业比成长、同行业比市值,确保公平对比,避免行业偏见。小白实操(果仁专用,不用懂复杂逻辑):用果仁的`HAvg`(行业均值)、`HRankScore`(行业内排名),就能轻松实现行业中性,不用自己计算。不做会怎样?策略只会无脑抱团某一个行业,一旦这个行业行情走弱,整个策略会直接崩盘,回测收益看似高,实盘必亏。>一句话:中性化=公平比赛,同班同学只跟同班比,不跨班欺负人

3. 异常值缩尾化(Winsorize,建议必做,第三步)

啥意思?把股市里「极端离谱的数值」(比如一字涨停导致的动量暴增、市值极小的壳股、财报异常暴冲的股票)限制住,不让它乱带节奏、扭曲整个因子分数。小白实操(果仁专用):不用自己算复杂公式,直接用果仁的`HWinsorize(因子, 0.01, 0.01, 2)`函数,就能一键干掉极端值(1%上下缩尾,二级行业内处理),避免个别妖股捣乱。不做会怎样?一个极端值(比如某只股票单日暴涨100%)会直接把整个多因子分数带偏,导致排名混乱,选出来的全是妖股、垃圾股,回测失真。>一句话:缩尾=干掉离谱变态值,不让个别股票捣乱整体排名,保证策略稳定

4. 归一化 / 标准化(二选一,必须做,第四步)

这是新手最懵的“XX化”,不用记复杂定义,记住“统一标准、公平对比”就够:啥是归一化?把不同大小、不同单位的因子,统一压缩到0~1之间(比如把市值因子、动量因子,都变成0到1之间的数值)。啥是标准化?和归一化目的一样,只是方式不同:把因子数值调整为“均值归零、波动统一”,避免某一个因子数值太大,霸占话语权。为啥一定要做?举个最直白例子(小白一看就懂):
  • 市值因子原始数值:0.5~3(波动范围小);
  • 动量因子原始数值:0.2~10(波动范围极大)。
如果你直接把两个因子相乘:动量因子数值太大,会完全霸占话语权,市值因子的作用被彻底忽略,你以为是多因子协同,实际只剩一个动量因子在发挥作用,和单因子选股没区别。核心作用把所有因子都放到同一个“量级”,谁也不大、谁也不小,地位平等,相乘、加权时才公平,真正实现多因子协同。>一句话:归一化/标准化=统一身高体重,大家站在同一起跑线打分,不搞特殊化

5. 排名分映射(果仁最实用、最简单的终极处理,小白首选)

啥意思?不用自己算复杂的归一化、标准化,直接用果仁的HRankScore函数,把所有因子统一变成0~100分(行业内排名,分数越高,股票越优质)。核心好处(小白必看)
  • 自动实现行业中性(只在同行业内排名);
  • 自动实现同向排序(分数越高,因子越优质);
  • 自动完成归一化/标准化(分数统一0~100,量纲一致);
  • 不受原始数值大小影响,避免极端值干扰;
  • 相乘、加权都公平无比,不用自己做任何复杂处理。
小白做量化,用HRankScore就等于一次性做完:同向化+行业中性化+归一化/标准化+缩尾(间接),省事、严谨、不出错。

第四部分:深度精讲——什么是多因子协同

1. 多因子协同专业定义(通俗版,小白能懂)

多个低相关、不同维度、经过同向化+行业中性化+缩尾+标准化的因子,用固定规则组合成一个复合总分,用这个总分给全市场股票排名,优中选优、约束短板,这套“从因子处理到组合选股”的完整体系,就是多因子协同关键点拆解(严谨不编造,实战通用):
  • 必须跨五大类组合:不把同类型因子堆一起(比如同时用“营收增速”和“净利润增速”,都是成长因子,高度相关,等于白做);
  • 必须预处理:方向统一、行业中性、标准化打分,缺一不可;
  • 必须规则组合:不是随便加、随便乘,有固定的逻辑模式(只有两种核心模式)。

2. 多因子协同两种核心模式(仅这两种,实战通用,小白能区分)

模式一:相乘协同(硬核严选模式,小白首选)

公式逻辑(通俗版):因子1排名分×因子2排名分×因子3排名分核心规则:木桶原理,有一项拉胯,整体直接低分淘汰(比如某只股票成长、价值都好,但财务有暴雷风险,分数会直接变低)。要求所有因子都在线,不允许有明显短板,宁缺毋滥。适合场景:稳健选股、熊市防御、少踩雷、长期持有(小白最适配,风险低)特点:选股精而少、回撤小、容错率高,实盘适配性强,不容易踩坑。

模式二:加权平均协同(宽容进攻模式,进阶者用)

公式逻辑(通俗版):(因子1×权重+因子2×权重+因子3×权重)求和平均核心规则:允许偏科,某一项弱一点,其他几项很强,可以把总分拉上去(比如某只股票估值偏高,但成长和资金都极强,总分依然会很高)。适合场景:牛市行情、抓强势股、做波段弹性(进阶者用,小白慎用)特点:选股数量多、进攻性强,但容错率低、容易混入有短板的标的,行情差时回撤大。

补充:不同行情的切换逻辑(实战必备)

  • 牛市/趋势行情:用加权平均协同,兼顾弹性,抓强势股;
  • 熊市/震荡行情:用相乘协同,严控风险,避雷为主;
  • 中性行情:两种模式均可,优先相乘(小白更稳)。

3. 为什么叫「协同」?(小白秒懂)

不是简单堆砌指标,而是“各管一块、互相配合、互相约束、互补短板”:
  • 成长因子:负责看业绩,确保公司能赚钱;
  • 价值因子:负责看估值安全,确保不买高位股;
  • 质量因子:负责防雷,确保公司财务健康;
  • 量价因子:负责看趋势,确保有资金关注、不逆势;
  • 资金因子:负责看主力认可,确保股票有资金支撑。
这才是「协同」的真正含义——不是随便几个指标放一起,而是“抱团发力、互相兜底”,让选股更稳、更准。

4. 严谨的多因子协同标准流程(完整闭环,机构/果仁通用)

  • 从五大类里挑选低相关单因子(避免同类型堆叠);
  • 区分正向/负向,统一方向(负向因子取倒数);
  • 做一,二级行业中性(用果仁HAvg/HRankScore);
  • 异常值缩尾处理(用果仁HWinsorize),避免极端值干扰;
  • 全部转为行业内排名分HRankScore,统一量纲;
  • 选择 相乘 / 加权 做协同复合因子(小白优先相乘);
  • 前置垃圾股硬过滤(剔除ST、僵尸股、无法交易股);
  • 用复合因子排名选股、做回测验证;
  • 分段样本外检测(比如分2020-2022年、2023-2024年两段回测),防止过拟合(避免历史赚钱、实盘亏钱)。
这套流程,是机构量化、果仁回测通用的标准严谨流程,无编造、全是底层规则,小白照着做,就能避开90%的坑。

5. 多因子协同常见坑(小白必避,补充细节)

  • 同类别因子堆叠(比如同时用营收增速、净利润增速,都是成长因子,高度相关,等于白做);
  • 不做预处理,直接用原始因子相乘/加权(数值乱打架,策略失效);
  • 只做行业中性,不做缩尾(极端值带偏排名,选到妖股);
  • 权重设置太主观(比如随便给某一个因子设80%权重,变成单因子独角戏);
  • 不做前置过滤(混入ST、僵尸股,回测收益虚假,实盘无法交易)。

第五部分:果仁网实操自定义多因子协同案例(小白可直接套用)

结合前文讲到的流程、函数,参考“小贝塔 800 投资策略分享”核心逻辑,重点修改排名因子,采用多因子协同逻辑,来修改“小贝塔800投资策略”,添加多因子协同复合因子后(后面我会分享这个因子),优化结果如下图:小贝塔800-多因子协同-案例展示图片策略的前置设置,大家可以跟着“小贝塔 800 投资策略分享””文章里的步骤操作,这里就不再废话了,今天主要对多因子协同案例用于排名条件进行讲解。

一、多因子协同复合因子公式

该因子由三个独立一级行业中性因子相乘协同组合而成:HRankScore((1/收盘价)/HAvg(1/收盘价,1),1,1) * HRankScore((1/ln(总市值))/HAvg(1/ln(总市值),1),1,1) * HRankScore((后复权收盘价/Ref(后复权收盘价,10))/HAvg(后复权收盘价/Ref(后复权收盘价,10),1),1,1)

二、三个独立因子拆解

因子 1:一级行业内相对低价

HRankScore((1/收盘价)/HAvg(1/收盘价,1),1,1)人话解释:在同一个一级行业里,通过 1/收盘价 反向处理,把“股价越便宜” 变成正向指标;再和一级行业均值对比,剔除行业整体贵贱差异;最终用HRankScore做全市场正向排名,分数越高,代表股价在行业内相对越便宜。这样既避开了 “银行天生低价、科技天生高价” 的僵尸行业陷阱,又精准拿到了行业内的估值洼地,避免 “为了便宜买垃圾股” 的误区

因子 2:一级行业内相对微盘

HRankScore((1/ln(总市值))/HAvg(1/ln(总市值),1),1,1)人话解释:在同一个一级行业内,先对总市值做对数压缩,避免极端大市值标的影响均值;再通过 1/ln(总市值) 反向处理,把 “市值越小” 变成正向指标;接着和一级行业均值对比,最后用HRankScore做全市场排名。分数越高,代表标的在行业内市值相对越小、弹性越强。盘子越小,资金拉涨需要的成本越低,震荡市反弹时的涨幅潜力也越大,同时一级行业对比也避免了无脑选 “垃圾小市值股” 的风险

因子 3:一级行业内 10 日相对动量

HRankScore((后复权收盘价/Ref(后复权收盘价,10))/HAvg(后复权收盘价/Ref(后复权收盘价,10),1),1,1)人话解释:在同一个一级行业的低价 + 小市值标的里,先计算近 10 日走势强度(后复权收盘价 ÷10 日前收盘价),再和一级行业均值对比,剔除整个行业普涨带来的 “虚假强势”;最后通过HRankScore排名。分数越高,代表标的在行业内短期走势相对越强,说明已经有资金提前布局,不用你进去熬漫长的潜伏期,在震荡市中能更快捕捉到启动信号。

三、协同逻辑说明

三个因子相乘得到综合总分,对所有股票按综合总分从大到小排序,直接选取排名最靠前的标的即可。分数越高 = 同时满足:同行业更低价 + 更小市值弹性 + 近期趋势走强,也就是我们要的 “优质低价股”。相乘协同采用 “木桶效应” 逻辑,只要有一个因子拉胯(比如行业内走势偏弱、市值过大),整体总分就会大幅降低,自动淘汰有短板的标的,确保选出的是无短板、适配震荡行情的稳健标的。

四、重点说明:为什么用一级行业,不用二级行业?

这里补充完整逻辑,小白也能理解:

1、样本量严重不足,均值会失真

本策略经过前置严格筛选后,股票池仅剩下 300 多只标的。全市场一级行业约 30个,300 只股票分摊下来,平均每个一级行业有 10-15 只个股,样本充足,计算行业均值时不会被极端个股带偏。而二级行业有 100 多个,300 只股票摊下来,很多冷门二级行业仅 1-2 只甚至 0 只标的,行业均值完全被单只股票决定,失去了中性化对比的意义,回测会出现 “假强势股”,实盘无法复用。

2、二级行业会出现 “孤股效应”,对比毫无价值

如果一个二级行业里只有 1 只股票,它自己就是行业均值,再怎么除以行业均值都没有对比价值,HRank 排名会彻底失效,回测逻辑混乱,震荡市中极易出现回撤失控的情况。

3、精简小池子强行拆二级,会破坏前置筛选的价值

你的股票池不是全市场几千只标的,而是已经剔除了 ST、流动性差、市值过小、基本面异常的标的,本身就做了一轮优中选优。再强行拆二级行业,只会把本来就不多的优质标的拆得更碎,不仅无法提升对比精度,反而会丢失行业中性的效果。

4、一级行业已经足够适配,性价比最高

对于 300 只左右的精选股票池,一级行业中性既能做到跨行业风格中性,避免无脑扎堆单一赛道;又能保证每个行业样本充足、均值稳定,在震荡市中回测更稳健、不容易过拟合,实盘复用性更强,是小白入门的最优选择。

第六部分:总结感悟


看懂这套多因子协同逻辑之后,你会发现:机构量化其实一点都不神秘,也没有想象中那么高大上说白了机构量化并没有什么独门黑科技,核心逻辑就那么几套:把选股思路拆成成长、价值、质量、量价、资金五大类因子,再做好行业中性、排名打分、多因子协同组合,用固定规则代替主观感觉,用历史回测验证逻辑好坏。以前我们觉得量化高深、遥不可及,只是因为没人把底层逻辑掰开、用大白话讲清楚。其实散户借助果仁网,不用编程、不用高深数学,照样能复刻机构的多因子选股思路,自己搭建稳健靠谱的量化策略。投资的本质,从来不是追消息、凭感觉,而是建立一套可复制、可回测、能风控的理性规则。如果觉得本文对你有帮助,记得点赞收藏,也可以在评论区留言。我希望大家在投资的路上稳步前行,慢慢实现理性盈利~