量化投资

小张是后端工程师,工作 5 年,工资跑不赢北京房租。每月炒股凭感觉,越炒越亏。

去年他想:天天写自动化测试,能不能把交易策略也写成代码、跑回测、上线?他踩了一年坑才摸到门。

演示:小张的第一个量化策略

量化投资就是把交易策略当软件来开发——写代码、跑测试、上预发、灰度发布、监控告警。每个程序员都熟。

小张选了一个最简策略:周线均线突破。周 5 日均线上穿 20 日均线就买入,下穿就卖出。标的是沪深 300 ETF,本金 10 万。

步骤 1:选标的——沪深 300 ETF,不选小盘股
→ 为什么这么选:流动性大、数据干净、滑点低,新手回测最可信
→ 类比映射:等于挑一个稳定的成熟 API,不挑刚发布的 beta 版

步骤 2:定信号——5 上穿 20 买入
→ 为什么这么选:先做最简单可验证的版本,跑通再说
→ 类比映射:先写最小 demo,别一上来就微服务化

步骤 3:跑回测——2010 到 2024 共 14 年数据
→ 为什么这么选:跨牛熊周期才能看出策略真实性格
→ 类比映射:等于跑全量集成测试,不只跑单元测试

步骤 4:扣成本——每笔交易 0.2% 滑点加佣金
→ 为什么这么选:免费午餐先被市场吃掉
→ 类比映射:性能测试必须带真实网络延迟,不能假设零延迟

步骤 5:留 20% 样本外——2022-2024 数据不参与调参
→ 为什么这么选:用全数据调参等于背答案
→ 类比映射:测试集和训练集分开,机器学习铁律

最后结果:年化 9%、最大回撤 18%、夏普 0.6。比直接持有沪深 300 强一点点,扣完成本几乎打平。小张差点把电脑砸了——花一个月,跑出来基本等于躺平。

但这才是诚实结果。绝大多数公开策略的真实样子,就是平庸或微负。

拆解:5 步背后的 4 条规则

回看小张的 5 步,背后是 4 条规则:

规则 1:先做最小可验证版,再迭代复杂度
← 来自步骤 2:他没一上来上 50 个因子,从 1 条信号起步
边界:极简策略大概率不赚钱,目的是先打通流程

规则 2:回测必须扣回所有真实交易成本
← 来自步骤 4:不扣成本的策略数据都是漂亮废纸
边界:低频策略受成本影响小,高频策略可能直接转负

规则 3:永远留一份 “ 调参从没碰过 “ 的数据
← 来自步骤 5:这是检验策略是否真有效的唯一方法
边界:留太多数据用于验证会让训练数据不够,通常 20-30%

规则 4:用风险调整收益评估,不只看绝对数
← 来自步骤 1 选 ETF 而非杠杆品种:稳健胜过刺激
边界:风险偏好不同,长线资金看夏普,短线资金更看回报

易混点:高夏普 vs 真有效

维度 高夏普未必真好 真有效的标志
样本时长 1-2 年高夏普 跨过 3 个完整周期
实盘验证 只有回测数据 实盘走过 1 年以上
策略来源 网上抄的或反复调参 有清晰的赚钱逻辑
容量测试 只跑 100 万 跑过亿级真实流动性

类比一下:测试覆盖率 100% 不代表代码没 bug,可能只是测试本身写错了。

半练:小张的下一个场景

小张策略跑了一年。朋友甩给他一个 “ 火爆策略 “:加密货币网格交易。回测 6 个月,年化 200%,最大回撤 5%,夏普 8.5。问他要不要 all in。

问题:小张该看到的最大红旗是什么?

💡 先想 30 秒再展开。

回测时长 6 个月就是头号红旗

  • 6 个月覆盖不了一个完整周期,可能正好抓在单边涨势里
  • 200% 收益配 5% 回撤太完美,违反风险收益对应的常识
  • 夏普 8.5 在量化界是顶级机构传说级别——业余做出来概率约等于 0
  • 经验法则:回测期 < 完整一轮周期,看到的都是幻觉

小张当年也差点上头。他做了对照实验:用同样 6 个月数据随机模拟 1000 次,发现 5% 的 “ 假策略 “ 也能跑出年化 100% 以上。这就是过拟合的真面目——把噪声当信号。

类比一下:等于一个新功能只在 dev 环境跑了一周,就要直接灰度全量——任何一个 SRE 看了都会拒签。

独挑:你的场景

你刷到一家量化私募的宣传:成立 3 年,年化 25%,最大回撤 8%,夏普 2.5。基金经理是某海归博士,最低门槛 100 万。朋友问你能不能投。

问题 1(闭合):这 3 年业绩(2022-2024)的最大盲点是什么?

问题 2(开放):你还会问哪些问题来评估这家私募?

问题 1 参考答案:这 3 年没经过真正的全市场杀跌

2022-2024 是 A 股结构性行情,量化容易出业绩。没看到这家在 2018 单边熊市或 2015 急速崩盘里的表现,等于只跑过晴天的飞行测试。

3 年在量化界算 “ 刚够看 “,但远不到能下结论的长度。

问题 2 思考方向:不必有唯一答案,关键是看你能不能想到这几个维度:

  • 资金管理规模和策略容量:太小没意义,太大可能打满流动性
  • 策略原理是否能说清:说不清的别投,可能在裸跑
  • 是否有存活者偏差控制:失败的产品会不会被悄悄关掉
  • 实盘 vs 回测的差距:差距越大越可疑
  • 团队稳定性:核心策略写手离职策略可能就死
  • 是否经历过黑天鹅:去年没经历过的是 “ 还没到时候 “,不是 “ 扛得住 “

经验法则:把它当作面试一家技术公司——业绩报告是简历,你要做尽调。

扩展问答

1. 夏普比率到底是什么?

单位风险下的超额收益。公式:(策略年化收益 − 无风险利率) / 收益年化波动率。

它惩罚的是 “ 不稳定 “——同样赚 10%,平稳曲线的夏普高于过山车曲线。猛涨也算抖动。

经验对照:

夏普 含义
< 0.5 不如躺平买指数
0.5–1 业余水平
1–2 合格,可拿出去募资
2–3 头部私募水平
> 3 警惕:要么真神,要么数据有问题
> 5 99% 是过拟合或诈骗

两个误区:夏普高 ≠ 安全(不抓尾部风险,LTCM 爆雷前夏普 4.x);夏普高 ≠ 赚得多(夏普 3 但年化 5% 也存在)。

2. 量化在 A 股能做吗?怎么做?

能做,但 A 股的硬约束决定了玩法和美股不同:

约束 影响
T+1 当天买当天不能卖,股票日内高频死路一条
不能裸卖空 中性策略难做,融券池小且贵
±10% 涨跌停 极端行情下流动性蒸发
印花税 0.1%(卖出) 高频被税收死

个人路径(从轻到重):

方式 门槛 适合
聚宽 / 米筐 / 优矿 0 元 入门、回测验证
券商 API(华泰 MATIC、东方等) 几十万本金 + 会写代码 自己跑实盘
私募基金备案 团队 + 合规 机构化运作

A 股能做的几类(按主流度):股票多因子选股(私募 80% 在做)、指数增强、CTA 商品期货(不受 T+1 约束)、可转债 / ETF 套利、打新策略。

新手路径建议:聚宽免费学 → 券商模拟盘验证 → 实盘小钱跑满 1 年 → 加仓。

3. 量化交易费会很多吗?

取决于策略频率。新手最大的误解是把 “ 量化 “ 等同于 “ 高频 “。

A 股一笔交易的成本:印花税 0.1%(卖出)+ 佣金 万 1.5–万 3(双向)+ 滑点 0.05%–0.3%。一买一卖一轮约 0.2%–0.5%。

不同频率的成本拖累:

策略类型 调仓频率 成本拖累/年 可行性
长线价值 季/年 0.5% 几乎可忽略
中频多因子 月度 3–6% 主流私募档位
周线择时 10–15% 必须 alpha 强
日内高频 分钟/秒 单边吃光 个人玩不了

个人在 A 股做高频几乎不可能:T+1 堵死股票日内、佣金谈不到机构价、印花税躲不掉。机构高频靠的是万 0.5 佣金、自营席位免印花、期货市场无 T+1、机房直连交易所。

新手做月度调仓的多因子,成本是小事。

4. 价值投资 Vs 量化投资,哪个更有道理?

不是对立关系,是两套工具。问 “ 哪个更有道理 “ 约等于问 “ 扳手和螺丝刀哪个更有道理 “。

两边都赚到过钱:巴菲特 60 年年化 ~20%,西蒙斯大奖章扣费后 39 年年化 ~39%。所以 “ 哪个更对 “ 是伪问题。

对个人的现实差异

维度 价值投资 个人做量化
信息公平度 财报公开可读 高质量数据要花钱买
基础设施 一个手机一个券商 数据源 + 算力 + 低延迟通道
容量 几乎无上限 百万级还行,亿级 alpha 消失
心理压力 时间是朋友 连亏 3 个月时不知道该不该停

真正有道理的事是 “ 知道自己在赚什么钱 “:价值投资赚的是企业未来现金流折现 + 市场错杀的折扣;量化赚的是市场摩擦、行为偏差、统计规律。

最危险的姿势:价值派把 “ 长期持有 “ 当作不止损的借口;量化派把回测漂亮的策略当成印钞机。

程序员个人投资的一种参考姿势:80% 被动指数定投打底,20% 拿来玩量化或选股当学费——你不是巴菲特,也不是西蒙斯。

附录:核心术语速查表

术语 人话解释 类比 常见误解
因子 影响股价的特征 选水果看大小甜度 越多越好
回测 用历史数据验证策略 跑全量集成测试 漂亮就一定赚
夏普比率 单位风险下的收益率 性价比指标 越高越安全
过拟合 参数贴历史不贴未来 测试只覆盖 happy path 只是参数太多
最大回撤 历史最深的下跌幅度 跌得最惨那次 等同于平均亏损
滑点 实际成交比预期差 标价 10 块买进 11 块 小钱可忽略
Alpha 跑赢市场的超额部分 比平均强多少 等于绝对收益
样本外 调参时没碰过的数据 留的最终考试卷 占比越多越好