量化炒股入门:把凭感觉买卖变成用系统做决策
本文仅供学习交流,不构成投资建议。
2003 年,英国自行车队连续近一百年没有在环法赛上获胜。然后他们请来了一位新教练戴夫·布雷斯福德。他没有重新发明自行车,也没有引进什么秘密训练法。他做的事情很朴素:把骑车这件事拆成几百个微小环节,然后在每个环节上改善 1%——坐垫高度、轮胎气压、骑手睡眠、手部清洁方式。五年后,英国队在环法和奥运会上都拿了冠军。
量化炒股的逻辑和这个故事惊人地相似。
大多数人第一次听到「量化炒股」,想到的是几块屏幕、跳动的数字、一个自动赚钱的程序。这个画面不算完全错,但它遮住了最重要的部分。量化的核心不是找到一个神秘公式,而是把交易这件事拆成可以被检验的环节,然后在每个环节上做得更系统、更诚实、更可复现。
在 A 股的官方定义里,程序化交易是「通过计算机程序自动生成或下达交易指令进行证券交易」。相关规定已于 2024 年施行,沪深交易所实施细则落地,深交所明确个人投资者也可以参与。量化不是灰色地带,而是一种有明确规则和合规要求的交易方式。
学量化的第一步,不是去找「胜率最高的指标」或者「年化 80% 的神策略」。第一步是建立一个认知——
量化不替你思考。它只是逼你把思考变成系统。
你原来凭感觉做的判断,在量化里必须变成明确条件。你原来靠「应该没事」硬扛的亏损,必须变成事先定义好的风险阈值。你原来在行情好时无所不能、行情差时怀疑人生的情绪波动,在量化里都会被记录、被检验。
量化最大的价值,不是让你立刻赚更多钱,而是把「我觉得」变成「在什么条件下我会这么做,以及这么做的长期结果大概是什么」。这就是从「靠目标驱动」到「靠系统驱动」的转变。
一、量化炒股到底是什么
把交易拆开看,它就是一串连续的决定:买什么、什么时候买、买多少、什么时候卖、亏多少停、赚多少走、什么时候空仓、什么时候降仓位。
主观交易者在看到行情之后临时做这些决定。量化交易者先把这些问题回答好,再用规则和程序去执行。
这个区别看一个例子就够了。
一个主观交易者说:「这只 ETF 最近走势不错,感觉要突破了。」这句话听上去像判断,但它经不起追问。什么叫「走势不错」?什么叫「要突破」?突破到什么程度算成立?回落多少算失败?仓位该多大?第二天低开怎么办?
这些问题没答案,所谓「交易逻辑」只是情绪和印象的混合物。
量化的第一步,就是把模糊语言翻译成规则语言。比如把「感觉要突破」翻译成:「若收盘价创过去 60 个交易日新高,且 20 日均线向上、成交额不低于过去 20 日均值的 0.8 倍,则于下一交易日开盘买入,仓位 30%;若收盘价跌破 20 日均线则卖出。」
这套规则未必赚钱。但它有两个主观判断没有的优点:可执行,可回测。
这就是量化的本质——把交易从「临场发挥」变成「规则系统」。就像《原子习惯》里说的:不要关注目标,要关注系统。目标是「我要赚钱」,系统是「我用什么规则做决策、怎么检验、怎么改进」。
量化系统可以简单到一条均线加一条止损线,也可以复杂到多因子加机器学习。但不管多复杂,做的都是同一件事:用明确规则替代模糊直觉。
一个成熟的量化系统至少包含四层。研究层提出假设——市场里可能存在什么规律。验证层用历史数据检验假设是否成立。执行层把信号转成订单。风控层在系统出错或市场异常时保护账户。
很多人以为核心是公式。其实核心是系统——是这四层之间的配合方式。
二、四种常见误解
关于量化,最常见的误解有四种。有意思的是,每一种误解都来自同一个心理根源:人们总希望找到一条不需要持续努力的捷径。
误解一:量化等于人工智能
很多人觉得只有用了深度学习才算量化。事实上,大量真正有效的策略都非常朴素——趋势跟随、资产轮动、均值回归、再平衡。只要规则明确、可回测、可执行、可管理风险,就是量化。
很多初学者一上来就想做 AI 选股,连数据清洗和信号定义都没弄清就放弃了。这就像一个人还没养成每天跑步的习惯,就去报名超级马拉松。先从小习惯开始,比一步到位更重要。
误解二:量化等于高频交易
高频交易是量化的一个很窄的分支,需要超低延迟和专业基础设施。沪深交易所的认定标准是:单个账户每秒申报撤单 300 笔以上或单日 20000 笔以上。
个人投资者真正适合做的是日频或周频策略。你的优势在于你可以慢、可以简单、可以专注。就像习惯养成一样,持续做简单但正确的事,远比偶尔做一次复杂的事更有效。
误解三:量化天然更客观
程序减少了情绪干扰,但不会自动消灭偏见。你用什么数据、怎么复权、如何定义信号、有没有偷看未来数据、回测里忽略了多少成本——这些偏差,程序一个都不会帮你修正。
量化把自欺欺人的方式从「拍脑袋」升级成了「写代码骗自己」。认识到这一点,恰恰是成长的开始。
误解四:量化是一劳永逸的赚钱机器
市场环境会变,资金结构会变,策略拥挤度会变。量化系统不是设置好就不用管的闹钟,而是需要持续校准的仪器。就像健身一样——你不会因为去了三个月健身房就「永远健康」了。系统需要维护,习惯需要坚持。
三、一个量化系统的完整结构
学量化,最重要的不是记住指标名称,而是先在脑子里形成系统地图。
你可以把量化系统想象成五个环环相扣的习惯,每一个都不可或缺。
数据层——「身份认同」的基础。 没有干净的数据,一切都是空中楼阁。你至少需要行情数据、交易日历、标的信息、复权信息。核心问题不是「有没有数据」,而是数据是否干净、连续、口径一致,是否能还原当时真实可得的信息。
策略层——「提示」和「渴望」。 这里负责把想法翻译成信号。趋势会延续?定义趋势。强者恒强?把「强」转成指标。相信均值回归?把偏离度写成公式。策略层做的不是讲故事,而是写条件链。
组合层——「反应」的设计。 很多人只关心「买什么」,忽略「买多少」。仓位管理往往比选标的更重要。全仓还是等权?按波动率调整还是设暴露上限?组合层回答的是:即便信号对了,我该以什么方式承接这个判断。
执行层——「奖赏」的真实兑现。 信号不等于成交。你是收盘生成信号、下一开盘成交?考虑了滑点吗?考虑了成交量约束吗?执行层不光鲜,但它决定了你的研究离真实世界有多远。
风控与复盘层——「环境设计」。 成熟的系统不只抓机会,还要限制错误。单日亏损过大是否触发降仓?数据更新失败是否自动中止?还要有日志和报告,记录每个操作的原因。没有复盘的量化不是系统,是自动化的冲动。
好的量化项目未必复杂,但一定结构清楚。就像好的习惯系统——简单、明确、可持续。
四、为什么 A 股新手更适合从 ETF 开始
在习惯养成里有一个核心原则:从最小可行版本开始。 不要想着第一天就做到完美,先做到「足够小、能完成」。
ETF 就是量化的最小可行版本。
它帮你隔离了大量个股层面的复杂性:业绩爆雷、黑天鹅、停牌断层、题材熄火、ST 和退市风险。你在 ETF 上先把数据、回测、信号、报告的完整闭环打通,学习效率会高很多。
对初学者来说,建造研究系统比追求 alpha 重要得多。个股策略会迅速把你拖进复杂度泥潭——股票池选择、财务数据频率、调仓日和财报日对齐、停牌处理、涨跌停限制、分红送转、成分股回溯。这些都值得学,但它们是第二阶段的课题。
ETF 更像一块干净的实验台。你可以很快做出完整闭环:下载数据 → 计算信号 → 生成持仓 → 跑净值曲线 → 算指标 → 做报告 → 样本外验证。
对个人开发者来说,「先把小系统跑起来」的成就感极其重要。这就像习惯养成中的「两分钟法则」——先做两分钟能做到的事。量化最怕的不是策略差,而是工程项目太大,最后什么都没做完。
在 A 股语境里,证监会明确提出「先报告、后交易」。入门者先做研究、回测、信号输出、日报生成,再逐步走向半自动决策支持,是更务实也更合规的路径。
五、数据:量化的地基,也是最大的坑
量化世界有一句老话:垃圾进,垃圾出。
几乎所有初学者都在数据层吃亏。因为大多数人把精力花在策略公式上,却发现真正决定结果有没有意义的,是那些看起来很琐碎的细节:交易日对齐了吗?复权正确吗?停牌日有空缺吗?某些字段在当时能不能拿到?
以 Tushare Pro 为例。A 股日线接口默认是未复权行情,停牌期间不提供数据。这些信息看起来只是 API 说明,对量化来说却是生死线级别的细节。
忘了复权,趋势信号会被分红扭曲。没意识到停牌无数据,回测会把「没交易」误当成「价格稳定」。没用交易日历对齐,不同标的之间的比较会错位。
复权其实很简单。它只是说:历史价格要放在同一把尺子上看。基金分红或股票送转之后不做处理,价格图会出现假断层,你的均线和突破信号都会被误导。
还有一个重要概念叫「点时可得性」——你在某个交易日做决策时,到底能看到哪些信息?如果某份财报 4 月 30 日才发布,你在 4 月 10 日的回测里就不能用其中的数据。
量化里最值钱的一种诚实:承认当时的你不知道后来发生的事。
实用建议:建立本地数据缓存。 把数据源当采集器,本地 Parquet 或 SQLite 当真相源。先落地、清洗、标准化,再由回测模块读取。这样不仅更快,更重要的是可复现。
数据问题不是解决一次就没事了。每引入新资产、新字段,问题都会重新出现。成熟的做法是默认数据迟早会出问题,在系统里为校验、缺失处理和异常中止留好位置。就像习惯系统需要「防失败机制」一样,数据系统也需要。
六、新手最值得先掌握的两类策略
「到底先学哪种策略?」这是入门者最焦虑的问题。
我的建议:先学趋势,再学轮动。不是因为最赚钱,而是因为最适合当学习框架。就像你学编程应该先写 Hello World,而不是直接做操作系统。
趋势跟随
最典型的是双均线策略。规则很简单:短均线上穿长均线买入,跌破卖出。或者更简单——收盘价站上长期均线就持有,跌破就空仓。
趋势策略直观、容易回测。你很快会看到它真正的面貌:单边上涨时能吃到大段行情,震荡市里来回打脸。
但它的真正价值不在于赚多少,而在于它会逼你面对一系列关键问题:信号按收盘价还是盘中生成?成交假设放在下一开盘还是下一收盘?参数该固定还是搜索?手续费和滑点会不会把优势吃掉?
极简版实践: 一只宽基 ETF,20 日和 60 日均线。20 日在 60 日上方且空仓就买,跌回下方且持仓就卖。跑出净值曲线,观察回撤和换手频率。
做完这一轮,你得到的不是圣杯,而是第一份真正属于自己的量化实验报告。这份报告就是你的「第一个小胜利」——它会给你继续走下去的动力。
ETF 轮动
背后的想法是:强势资产可能继续强势。选几个 ETF,按过去一段时间的收益打分,定期持有得分最高的。加绝对动量过滤:标的本身收益为正时才买入,否则空仓。
轮动比趋势多了一层横向比较,但没有个股多因子那么复杂。你可以快速学到组合调仓、排序逻辑、再平衡频率、换手率控制这些更贴近真实资产配置的能力。
关于多因子和机器学习
可以最终走到那里,但别当第一站。那个世界的复杂度会瞬间包围你:财务数据时效性、幸存者偏差、行业中性化、极值处理、样本穿越、特征泄露。
先把简单系统做扎实。大厦是一砖一瓦建起来的,不是一夜之间从天上掉下来的。
七、回测:量化里最重要,也最容易骗人的环节
量化最吸引人的地方是回测。量化最危险的地方也是回测。
一条漂亮的历史净值曲线,会产生一种几乎无法抗拒的错觉:过去这么有效,未来也差不多。但回测不是承诺——它只是在一组历史条件下、基于一套假设做的模拟实验。
回测有五个经典陷阱。理解它们比学会任何指标都重要。
1. 未来函数。 在历史里使用了当时不可能知道的信息。比如用收盘价假设盘中成交,用季报公布后的数据在公布前选股。不会报错,但结果是虚构的。
2. 幸存者偏差。 只拿今天还在的标的回看过去。退市的、清盘的被无声删掉了。就像你只看成功案例来总结「成功法则」——这不叫研究,叫自我安慰。
3. 信号与成交混淆。 收盘后才能确认信号,却假设当日就能买入。一个细节让回测大幅缩水。
4. 忽略交易成本。 零摩擦世界里的惊艳策略,加入真实成本后变平庸甚至转负。
5. 过拟合。 不断调参数直到找到在过去完美的组合。这组参数很可能只是「刚好适配历史」。过拟合最坏的地方是它给你最强的心理奖励——「找到了!」——恰恰在你最该怀疑的时候。
成熟的回测会设计一整套防自欺机制:样本内外拆分、walk-forward 滚动验证、参数敏感性分析、不同市场阶段对比、强制加入成本、数据版本固定。
这就像养成好习惯需要「环境设计」一样——你不能靠意志力来保证诚实,你需要设计一套让你很难骗自己的流程。
回测真正的价值不是让你兴奋,而是让你清醒。
八、怎样读懂一份回测报告
大多数人看回测报告,第一眼盯着总收益率。这没错,但如果只看这个数字,很容易被误导。
一份有用的报告至少回答四个问题:赚不赚钱?过程难不难熬?靠什么赚的?什么情况下最脆弱?
收益。 年化收益率必须放在风险背景里看。年化 18% 最大回撤 55%,和年化 12% 最大回撤 12%,不能用简单算术比。决定能不能长期拿住的,是亏损的可承受性。
回撤。 最大回撤是账户从高点到低点最深的那个坑。数学不对称:回撤 10% 需涨 11% 回本,回撤 20% 需涨 25%,回撤 50% 需涨 100%。风控不是保守,是复利的数学前提。就像习惯中断后的恢复——中断越久,重新开始越难。不要让回撤「中断」你的复利。
夏普、波动率、卡玛比率。 衡量收益的平滑程度和回撤效率。过程像心电图一样剧烈抽搐的策略,几乎无法坚持。
胜率。 高胜率不等于高收益。80% 胜率每次小赚偶尔大亏,总体可能是负的。真正重要的是盈亏比和长期期望值。
换手率。 太高意味着成本和心理疲劳被放大。低频、稳定、能解释的策略,比高频炫目的策略更适合长期推进。这就像好习惯——简单、可持续、不需要英雄式的意志力。
成熟的报告包含:分年度表现、月度收益分布、回撤区间、持仓变化、交易摘要、参数说明、成本假设和失败阶段分析。
九、风控不是附属品,而是系统的一部分
很多人把风控理解成「出问题了就止损」。这太窄了。
风控不是补丁。它应该从策略设计的第一天就存在。你设计的不是「怎样赚」,而是「怎样在可能赚钱的同时不被打死」。就像好的习惯系统,关键不在于巅峰时能做到多好,而在于低谷时能守住多少。
仓位——最基础的风控。 10% 仓位和满仓是两个完全不同的游戏。仓位管理的本质不是让收益变低,而是让你有资格活到下一次机会。这就是「永远不要跌出游戏」的原则。
分散和暴露管理。 几个看似不同的 ETF 可能高度相关。分散不是数量问题,是暴露结构问题。
退出机制。 什么时候减仓、空仓、停止交易、认定策略失效,都应该前置。退出不靠情绪。你可以用价格、波动率、回撤、信号反转来定义退出,但不要让「再等等看」成为默认。
操作和工程层面。 数据更新失败怎么办?接口异常怎么办?回测结果突变怎么办?工程失误造成的损失可能比市场波动更大。
风控不是悲观。是提前承认自己一定会犯错,然后为错误设计边界。就像习惯系统里的「实施意图」——提前决定好「如果 X 发生,我就做 Y」,而不是等问题出现再临时决定。
十、把量化当技术项目来做
如果你把量化只当几个公式,会很快碰到天花板。让量化变成可持续能力的,是工程化。
这就像健身——偶尔去一次健身房不会改变你的身体,但建立一套每周训练的系统会。
项目结构要清晰。 数据采集、清洗、策略、回测、指标、报告各有边界。不要塞进一个 Notebook。量化项目没有边界,每个新需求都会引入混乱。
结果要可复现。 今天跑出来的结果下周还能复现吗?配置文件、数据版本、日志输出、结果归档——这些是区分业余和专业的分界线。
研究和执行分离。 研究提出和验证假设。执行翻译成操作。最好的第一阶段不是自动下单,而是每天更新数据 → 计算信号 → 生成报告 → 输出候选动作 → 人工确认。系统化加人工风控。
测试要有敬畏心。 均线计算对不对?交易日对齐对不对?手续费有没有重复扣?最可怕的错误不是程序崩溃,而是程序看起来正常运行却在给你错误结论。
量化是交易、数据、统计、工程和自我管理的交叉点。会写策略的人很多。能把系统搭稳的人,才是真正有护城河的人。
十一、一个适合个人开发者的 90 天入门路径
好的习惯系统从不要求你一步登天。它要求你:先做到,再做好,最后做得更好。
量化入门也是如此。用三个月做出一个小闭环,而不是用半年追求一个顶级系统。
第一个月:做到
目标只有一个——跑通最简单的单策略回测。
- 选一两只宽基 ETF
- 建立本地数据缓存
- 写一个双均线策略
- 跑出净值曲线、收益、最大回撤、交易记录
不追求策略多强。只要逻辑清楚、结果可重复、能解释每笔交易为什么发生。这就是你的「两分钟版本」——最小可行习惯。
第二个月:做好
从单策略升级到可比较的小平台。
- 加入 ETF 轮动策略
- 增加参数配置文件
- 加入样本内外拆分、交易成本和滑点
- 生成 Markdown 或 HTML 报告
到这一步,你不再是在「试着写个策略」,而是在做一个研究工具。
第三个月:做得更好
验证而非炫技。
- Walk-forward 验证
- 参数敏感性分析
- 切换不同 ETF 池子测试
- 每天自动生成次日候选持仓
关键不是系统越来越复杂,而是复杂一点之后还能保持清晰和可解释。
三个月后你可能还没赚到大钱。但你会拥有一套可持续迭代的金融实验系统。就像你养成了一个好习惯——它不会在第一天就改变你的人生,但它会随着时间的推移,产生复合效应。
十二、为什么很多回测很好看,实盘却很难受
几乎每个做量化的人都会遇到这个问题。
回测知道结局,实盘不知道。 回测里你看到完整曲线,知道哪次下跌只是暂时的。实盘里未来是黑的。连续亏损三周时,你不知道这是正常波动还是策略失效。
这就像看别人的习惯养成故事——你看到的是结果,看不到中间那些想放弃的日子。
实盘比回测多了大量摩擦。 忘记更新数据、手动确认时犹豫、实际成交和假设不一致、流动性不足、系统异常。单笔看不大,长期叠加显著改变结果。
回测时会不自觉地挑自己喜欢的结果。 不好看的参数和时段被无意识筛掉。实盘亏钱时,不是市场不讲理,而是你研究时就偏向了自己想看的答案。
实盘和回测之间最重要的桥梁,不是找更强的策略,而是:让假设更接近现实,让执行更接近纪律,让心理预期更接近真实的亏损体验。
成熟的量化不是回测有多漂亮,而是回测和实盘之间的落差有多小。
十三、几个高频问题的真回答
零基础能学量化吗? 能。需要一组基础能力:一点 Python,一点数据处理,一点统计常识,一点交易规则理解,再加长期做项目的耐心。真正难的不是写第一段代码,而是把杂乱知识拼成稳定系统。就像养成习惯,难的不是第一天,而是第三十天。
必须先学高级数学和机器学习? 不必。入门阶段最重要的是把简单规则做正确。先学会定义问题、清洗数据、做回测、看报告、控风险。很多人不是输在不会高级数学,而是输在不会老老实实做基础工作。
资金小有必要做量化吗? 有。入门阶段最大的产出是方法,不是收益。小资金反而适合做实验。就像学习任何技能——先用低风险的方式练习,等到真正上场时你已经有了肌肉记忆。
要不要一开始就全自动下单? 通常不必。A 股程序化交易有明确规则和报告要求。先做研究、回测、信号输出、人工确认,就是完整闭环。自动化应该是系统成熟后自然发生的事。
神策略能直接抄吗? 可以研究,但先问四个问题:数据口径?执行假设?成本计算?样本外成立吗?很多公开策略最厉害的地方,不是真的无敌,而是省略了让结果变差的细节。
回测不够漂亮就没价值? 不一定。真实可用的策略往往只是「逻辑清楚、回撤可控、样本外没崩」。平庸但稳定,比惊艳但脆弱更有价值。就像好习惯不需要多么耀眼,关键是你能坚持多久。
什么时候算真正入门? 当你能完整回答这些问题的时候:系统为什么可能有效?依赖什么前提?最可能在哪里失效?成本和摩擦是什么?风险边界在哪里?失效时你怎么处理?
能回答这些,才说明你从「写代码的人」变成了「做系统的人」。
结语
量化炒股听起来像金融技术。做久了你会发现,它训练的首先是一种思维方式——系统思维。
把模糊直觉翻译成清楚规则。把想象中的优势放进严格验证。把「我可能是对的」换成「我怎样证明自己不是在骗自己」。
它不是圣杯,不会消灭亏损和焦虑。它甚至比主观交易更残酷——它会把你的错误一条条暴露出来,没有「运气不好」的借口。
但正因如此,量化才值得学。它会逼你把交易从情绪反应变成系统工程,从运气驱动变成流程驱动,从一时冲动变成长期可复盘的能力。
真正的量化入门,不是找到一套神秘公式。而是开始愿意承认:市场很复杂,自己会犯错,任何优势都必须经过检验,任何收益都要付出风险代价,任何系统都需要维护。
就像好习惯一样——量化不会在第一天就改变你的交易结果。但如果你认真对待它,持续迭代,它会随着时间产生复合效应。
三个月后你可能还看不出太大变化。一年后你回头看,会发现自己已经走得很远了。
而这种缓慢但持续的进步,才是量化最有价值的地方。