量化炒股入门：把凭感觉买卖变成用系统做决策

本文仅供学习交流，不构成投资建议。

2003 年，英国自行车队连续近一百年没有在环法赛上获胜。然后他们请来了一位新教练戴夫·布雷斯福德。他没有重新发明自行车，也没有引进什么秘密训练法。他做的事情很朴素：把骑车这件事拆成几百个微小环节，然后在每个环节上改善 1%——坐垫高度、轮胎气压、骑手睡眠、手部清洁方式。五年后，英国队在环法和奥运会上都拿了冠军。

量化炒股的逻辑和这个故事惊人地相似。

大多数人第一次听到「量化炒股」，想到的是几块屏幕、跳动的数字、一个自动赚钱的程序。这个画面不算完全错，但它遮住了最重要的部分。量化的核心不是找到一个神秘公式，而是把交易这件事拆成可以被检验的环节，然后在每个环节上做得更系统、更诚实、更可复现。

在 A 股的官方定义里，程序化交易是「通过计算机程序自动生成或下达交易指令进行证券交易」。相关规定已于 2024 年施行，沪深交易所实施细则落地，深交所明确个人投资者也可以参与。量化不是灰色地带，而是一种有明确规则和合规要求的交易方式。

学量化的第一步，不是去找「胜率最高的指标」或者「年化 80% 的神策略」。第一步是建立一个认知——

量化不替你思考。它只是逼你把思考变成系统。

你原来凭感觉做的判断，在量化里必须变成明确条件。你原来靠「应该没事」硬扛的亏损，必须变成事先定义好的风险阈值。你原来在行情好时无所不能、行情差时怀疑人生的情绪波动，在量化里都会被记录、被检验。

量化最大的价值，不是让你立刻赚更多钱，而是把「我觉得」变成「在什么条件下我会这么做，以及这么做的长期结果大概是什么」。这就是从「靠目标驱动」到「靠系统驱动」的转变。

一、量化炒股到底是什么

把交易拆开看，它就是一串连续的决定：买什么、什么时候买、买多少、什么时候卖、亏多少停、赚多少走、什么时候空仓、什么时候降仓位。

主观交易者在看到行情之后临时做这些决定。量化交易者先把这些问题回答好，再用规则和程序去执行。

这个区别看一个例子就够了。

一个主观交易者说：「这只 ETF 最近走势不错，感觉要突破了。」这句话听上去像判断，但它经不起追问。什么叫「走势不错」？什么叫「要突破」？突破到什么程度算成立？回落多少算失败？仓位该多大？第二天低开怎么办？

这些问题没答案，所谓「交易逻辑」只是情绪和印象的混合物。

量化的第一步，就是把模糊语言翻译成规则语言。比如把「感觉要突破」翻译成：「若收盘价创过去 60 个交易日新高，且 20 日均线向上、成交额不低于过去 20 日均值的 0.8 倍，则于下一交易日开盘买入，仓位 30%；若收盘价跌破 20 日均线则卖出。」

这套规则未必赚钱。但它有两个主观判断没有的优点：可执行，可回测。

这就是量化的本质——把交易从「临场发挥」变成「规则系统」。就像《原子习惯》里说的：不要关注目标，要关注系统。目标是「我要赚钱」，系统是「我用什么规则做决策、怎么检验、怎么改进」。

量化系统可以简单到一条均线加一条止损线，也可以复杂到多因子加机器学习。但不管多复杂，做的都是同一件事：用明确规则替代模糊直觉。

一个成熟的量化系统至少包含四层。研究层提出假设——市场里可能存在什么规律。验证层用历史数据检验假设是否成立。执行层把信号转成订单。风控层在系统出错或市场异常时保护账户。

很多人以为核心是公式。其实核心是系统——是这四层之间的配合方式。

二、四种常见误解

关于量化，最常见的误解有四种。有意思的是，每一种误解都来自同一个心理根源：人们总希望找到一条不需要持续努力的捷径。

误解一：量化等于人工智能

很多人觉得只有用了深度学习才算量化。事实上，大量真正有效的策略都非常朴素——趋势跟随、资产轮动、均值回归、再平衡。只要规则明确、可回测、可执行、可管理风险，就是量化。

很多初学者一上来就想做 AI 选股，连数据清洗和信号定义都没弄清就放弃了。这就像一个人还没养成每天跑步的习惯，就去报名超级马拉松。先从小习惯开始，比一步到位更重要。

误解二：量化等于高频交易

高频交易是量化的一个很窄的分支，需要超低延迟和专业基础设施。沪深交易所的认定标准是：单个账户每秒申报撤单 300 笔以上或单日 20000 笔以上。

个人投资者真正适合做的是日频或周频策略。你的优势在于你可以慢、可以简单、可以专注。就像习惯养成一样，持续做简单但正确的事，远比偶尔做一次复杂的事更有效。

误解三：量化天然更客观

程序减少了情绪干扰，但不会自动消灭偏见。你用什么数据、怎么复权、如何定义信号、有没有偷看未来数据、回测里忽略了多少成本——这些偏差，程序一个都不会帮你修正。

量化把自欺欺人的方式从「拍脑袋」升级成了「写代码骗自己」。认识到这一点，恰恰是成长的开始。

误解四：量化是一劳永逸的赚钱机器

市场环境会变，资金结构会变，策略拥挤度会变。量化系统不是设置好就不用管的闹钟，而是需要持续校准的仪器。就像健身一样——你不会因为去了三个月健身房就「永远健康」了。系统需要维护，习惯需要坚持。

三、一个量化系统的完整结构

学量化，最重要的不是记住指标名称，而是先在脑子里形成系统地图。

你可以把量化系统想象成五个环环相扣的习惯，每一个都不可或缺。

数据层——「身份认同」的基础。 没有干净的数据，一切都是空中楼阁。你至少需要行情数据、交易日历、标的信息、复权信息。核心问题不是「有没有数据」，而是数据是否干净、连续、口径一致，是否能还原当时真实可得的信息。

策略层——「提示」和「渴望」。 这里负责把想法翻译成信号。趋势会延续？定义趋势。强者恒强？把「强」转成指标。相信均值回归？把偏离度写成公式。策略层做的不是讲故事，而是写条件链。

组合层——「反应」的设计。 很多人只关心「买什么」，忽略「买多少」。仓位管理往往比选标的更重要。全仓还是等权？按波动率调整还是设暴露上限？组合层回答的是：即便信号对了，我该以什么方式承接这个判断。

执行层——「奖赏」的真实兑现。 信号不等于成交。你是收盘生成信号、下一开盘成交？考虑了滑点吗？考虑了成交量约束吗？执行层不光鲜，但它决定了你的研究离真实世界有多远。

风控与复盘层——「环境设计」。 成熟的系统不只抓机会，还要限制错误。单日亏损过大是否触发降仓？数据更新失败是否自动中止？还要有日志和报告，记录每个操作的原因。没有复盘的量化不是系统，是自动化的冲动。

好的量化项目未必复杂，但一定结构清楚。就像好的习惯系统——简单、明确、可持续。

四、为什么 A 股新手更适合从 ETF 开始

在习惯养成里有一个核心原则：从最小可行版本开始。 不要想着第一天就做到完美，先做到「足够小、能完成」。

ETF 就是量化的最小可行版本。

它帮你隔离了大量个股层面的复杂性：业绩爆雷、黑天鹅、停牌断层、题材熄火、ST 和退市风险。你在 ETF 上先把数据、回测、信号、报告的完整闭环打通，学习效率会高很多。

对初学者来说，建造研究系统比追求 alpha 重要得多。个股策略会迅速把你拖进复杂度泥潭——股票池选择、财务数据频率、调仓日和财报日对齐、停牌处理、涨跌停限制、分红送转、成分股回溯。这些都值得学，但它们是第二阶段的课题。

ETF 更像一块干净的实验台。你可以很快做出完整闭环：下载数据 → 计算信号 → 生成持仓 → 跑净值曲线 → 算指标 → 做报告 → 样本外验证。

对个人开发者来说，「先把小系统跑起来」的成就感极其重要。这就像习惯养成中的「两分钟法则」——先做两分钟能做到的事。量化最怕的不是策略差，而是工程项目太大，最后什么都没做完。

在 A 股语境里，证监会明确提出「先报告、后交易」。入门者先做研究、回测、信号输出、日报生成，再逐步走向半自动决策支持，是更务实也更合规的路径。

五、数据：量化的地基，也是最大的坑

量化世界有一句老话：垃圾进，垃圾出。

几乎所有初学者都在数据层吃亏。因为大多数人把精力花在策略公式上，却发现真正决定结果有没有意义的，是那些看起来很琐碎的细节：交易日对齐了吗？复权正确吗？停牌日有空缺吗？某些字段在当时能不能拿到？

以 Tushare Pro 为例。A 股日线接口默认是未复权行情，停牌期间不提供数据。这些信息看起来只是 API 说明，对量化来说却是生死线级别的细节。

忘了复权，趋势信号会被分红扭曲。没意识到停牌无数据，回测会把「没交易」误当成「价格稳定」。没用交易日历对齐，不同标的之间的比较会错位。

复权其实很简单。它只是说：历史价格要放在同一把尺子上看。基金分红或股票送转之后不做处理，价格图会出现假断层，你的均线和突破信号都会被误导。

还有一个重要概念叫「点时可得性」——你在某个交易日做决策时，到底能看到哪些信息？如果某份财报 4 月 30 日才发布，你在 4 月 10 日的回测里就不能用其中的数据。

量化里最值钱的一种诚实：承认当时的你不知道后来发生的事。

实用建议：建立本地数据缓存。 把数据源当采集器，本地 Parquet 或 SQLite 当真相源。先落地、清洗、标准化，再由回测模块读取。这样不仅更快，更重要的是可复现。

数据问题不是解决一次就没事了。每引入新资产、新字段，问题都会重新出现。成熟的做法是默认数据迟早会出问题，在系统里为校验、缺失处理和异常中止留好位置。就像习惯系统需要「防失败机制」一样，数据系统也需要。

六、新手最值得先掌握的两类策略

「到底先学哪种策略？」这是入门者最焦虑的问题。

我的建议：先学趋势，再学轮动。不是因为最赚钱，而是因为最适合当学习框架。就像你学编程应该先写 Hello World，而不是直接做操作系统。

趋势跟随

最典型的是双均线策略。规则很简单：短均线上穿长均线买入，跌破卖出。或者更简单——收盘价站上长期均线就持有，跌破就空仓。

趋势策略直观、容易回测。你很快会看到它真正的面貌：单边上涨时能吃到大段行情，震荡市里来回打脸。

但它的真正价值不在于赚多少，而在于它会逼你面对一系列关键问题：信号按收盘价还是盘中生成？成交假设放在下一开盘还是下一收盘？参数该固定还是搜索？手续费和滑点会不会把优势吃掉？

极简版实践： 一只宽基 ETF，20 日和 60 日均线。20 日在 60 日上方且空仓就买，跌回下方且持仓就卖。跑出净值曲线，观察回撤和换手频率。

做完这一轮，你得到的不是圣杯，而是第一份真正属于自己的量化实验报告。这份报告就是你的「第一个小胜利」——它会给你继续走下去的动力。

ETF 轮动

背后的想法是：强势资产可能继续强势。选几个 ETF，按过去一段时间的收益打分，定期持有得分最高的。加绝对动量过滤：标的本身收益为正时才买入，否则空仓。

轮动比趋势多了一层横向比较，但没有个股多因子那么复杂。你可以快速学到组合调仓、排序逻辑、再平衡频率、换手率控制这些更贴近真实资产配置的能力。

关于多因子和机器学习

可以最终走到那里，但别当第一站。那个世界的复杂度会瞬间包围你：财务数据时效性、幸存者偏差、行业中性化、极值处理、样本穿越、特征泄露。

先把简单系统做扎实。大厦是一砖一瓦建起来的，不是一夜之间从天上掉下来的。

七、回测：量化里最重要，也最容易骗人的环节

量化最吸引人的地方是回测。量化最危险的地方也是回测。

一条漂亮的历史净值曲线，会产生一种几乎无法抗拒的错觉：过去这么有效，未来也差不多。但回测不是承诺——它只是在一组历史条件下、基于一套假设做的模拟实验。

回测有五个经典陷阱。理解它们比学会任何指标都重要。

1. 未来函数。 在历史里使用了当时不可能知道的信息。比如用收盘价假设盘中成交，用季报公布后的数据在公布前选股。不会报错，但结果是虚构的。

2. 幸存者偏差。 只拿今天还在的标的回看过去。退市的、清盘的被无声删掉了。就像你只看成功案例来总结「成功法则」——这不叫研究，叫自我安慰。

3. 信号与成交混淆。 收盘后才能确认信号，却假设当日就能买入。一个细节让回测大幅缩水。

4. 忽略交易成本。 零摩擦世界里的惊艳策略，加入真实成本后变平庸甚至转负。

5. 过拟合。 不断调参数直到找到在过去完美的组合。这组参数很可能只是「刚好适配历史」。过拟合最坏的地方是它给你最强的心理奖励——「找到了！」——恰恰在你最该怀疑的时候。

成熟的回测会设计一整套防自欺机制：样本内外拆分、walk-forward 滚动验证、参数敏感性分析、不同市场阶段对比、强制加入成本、数据版本固定。

这就像养成好习惯需要「环境设计」一样——你不能靠意志力来保证诚实，你需要设计一套让你很难骗自己的流程。

回测真正的价值不是让你兴奋，而是让你清醒。

八、怎样读懂一份回测报告

大多数人看回测报告，第一眼盯着总收益率。这没错，但如果只看这个数字，很容易被误导。

一份有用的报告至少回答四个问题：赚不赚钱？过程难不难熬？靠什么赚的？什么情况下最脆弱？

收益。 年化收益率必须放在风险背景里看。年化 18% 最大回撤 55%，和年化 12% 最大回撤 12%，不能用简单算术比。决定能不能长期拿住的，是亏损的可承受性。

回撤。 最大回撤是账户从高点到低点最深的那个坑。数学不对称：回撤 10% 需涨 11% 回本，回撤 20% 需涨 25%，回撤 50% 需涨 100%。风控不是保守，是复利的数学前提。就像习惯中断后的恢复——中断越久，重新开始越难。不要让回撤「中断」你的复利。

夏普、波动率、卡玛比率。 衡量收益的平滑程度和回撤效率。过程像心电图一样剧烈抽搐的策略，几乎无法坚持。

胜率。 高胜率不等于高收益。80% 胜率每次小赚偶尔大亏，总体可能是负的。真正重要的是盈亏比和长期期望值。

换手率。 太高意味着成本和心理疲劳被放大。低频、稳定、能解释的策略，比高频炫目的策略更适合长期推进。这就像好习惯——简单、可持续、不需要英雄式的意志力。

成熟的报告包含：分年度表现、月度收益分布、回撤区间、持仓变化、交易摘要、参数说明、成本假设和失败阶段分析。

九、风控不是附属品，而是系统的一部分

很多人把风控理解成「出问题了就止损」。这太窄了。

风控不是补丁。它应该从策略设计的第一天就存在。你设计的不是「怎样赚」，而是「怎样在可能赚钱的同时不被打死」。就像好的习惯系统，关键不在于巅峰时能做到多好，而在于低谷时能守住多少。

仓位——最基础的风控。 10% 仓位和满仓是两个完全不同的游戏。仓位管理的本质不是让收益变低，而是让你有资格活到下一次机会。这就是「永远不要跌出游戏」的原则。

分散和暴露管理。 几个看似不同的 ETF 可能高度相关。分散不是数量问题，是暴露结构问题。

退出机制。 什么时候减仓、空仓、停止交易、认定策略失效，都应该前置。退出不靠情绪。你可以用价格、波动率、回撤、信号反转来定义退出，但不要让「再等等看」成为默认。

操作和工程层面。 数据更新失败怎么办？接口异常怎么办？回测结果突变怎么办？工程失误造成的损失可能比市场波动更大。

风控不是悲观。是提前承认自己一定会犯错，然后为错误设计边界。就像习惯系统里的「实施意图」——提前决定好「如果 X 发生，我就做 Y」，而不是等问题出现再临时决定。

十、把量化当技术项目来做

如果你把量化只当几个公式，会很快碰到天花板。让量化变成可持续能力的，是工程化。

这就像健身——偶尔去一次健身房不会改变你的身体，但建立一套每周训练的系统会。

项目结构要清晰。 数据采集、清洗、策略、回测、指标、报告各有边界。不要塞进一个 Notebook。量化项目没有边界，每个新需求都会引入混乱。

结果要可复现。 今天跑出来的结果下周还能复现吗？配置文件、数据版本、日志输出、结果归档——这些是区分业余和专业的分界线。

研究和执行分离。 研究提出和验证假设。执行翻译成操作。最好的第一阶段不是自动下单，而是每天更新数据 → 计算信号 → 生成报告 → 输出候选动作 → 人工确认。系统化加人工风控。

测试要有敬畏心。 均线计算对不对？交易日对齐对不对？手续费有没有重复扣？最可怕的错误不是程序崩溃，而是程序看起来正常运行却在给你错误结论。

量化是交易、数据、统计、工程和自我管理的交叉点。会写策略的人很多。能把系统搭稳的人，才是真正有护城河的人。

十一、一个适合个人开发者的 90 天入门路径

好的习惯系统从不要求你一步登天。它要求你：先做到，再做好，最后做得更好。

量化入门也是如此。用三个月做出一个小闭环，而不是用半年追求一个顶级系统。

第一个月：做到

目标只有一个——跑通最简单的单策略回测。

选一两只宽基 ETF
建立本地数据缓存
写一个双均线策略
跑出净值曲线、收益、最大回撤、交易记录

不追求策略多强。只要逻辑清楚、结果可重复、能解释每笔交易为什么发生。这就是你的「两分钟版本」——最小可行习惯。

第二个月：做好

从单策略升级到可比较的小平台。

加入 ETF 轮动策略
增加参数配置文件
加入样本内外拆分、交易成本和滑点
生成 Markdown 或 HTML 报告

到这一步，你不再是在「试着写个策略」，而是在做一个研究工具。

第三个月：做得更好

验证而非炫技。

Walk-forward 验证
参数敏感性分析
切换不同 ETF 池子测试
每天自动生成次日候选持仓

关键不是系统越来越复杂，而是复杂一点之后还能保持清晰和可解释。

三个月后你可能还没赚到大钱。但你会拥有一套可持续迭代的金融实验系统。就像你养成了一个好习惯——它不会在第一天就改变你的人生，但它会随着时间的推移，产生复合效应。

十二、为什么很多回测很好看，实盘却很难受

几乎每个做量化的人都会遇到这个问题。

回测知道结局，实盘不知道。 回测里你看到完整曲线，知道哪次下跌只是暂时的。实盘里未来是黑的。连续亏损三周时，你不知道这是正常波动还是策略失效。

这就像看别人的习惯养成故事——你看到的是结果，看不到中间那些想放弃的日子。

实盘比回测多了大量摩擦。 忘记更新数据、手动确认时犹豫、实际成交和假设不一致、流动性不足、系统异常。单笔看不大，长期叠加显著改变结果。

回测时会不自觉地挑自己喜欢的结果。 不好看的参数和时段被无意识筛掉。实盘亏钱时，不是市场不讲理，而是你研究时就偏向了自己想看的答案。

实盘和回测之间最重要的桥梁，不是找更强的策略，而是：让假设更接近现实，让执行更接近纪律，让心理预期更接近真实的亏损体验。

成熟的量化不是回测有多漂亮，而是回测和实盘之间的落差有多小。

十三、几个高频问题的真回答

零基础能学量化吗？ 能。需要一组基础能力：一点 Python，一点数据处理，一点统计常识，一点交易规则理解，再加长期做项目的耐心。真正难的不是写第一段代码，而是把杂乱知识拼成稳定系统。就像养成习惯，难的不是第一天，而是第三十天。

必须先学高级数学和机器学习？ 不必。入门阶段最重要的是把简单规则做正确。先学会定义问题、清洗数据、做回测、看报告、控风险。很多人不是输在不会高级数学，而是输在不会老老实实做基础工作。

资金小有必要做量化吗？ 有。入门阶段最大的产出是方法，不是收益。小资金反而适合做实验。就像学习任何技能——先用低风险的方式练习，等到真正上场时你已经有了肌肉记忆。

要不要一开始就全自动下单？ 通常不必。A 股程序化交易有明确规则和报告要求。先做研究、回测、信号输出、人工确认，就是完整闭环。自动化应该是系统成熟后自然发生的事。

神策略能直接抄吗？ 可以研究，但先问四个问题：数据口径？执行假设？成本计算？样本外成立吗？很多公开策略最厉害的地方，不是真的无敌，而是省略了让结果变差的细节。

回测不够漂亮就没价值？ 不一定。真实可用的策略往往只是「逻辑清楚、回撤可控、样本外没崩」。平庸但稳定，比惊艳但脆弱更有价值。就像好习惯不需要多么耀眼，关键是你能坚持多久。

什么时候算真正入门？ 当你能完整回答这些问题的时候：系统为什么可能有效？依赖什么前提？最可能在哪里失效？成本和摩擦是什么？风险边界在哪里？失效时你怎么处理？

能回答这些，才说明你从「写代码的人」变成了「做系统的人」。

结语

量化炒股听起来像金融技术。做久了你会发现，它训练的首先是一种思维方式——系统思维。

把模糊直觉翻译成清楚规则。把想象中的优势放进严格验证。把「我可能是对的」换成「我怎样证明自己不是在骗自己」。

它不是圣杯，不会消灭亏损和焦虑。它甚至比主观交易更残酷——它会把你的错误一条条暴露出来，没有「运气不好」的借口。

但正因如此，量化才值得学。它会逼你把交易从情绪反应变成系统工程，从运气驱动变成流程驱动，从一时冲动变成长期可复盘的能力。

真正的量化入门，不是找到一套神秘公式。而是开始愿意承认：市场很复杂，自己会犯错，任何优势都必须经过检验，任何收益都要付出风险代价，任何系统都需要维护。

就像好习惯一样——量化不会在第一天就改变你的交易结果。但如果你认真对待它，持续迭代，它会随着时间产生复合效应。

三个月后你可能还看不出太大变化。一年后你回头看，会发现自己已经走得很远了。

而这种缓慢但持续的进步，才是量化最有价值的地方。

李文业的思考笔记