量化炒股入门：把凭感觉买卖变成用系统做决策

本文仅供学习交流，不构成投资建议。

大多数人对量化炒股的第一印象是错的。

他们想象的画面大概是这样的：几块屏幕、一堆跳动的数字、一段会自动买卖的程序。好像只要把代码写出来，钱就会自己跑进账户。这个画面并非完全荒唐，但它把最重要的东西遮住了。

量化的核心既不是神秘算法，也不是全自动赚钱。它做的事情其实很朴素：把你原来模糊的、情绪化的、临时拍脑袋的交易决定，翻译成一套可以写下来、可以检验、可以复盘、可以改进的规则。

这件事在 A 股的官方语境里其实已经说得很清楚了。证监会把程序化交易定义为「通过计算机程序自动生成或下达交易指令进行证券交易的行为」，相关规定 2024 年起施行，沪深交易所的实施细则也已落地。深交所细则明确写了，程序化交易投资者可以包括个人投资者。换句话说，量化不是什么灰色地带的玩法，而是一种有明确边界、有工程要求、也有合规要求的正规交易方式。

真正想学量化的人，第一步不应该是去找「胜率最高的指标」，也不是搜「年化 80% 的神策略」。第一步应该是建立一个认知：量化不替你思考，它只是逼你把思考变得更严格。

你原来凭感觉做的判断，在量化里必须变成明确条件。你原来靠「应该没事」硬扛的亏损，在量化里必须变成事先定义好的阈值。你原来在牛市里觉得自己是天才、在熊市里怀疑人生的那种情绪波动，在量化里都会被记录下来，然后被检验。

再直白一点说：量化不是更聪明地猜，而是更严格地执行，和更诚实地检验。它最大的价值不是立刻把你变成赚钱机器，而是逼你把「我觉得」变成「在什么条件下我会这么做，以及这么做的长期结果大概是什么」。

一、量化炒股到底是什么

如果你把交易拆开看，会发现它其实就是一串连续的问题：买什么？什么时候买？买多少？什么时候卖？亏多少停？赚多少走？什么时候该空仓？什么时候该减仓？

主观交易者通常是看到行情之后临时做决定。量化交易者则是先把这些问题回答好，再用规则和程序去执行。

区别在哪？举个最简单的例子。

一个主观交易者可能会说：「这只 ETF 最近走势不错，感觉要突破了。」

这句话看上去像判断，但仔细想想，它的信息量几乎为零。什么叫「走势不错」？什么叫「要突破」？突破到什么程度算成立？回落多少算失败？仓位是 20% 还是 100%？第二天低开怎么办？第三天反包又怎么办？

这些问题一旦没有明确答案，所谓的「交易逻辑」其实只是情绪、印象和故事的混合物。

量化做的第一件事，就是把这种模糊语言翻译成机器能理解的规则。比如把「感觉要突破」翻译成：「若收盘价创过去 60 个交易日新高，且 20 日均线向上、成交额不低于过去 20 日均值的 0.8 倍，则于下一交易日开盘买入，仓位 30%；若收盘价跌破 20 日均线则卖出。」

这套规则未必赚钱。但它比主观判断多了两个巨大的优势：第一，它可执行——任何人拿到这段描述都能做出相同操作；第二，它可回测——你能拿历史数据验证它过去的表现。

这就是量化的本质：把交易从「临场发挥」变成「规则系统」。

这个系统可以很简单——一条均线加一条止损线就够了。也可以很复杂——多因子、机器学习、组合优化、执行算法。但不管复杂还是简单，它做的始终是同一件事：用明确的规则替代模糊的直觉。

所以量化不天然等于高深，也不天然等于 AI。它首先是一种方法论，其次才是技术栈。

进一步说，量化也不只管「什么时候买卖」。一个成熟的量化系统至少包含四层。第一层是研究层，负责提出假设：市场里可能存在什么规律。第二层是验证层，用历史数据检验假设是否成立。第三层是执行层，把信号转成实际订单。第四层是风控层，在系统出错、市场异常、模型失效时保护你的账户。

大多数人以为量化的核心是公式。其实真正拉开差距的，是公式背后的系统设计能力。

二、为什么很多人一听量化就误解

关于量化，市场里最常见的误解有四种。有趣的是，这四种误解恰好构成了一条完整的错误认知链。

第一种误解：量化等于人工智能。

很多人觉得，好像只有用了神经网络、深度学习、强化学习，才配叫量化。这完全不对。大量真实可用的量化策略都非常朴素——趋势跟随、资产轮动、均值回归、再平衡、事件驱动。它们可能根本没用到任何复杂模型，但只要规则明确、可回测、可执行、可管理风险，就是量化。

很多初学者一上来就想做「AI 选股」，结果连数据清洗、信号定义、交易成本、样本外验证都没弄清楚，项目就已经烂尾了。这就像一个还没学会走路的人非要去练跑酷。

第二种误解：量化等于高频交易。

高频交易确实属于量化的一部分，但它只是量化世界里非常窄的一个分支。高频强调的是超低延迟、海量订单、微观结构优势，这些东西需要专业级的基础设施。沪深交易所已经给出了明确的高频交易认定标准：单个账户每秒申报撤单达到 300 笔以上，或单日达到 20000 笔以上。

这个标准其实反过来提醒了初学者一件事：你没必要幻想自己在跟机构比速度。你真正该练的是规则设计、数据处理、回测纪律和风控能力。个人投资者真正适合做的，是日频或周频的中低频策略。

第三种误解：量化天然比主观交易更客观。

这个误解尤其危险，因为它听上去很有道理。程序确实能减少情绪干扰，但程序不会自动消灭人的偏见。你用什么数据、怎么做复权、如何定义信号、有没有偷看未来数据、回测里是否忽略了滑点和手续费、参数是不是被你调到了「刚好对历史最有效」的位置——这些偏差，程序一个都帮不了你。

换句话说，量化并不消灭自欺欺人。它只是把自欺欺人的方式从「拍脑袋」升级成了「写代码骗自己」。

第四种误解：量化是一劳永逸的赚钱机器。

很多人以为，只要找到一套历史上有效的规则，往后就能自动印钞。这种想法非常危险。市场环境会变，资金结构会变，交易制度会变，流动性会变，策略拥挤度会变，甚至你依赖的数据接口和口径也可能变。

量化系统不是修好就不用动的水龙头。它更像一台需要持续校准、持续维护、持续复盘的实验装置。没有你想象中那么浪漫，但比你以为的更接近真实世界的运行方式。

三、一个量化系统到底长什么样

想真正学会量化，最重要的不是背几个指标名称，而是先在脑子里形成一张系统地图。你可以把量化系统想象成一条流水线，每一段解决不同的问题。

数据层。 没有数据，量化连起步都不可能。你至少需要行情数据、交易日历、标的信息、复权信息。有些策略还需要财务数据、指数成分、公告事件、行业分类。但数据层真正要解决的问题，不是「有没有数据」，而是「数据是否干净、连续、口径一致，是否能还原当时真实可得的信息」。

策略层。 这里负责把想法翻译成信号。你认为趋势会延续？那就把「趋势」定义清楚。你觉得强者恒强？那就把「强」转成一个可以排序的指标。你相信均值回归？那就把「偏离程度」写成公式。策略层做的不是「编一个故事」，而是「写一条条件链」。

组合层。 很多人一开始只关心「买什么」，却忽略「买多少」。但实际上，仓位管理往往比选标的更重要。你是单标的全仓，还是多标的等权，还是按波动率调整仓位，还是设置行业暴露上限？这些选择会显著影响最终结果。组合层回答的是：即便信号正确，我该以什么方式去承接这个判断。

执行层。 信号不是成交。成交也未必是你回测里设想的价格。你是收盘生成信号、下一开盘成交，还是假设收盘价成交？你考虑了滑点吗？考虑了成交量约束吗？考虑了无法买入或卖出的异常情况吗？执行层不光鲜，但它决定了你的研究离真实世界有多远。

风控与复盘层。 成熟的系统不仅要抓机会，还要限制错误。单日亏损过大是否触发降仓？组合回撤是否触发停机？数据更新失败时是否自动中止？异常行情时是否切回人工确认？还要有报告和日志，让你知道每天为什么买、为什么卖、为什么没动。

没有复盘，量化就不是系统，而只是自动化的冲动。

真正好的量化项目，未必起步复杂，但一定结构清楚。你哪怕只做一只 ETF 的双均线策略，只要把这五层都想明白，学到的东西也远比「抄来一段神奇代码」多得多。

四、为什么 A 股新手更适合从 ETF 开始

我的建议是：先别碰个股量化，先从 ETF 做起。

不是因为个股不值得做，而是因为 ETF 更适合当第一块实验台。它天然帮你平滑掉了很多个股层面的极端事件：业绩爆雷、黑天鹅、停牌复牌断层、题材股瞬间熄火、ST 和退市风险。你在 ETF 上先把数据、回测、信号、报告打通，学习效率会高很多。

还有一个经常被忽略的原因。对初学者来说，研究系统本身比追求 alpha 更重要。

个股策略会很快把你拖进一个复杂世界——股票池怎么选？财务数据用季度值还是滚动值？调仓日和财报发布日期怎么对齐？停牌怎么办？涨跌停买卖不了怎么办？分红送转怎么处理？成分股变更怎么回溯？这些问题都值得学，但它们更适合当第二阶段的课题。

ETF 的好处在于，你可以很快跑出一个完整闭环：下载数据、计算信号、生成持仓、跑净值曲线、算指标、做报告、再做样本外验证。对个人开发者来说，这种「先把小系统跑起来」的成就感至关重要。量化最怕的不是策略差，而是工程项目起得太大，最后什么都没做完。

在 A 股语境里，这种路径也更务实。证监会发布程序化交易管理规定时明确提出「先报告、后交易」，要求投资者按规定报告账户、资金、交易、软件等信息后才可进行程序化交易。对刚入门的人来说，最合适的路径不是一上来就做「无人值守自动报单」，而是先做研究、回测、信号输出、日报生成，再逐步走向半自动决策支持。

把合规意识放在项目初期，比等到准备实盘时再补课要稳得多。

五、数据：量化的地基，也是最大的坑

量化世界里有句老话：垃圾进，垃圾出。

几乎所有初学者都会在数据层吃亏。大多数人把精力花在「策略公式」上，却发现真正决定结果有没有意义的，反而是一些琐碎的细节：交易日是不是对齐了？复权是不是正确？停牌日期有没有空缺？代码映射是否稳定？历史数据有没有重复？某些字段在当时到底能不能拿到？

以 Tushare Pro 为例，它的文档分别提供了 trade_cal 交易日历接口、fund_daily ETF 日线接口、fund_adj 基金复权因子接口。A 股日线接口则明确说明，默认是未复权行情，且停牌期间不提供数据。

这些看上去只是 API 说明，但对量化来说它们几乎是生死线：忘了复权，趋势信号会被分红拆分扭曲；没意识到停牌期间没数据，回测时就可能把「没交易」误当成「价格稳定」；没用交易日历做对齐，不同标的之间的比较就会错位。

很多人一听「复权」就觉得头大。其实复权一点不高深。它只是告诉你：历史价格必须放在同一把尺子上看。如果一只基金分了红，或者一只股票送了股，你不做处理，价格图会突然断一截。而你的策略如果是基于均线、涨跌幅、突破或动量算出来的，它们就会被这次「假断层」误导。结果不是你找到了无敌策略，而是你让错误数据制造了虚假信号。

还有一个容易被忽略的问题：点时可得性。也就是说，你在某个交易日做决策时，到底能看到哪些信息？比如某份财报 4 月 30 日才发布，那你在 4 月 10 日的回测里就不能用其中的数据；某只股票后来被剔出指数，也不代表你可以假装当时就知道它会被剔除。

量化里最值钱的一种诚实，就是承认：当时的你，不知道后来发生的事。

对个人开发者还有一条极其实用的原则：建立本地缓存。不要每次研究都重新在线拉取全部历史数据，也不要让策略直接耦合外部接口。最稳妥的做法是把数据源当「采集器」，把本地 Parquet 或 SQLite 当「真相源」。先落地、清洗、标准化，再由回测模块读取。这样不仅更快，更重要的是可复现——今天的结果、下周的结果、三个月后的结果，至少能在同一份数据快照上讲得通。

最后提醒一句：数据问题不是「前面解决一次就没事了」。每引入一种新资产、新频率、新字段，数据问题都会重新出现。成熟的量化思维不是默认数据没问题，而是默认数据「迟早会出问题」，所以系统里必须给校验、缺失处理、更新日志和异常中止留出位置。

六、新手最值得先掌握的两类策略

「到底先学哪种策略？」这大概是入门者最焦虑的问题。

我的建议很简单：先学趋势，再学轮动。不是因为它们一定最赚钱，而是因为它们最适合当学习框架。

第一类：趋势跟随。

最典型的代表是双均线策略。规则非常朴素：短周期均线向上穿过长周期均线时买入，反向跌破时卖出。或者更简单——收盘价站上某条长期均线就持有，跌破就空仓。

趋势策略直观、容易理解、容易回测。你很快就能看到它真正的优缺点：单边上涨时能吃到大段行情；震荡市里则来回打脸，反复被「洗」。

但趋势策略真正的价值不在于它本身能赚多少，而在于它会逼你思考一系列关键问题：信号按收盘价生成还是盘中生成？成交假设放在下一开盘还是下一收盘？均线参数应该固定还是做网格搜索？空仓时持有现金还是货币 ETF？手续费和滑点会不会把微弱优势吃掉？

一个看似简单的双均线策略，已经足够把量化研究的大多数基本功带出来。

你可以从一个极简版本开始：只研究一只宽基 ETF，每天收盘后检查 20 日均线和 60 日均线。20 日在 60 日上方且当前空仓，就下一交易日开盘买入；20 日跌回 60 日下方且当前持仓，就下一交易日开盘卖出。然后观察净值曲线、最大回撤、换手频率、震荡市表现、趋势市表现。做完这一轮，你得到的不是「圣杯」，而是第一份真正属于自己的量化实验报告。

第二类：ETF 轮动。

背后的想法是：强势资产在一段时间内可能继续强势，弱势资产可能继续弱势。选几个宽基、行业或风格 ETF，按过去 20 日、60 日、120 日的收益或波动率打分，然后在固定周期内持有得分最高的一只或几只。为了避免「在熊市里硬选最强的弱者」，还可以加一个绝对动量过滤：只有入选标的本身收益为正或站在长期均线上方时，才允许买入，否则空仓。

轮动策略比单一趋势多了一层「横向比较」，但又没有个股多因子那么复杂。你可以很快学会组合调仓、排序逻辑、持仓上限、再平衡频率、换手率控制、候选池设计。更重要的是，轮动会让你意识到：量化不是「预测一切」，而是在有限标的中做相对更优的选择。

至于多因子选股和机器学习选股——我不是说不能碰，但别当第一站。一旦进入那个世界，你立刻会被包围：财务数据点时可得性、幸存者偏差、行业中性化、极值处理、缺失值填补、样本内外穿越、标签定义、特征泄露……这些不是「多看几篇教程」就能跨过去的。

真正高效的路径，通常不是一上来就堆模型，而是先把一个简单系统做扎实。

七、回测：量化里最重要，也最容易骗人的环节

量化最吸引人的地方，是它可以回测。量化最危险的地方，也恰恰在于此。

一条漂亮的历史净值曲线，很容易让人产生错觉：既然过去这么有效，未来应该也差不多。但回测不是未来收益的承诺。它只是你在一组历史条件下、基于一套明确假设做出的模拟实验。

这句话听上去平淡无奇，但你真的理解它之后，整个量化认知会上一个台阶。回测问的不是「这套策略能不能赚钱」，而是「如果过去按这套规则交易，在我设定的成交、成本、数据和风险假设下，会发生什么」。注意关键词：过去、规则、假设。改掉任意一个前提，结论都可能完全不同。

回测里有五个经典陷阱。

第一，未来函数。 你在历史里偷偷使用了当时不可能知道的信息。比如当日收盘后才能确定的价格，却被假设成盘中就能成交；季报公布之后的数据，被提前用于公布之前的选股；多年后才知道「哪些 ETF 活到了今天」，却拿这个名单去做过去的策略。未来函数不会让代码报错，但会让结果好得不真实。

第二，幸存者偏差。 你拿今天还存在、还活跃、表现还不错的标的去回看过去，于是得到一个漂亮的历史结论。但那些中途退市、清盘、边缘化的标的，已经被你无声地删掉了。

第三，信号和成交混淆。 很多人回测时默认「看到信号就按当日收盘买入」。但现实中你通常收盘后才能确认信号，所以更合理的假设是「下一交易日开盘成交」。就这一个细节，就能让很多漂亮的回测收益大幅缩水。

第四，忽略交易成本。 很多策略优势本来就不厚，只是在「零成本、零摩擦」的理想世界里才显得出色。一旦加入佣金、印花税、买卖价差、滑点和换手率约束，策略就从「惊艳」变成「平庸」，甚至直接转负。

第五，过拟合。 你不断调参数——20 日均线改 23 日，再改 27 日，加成交量过滤，再加波动率阈值。最后终于找到一组在 2017 到 2024 年特别好看的参数组合。问题是，这组参数可能只是「刚好适配过去」，并不代表它抓住了稳定的市场规律。过拟合最坏的地方在于，它会给你一种「我找到答案了」的心理奖励，恰恰让你最难承认自己只是在对历史做修辞。

所以，成熟的回测不只是「跑出一张净值图」，而是设计一整套防自欺的机制：样本内外拆分、walk-forward 滚动验证、参数敏感性分析、不同市场阶段对比、强制加入成本和滑点、数据版本固定以确保可复现。

回测真正的价值，不是让你兴奋，而是让你清醒。

八、怎样读懂一份回测报告

大多数人看到回测结果，第一眼盯的永远是总收益率。这没错，但如果你只看这一个数字，很容易被误导。

一份真正有用的回测报告，至少要同时回答四个问题：赚不赚钱？难不难拿？靠什么赚钱？在什么情况下最容易失效？

关于收益。 年化收益率当然重要。但任何收益率都必须放在风险背景里看。一个年化 18%、最大回撤 55% 的策略，和一个年化 12%、最大回撤 12% 的策略，不能用「18 大于 12」的小学算术来判断高下。对大多数人来说，真正决定能不能长期拿住的，不是收益上限，而是亏损过程的可承受性。

关于回撤。 最大回撤是最核心的指标之一——账户历史中从高点跌到低点最深的那次。很多人口头上说能接受大回撤，实际一到连续下跌就崩溃。回撤最残酷的地方在于它不是线性恢复的：回撤 10% 需要涨 11% 回本，回撤 20% 需要涨 25%，回撤 50% 需要涨 100%。一旦真正理解这件事，就会明白风控不是保守，而是复利的前提。

关于夏普、波动率、卡玛比率。 这些指标不是提供一个神奇评分，而是帮你判断收益的平滑程度和回撤效率。一个策略如果收益很高但过程像心电图一样剧烈抽搐，真实持有中的心理成本会非常高。很多人不是被市场打败，而是被自己的情绪打败。

关于胜率。 高胜率不等于高收益。一个策略可能 80% 的交易都在小赚，但剩下 20% 会把盈利全吃回去。另一个策略可能只有 35% 的胜率，却靠少数大赚覆盖大量小亏。比起单看胜率，更有意义的是同时看盈亏比、期望值、单笔收益分布、连续亏损次数。量化真正值得研究的，从来不是「赢了几次」，而是「赢的时候赢多少，输的时候输多少，长期下来值不值得做」。

关于换手率。 很多回测很惊艳，问题出在太「忙」了——今天买明天卖后天再买。成本、滑点、执行偏差和心理疲劳都会被高频切换放大。对个人投资者来说，低频、稳定、能解释的策略，往往比高频、炫目的策略更适合长期推进。

真正成熟的回测报告，不只是一张总表，还应该有分年度表现、月度收益分布、回撤区间、持仓变化、交易摘要、参数说明、成本假设和失败阶段分析。你不是在挑一张好看的图片，而是在判断一台系统值不值得继续投入时间和资金。

九、风控不是附属品，而是系统的一部分

很多初学者把风控理解成「出了问题就止损」。这太窄了。

风控不是补丁。它应该从策略诞生那一刻起就和策略长在一起。你设计的不是「怎样赚」，而是「怎样在可能赚钱的同时不被轻易打死」。

第一层：仓位。 同一套策略，10% 仓位和满仓运行，给人的体验完全不同。很多人不是败在策略上，而是败在仓位不匹配自己的承受能力。仓位管理的本质不是让收益变低，而是让你有资格活到下一次机会。市场不会因为你亏了就停下来等你。能否留在桌上，决定你有没有复利的可能。

第二层：分散和暴露管理。 哪怕只做 ETF，也不意味着可以随便堆仓。几个看似不同的 ETF，背后可能高度相关。几个看似分散的方向，真正下跌时可能一起跌。分散不是数量越多越好，而是暴露结构是否真正不同。量化风控要做的，是让组合知道自己到底押了什么。

第三层：规则内的退出机制。 什么时候减仓？什么时候空仓？什么时候停止交易？什么时候认定策略失效？这些都应该尽量前置。我不是鼓励用极端紧的止损把系统剪碎，而是提醒你：退出机制不该靠情绪临时决定。你可以用价格、波动率、回撤、相关性、信号反转甚至系统错误率来定义退出，但最好不要让「再等等看」成为默认选项。

第四层：操作和工程层面的风控。 数据更新失败怎么办？接口异常怎么办？某只标的停牌怎么办？回测结果突然和昨天不一致怎么办？信号生成后人工复核发现异常怎么办？这些不是「技术细节」，而是实打实的风险来源。对个人开发者来说，工程失误、参数写错、数据污染、逻辑错误，同样足以造成真实损失。

风控不是悲观主义。它是对复杂世界保持清醒的方式。你不是在证明自己永远正确，而是在提前承认自己一定会犯错，并为错误设计边界。

十、把量化当技术项目来做，才会越做越稳

如果你把量化只当成「几个买卖公式」，你会很快碰到天花板。真正让量化变成可持续能力的，是工程化。

这一点对个人开发者格外重要。你不是坐在机构里，有现成平台、数据团队、运维团队和执行团队。你得自己搭系统。

项目结构要清晰。 数据采集一层，数据清洗一层，策略定义一层，回测引擎一层，指标计算一层，报告生成一层，入口又是一层。不要把所有逻辑塞进一个 Notebook，更不要把下载数据、计算信号、画图、出报告混成一锅。量化项目一旦没有边界，后续每加一个需求都会把原来的东西拖垮。

结果要可复现。 今天跑出来的结果，下周还能不能复现？换一台电脑、换一个数据目录、换一个参数文件，你还知道自己改了什么吗？成熟的量化项目一定重视配置文件、数据版本、日志输出、随机种子、结果归档。因为一旦认真复盘，最痛苦的不是亏损，而是「我不知道自己为什么得到这个结果」。

研究和执行要分开。 研究模块提出和验证假设，执行模块把假设翻译成操作流程。对个人开发者来说，最好的第一阶段不是自动下单，而是每天定时更新数据、计算信号、生成报告、输出候选动作，再由人工确认。这样既保留了系统化，又保留了最后一道人工风控。等系统足够稳定，再逐步提高自动化程度。

要对测试有敬畏心。 策略代码不是写出来能跑就行，还要能被验证。均线算得对不对？交易日对齐对不对？仓位更新对不对？手续费有没有重复扣？回撤计算是否准确？量化里最可怕的一类错误，不是程序报错，而是程序看起来正常运行，却在悄无声息地给你错误结论。

从这个意义上说，量化最迷人的地方在于它是交易、数据、统计、工程和自我管理的交叉点。你做得越久越会发现：会写策略的人很多，能把系统搭稳的人并不多。

十一、一个适合个人开发者的 90 天入门路径

如果你真的准备开始，我建议用「三个月做出一个小闭环」的思路，而不是「半年做出顶级系统」的幻想。个人项目最怕贪大。最有效的方式永远是先跑通，再做深。

第一个月：跑通最简单的单策略回测。 选一两只宽基 ETF，建立本地数据缓存，写一个最简单的双均线策略，跑出净值曲线、收益、最大回撤和交易记录。这个阶段不追求策略多强，只要系统逻辑清楚、结果能重复、你能解释每一笔交易为什么发生，就算成功。

第二个月：从单策略实验升级到可比较的小平台。 加入一个 ETF 轮动策略，增加参数配置文件，加入样本内外拆分、交易成本和滑点，生成 Markdown 或 HTML 报告，自动输出关键指标、年度收益、回撤区间和交易摘要。到这一步，你已经不是在「试着写个策略」，而是在做一个研究工具了。

第三个月：验证而非炫技。 做 walk-forward 验证，尝试参数敏感性分析，把策略切到不同 ETF 池子测试，尝试每天收盘后自动生成次日候选持仓建议。这个阶段最重要的不是让系统越来越复杂，而是看它在复杂一点之后，能不能保持清晰、稳定和可解释。

三个月之后，你很可能还没赚到什么大钱。但你会拥有一个真正重要的东西：一套可以持续迭代的金融实验系统。接下来无论学因子、学选股、学组合优化还是学风险模型，都会站在一个坚实得多的起点上。

十二、为什么很多回测很好看，实盘却很难受

这个问题几乎每个做量化的人都会遇到。答案没有那么神秘。

回测面对的是「已经发生的世界」。你看到完整的净值曲线，知道哪里只是暂时下跌，哪里后来会创新高，哪里虽然痛苦但扛一扛就过去了。

实盘面对的是「正在发生、而你不知道结局的世界」。连续亏损三周时，你不知道这是正常波动还是策略永久失效的开端。一段漂亮上涨之后，你也不知道它是趋势起点还是最后的疯狂。量化能减少情绪，但不能消灭不确定性。

另一个原因是实盘比回测多了大量摩擦。你可能忘了更新数据，可能手动确认时犹豫，可能实际成交价和假设不一致，可能碰上流动性不足，可能因为节假日、停牌、系统异常影响执行。单笔看不大，长期叠加却会显著改变结果。

还有一个不太被承认但很关键的原因：人在回测时会不自觉地挑自己喜欢的东西。你可能无意识地筛掉了不好看的参数、不好看的时段、不好看的样本，只留下了符合预期的部分。实盘亏钱时，不是市场突然不讲理了，而是你研究时就已经偏向了自己想看的答案。

所以，实盘和回测之间最重要的桥梁，不是「找更强的策略」，而是让回测假设更接近真实、让执行流程更接近纪律、让自己对亏损的心理预期更接近现实。

真正成熟的量化，不是回测有多漂亮，而是回测和实盘之间的落差有多小。

十三、几个高频问题的真回答

零基础能学量化吗？

能。但别指望靠看几篇文章就进入盈利阶段。量化需要的是一组基础能力：一点 Python，一点数据处理，一点统计常识，一点交易规则理解，再加一点长期做项目的耐心。真正难的不是第一段代码，而是把杂乱知识拼成稳定系统。

是不是必须先学高级数学和机器学习？

不是。入门阶段最重要的能力不是推导更复杂的公式，而是把简单规则做正确。先学会定义问题、清洗数据、做回测、看报告、控风险，再去追求模型复杂度。很多人不是输在「不会高级数学」，而是输在「不会老老实实做基础工作」。

资金小还有必要做量化吗？

有必要。对大多数个人投资者来说，量化入门阶段最大的产出不是收益，而是方法。小资金反而适合做实验、练系统、练执行、练复盘。把它当成一门工程实践，收获会比「立刻赚到多少钱」更扎实。

要不要一开始就做全自动下单？

通常没必要。尤其在 A 股环境下，程序化交易有明确的规则框架和报告要求。先做研究、回测、信号输出、人工确认，已经是完整闭环了。自动化不应当是「显得高级」的装饰，而应当是系统足够稳定后顺理成章的结果。

神策略能不能直接抄？

可以研究，但不要直接信。任何公开策略，哪怕思路没问题，也要先问四个问题：数据口径是什么？执行假设是什么？成本怎么算？样本外是否成立？很多「公开神策略」最厉害的地方，不是它真的无敌，而是它省略了最容易让结果变差的细节。

回测不够漂亮，是不是就说明策略没价值？

不一定。很多新手只想看「极致漂亮」的曲线，结果反而被过拟合骗走。一个真实可用的策略，很多时候只是「没那么惊艳，但逻辑清楚、回撤可控、样本外没崩、能长期拿住」。量化世界里，平庸但稳定，常常比惊艳但脆弱更有价值。

什么时候才算真正入门？

不是你第一次写出策略的时候，也不是你第一次回测盈利的时候。而是你第一次能完整回答这些问题的时候：这套系统为什么可能有效？它依赖什么前提？它最可能在哪里失效？成本和摩擦是什么？风险边界在哪里？失效时你准备怎么处理？

能回答这些，才说明你开始从「写代码的人」变成「做系统的人」。

结语

量化听起来像金融技术。做久了你会发现，它首先是在训练一种思维方式。

把模糊的直觉翻译成清楚的规则。把想象中的优势放进严格的验证。把历史里的漂亮结果放进现实摩擦里重新审视。把「我可能是对的」换成「我怎样证明自己不是在骗自己」。

它不是圣杯，不会消灭亏损和焦虑。它甚至会比主观交易更残酷，因为它会把你的错误一条条暴露出来，让你没法轻易用「这次运气不好」糊弄过去。

但也正因如此，量化才值得学。它会逼你把交易从情绪反应变成系统工程，把运气驱动变成流程驱动，把一时冲动变成长期可复盘的能力。

真正的量化入门，不是背会更多术语，也不是找到一套神秘公式。而是开始愿意承认：市场很复杂，自己会犯错，任何优势都必须经过检验，任何收益都要付出风险代价，任何系统都需要维护。

到了那一步，你写的就不再只是买卖程序，而是一套帮助自己在不确定世界里做出更稳定决策的工具。

而这，才是量化最有价值的地方。

李文业的思考笔记