量化炒股入门:把凭感觉买卖变成用系统做决策
本文仅供学习交流,不构成投资建议。
大多数人对量化炒股的第一印象是错的。
他们想象的画面大概是这样的:几块屏幕、一堆跳动的数字、一段会自动买卖的程序。好像只要把代码写出来,钱就会自己跑进账户。这个画面并非完全荒唐,但它把最重要的东西遮住了。
量化的核心既不是神秘算法,也不是全自动赚钱。它做的事情其实很朴素:把你原来模糊的、情绪化的、临时拍脑袋的交易决定,翻译成一套可以写下来、可以检验、可以复盘、可以改进的规则。
这件事在 A 股的官方语境里其实已经说得很清楚了。证监会把程序化交易定义为「通过计算机程序自动生成或下达交易指令进行证券交易的行为」,相关规定 2024 年起施行,沪深交易所的实施细则也已落地。深交所细则明确写了,程序化交易投资者可以包括个人投资者。换句话说,量化不是什么灰色地带的玩法,而是一种有明确边界、有工程要求、也有合规要求的正规交易方式。
真正想学量化的人,第一步不应该是去找「胜率最高的指标」,也不是搜「年化 80% 的神策略」。第一步应该是建立一个认知:量化不替你思考,它只是逼你把思考变得更严格。
你原来凭感觉做的判断,在量化里必须变成明确条件。你原来靠「应该没事」硬扛的亏损,在量化里必须变成事先定义好的阈值。你原来在牛市里觉得自己是天才、在熊市里怀疑人生的那种情绪波动,在量化里都会被记录下来,然后被检验。
再直白一点说:量化不是更聪明地猜,而是更严格地执行,和更诚实地检验。它最大的价值不是立刻把你变成赚钱机器,而是逼你把「我觉得」变成「在什么条件下我会这么做,以及这么做的长期结果大概是什么」。
一、量化炒股到底是什么
如果你把交易拆开看,会发现它其实就是一串连续的问题:买什么?什么时候买?买多少?什么时候卖?亏多少停?赚多少走?什么时候该空仓?什么时候该减仓?
主观交易者通常是看到行情之后临时做决定。量化交易者则是先把这些问题回答好,再用规则和程序去执行。
区别在哪?举个最简单的例子。
一个主观交易者可能会说:「这只 ETF 最近走势不错,感觉要突破了。」
这句话看上去像判断,但仔细想想,它的信息量几乎为零。什么叫「走势不错」?什么叫「要突破」?突破到什么程度算成立?回落多少算失败?仓位是 20% 还是 100%?第二天低开怎么办?第三天反包又怎么办?
这些问题一旦没有明确答案,所谓的「交易逻辑」其实只是情绪、印象和故事的混合物。
量化做的第一件事,就是把这种模糊语言翻译成机器能理解的规则。比如把「感觉要突破」翻译成:「若收盘价创过去 60 个交易日新高,且 20 日均线向上、成交额不低于过去 20 日均值的 0.8 倍,则于下一交易日开盘买入,仓位 30%;若收盘价跌破 20 日均线则卖出。」
这套规则未必赚钱。但它比主观判断多了两个巨大的优势:第一,它可执行——任何人拿到这段描述都能做出相同操作;第二,它可回测——你能拿历史数据验证它过去的表现。
这就是量化的本质:把交易从「临场发挥」变成「规则系统」。
这个系统可以很简单——一条均线加一条止损线就够了。也可以很复杂——多因子、机器学习、组合优化、执行算法。但不管复杂还是简单,它做的始终是同一件事:用明确的规则替代模糊的直觉。
所以量化不天然等于高深,也不天然等于 AI。它首先是一种方法论,其次才是技术栈。
进一步说,量化也不只管「什么时候买卖」。一个成熟的量化系统至少包含四层。第一层是研究层,负责提出假设:市场里可能存在什么规律。第二层是验证层,用历史数据检验假设是否成立。第三层是执行层,把信号转成实际订单。第四层是风控层,在系统出错、市场异常、模型失效时保护你的账户。
大多数人以为量化的核心是公式。其实真正拉开差距的,是公式背后的系统设计能力。
二、为什么很多人一听量化就误解
关于量化,市场里最常见的误解有四种。有趣的是,这四种误解恰好构成了一条完整的错误认知链。
第一种误解:量化等于人工智能。
很多人觉得,好像只有用了神经网络、深度学习、强化学习,才配叫量化。这完全不对。大量真实可用的量化策略都非常朴素——趋势跟随、资产轮动、均值回归、再平衡、事件驱动。它们可能根本没用到任何复杂模型,但只要规则明确、可回测、可执行、可管理风险,就是量化。
很多初学者一上来就想做「AI 选股」,结果连数据清洗、信号定义、交易成本、样本外验证都没弄清楚,项目就已经烂尾了。这就像一个还没学会走路的人非要去练跑酷。
第二种误解:量化等于高频交易。
高频交易确实属于量化的一部分,但它只是量化世界里非常窄的一个分支。高频强调的是超低延迟、海量订单、微观结构优势,这些东西需要专业级的基础设施。沪深交易所已经给出了明确的高频交易认定标准:单个账户每秒申报撤单达到 300 笔以上,或单日达到 20000 笔以上。
这个标准其实反过来提醒了初学者一件事:你没必要幻想自己在跟机构比速度。你真正该练的是规则设计、数据处理、回测纪律和风控能力。个人投资者真正适合做的,是日频或周频的中低频策略。
第三种误解:量化天然比主观交易更客观。
这个误解尤其危险,因为它听上去很有道理。程序确实能减少情绪干扰,但程序不会自动消灭人的偏见。你用什么数据、怎么做复权、如何定义信号、有没有偷看未来数据、回测里是否忽略了滑点和手续费、参数是不是被你调到了「刚好对历史最有效」的位置——这些偏差,程序一个都帮不了你。
换句话说,量化并不消灭自欺欺人。它只是把自欺欺人的方式从「拍脑袋」升级成了「写代码骗自己」。
第四种误解:量化是一劳永逸的赚钱机器。
很多人以为,只要找到一套历史上有效的规则,往后就能自动印钞。这种想法非常危险。市场环境会变,资金结构会变,交易制度会变,流动性会变,策略拥挤度会变,甚至你依赖的数据接口和口径也可能变。
量化系统不是修好就不用动的水龙头。它更像一台需要持续校准、持续维护、持续复盘的实验装置。没有你想象中那么浪漫,但比你以为的更接近真实世界的运行方式。
三、一个量化系统到底长什么样
想真正学会量化,最重要的不是背几个指标名称,而是先在脑子里形成一张系统地图。你可以把量化系统想象成一条流水线,每一段解决不同的问题。
数据层。 没有数据,量化连起步都不可能。你至少需要行情数据、交易日历、标的信息、复权信息。有些策略还需要财务数据、指数成分、公告事件、行业分类。但数据层真正要解决的问题,不是「有没有数据」,而是「数据是否干净、连续、口径一致,是否能还原当时真实可得的信息」。
策略层。 这里负责把想法翻译成信号。你认为趋势会延续?那就把「趋势」定义清楚。你觉得强者恒强?那就把「强」转成一个可以排序的指标。你相信均值回归?那就把「偏离程度」写成公式。策略层做的不是「编一个故事」,而是「写一条条件链」。
组合层。 很多人一开始只关心「买什么」,却忽略「买多少」。但实际上,仓位管理往往比选标的更重要。你是单标的全仓,还是多标的等权,还是按波动率调整仓位,还是设置行业暴露上限?这些选择会显著影响最终结果。组合层回答的是:即便信号正确,我该以什么方式去承接这个判断。
执行层。 信号不是成交。成交也未必是你回测里设想的价格。你是收盘生成信号、下一开盘成交,还是假设收盘价成交?你考虑了滑点吗?考虑了成交量约束吗?考虑了无法买入或卖出的异常情况吗?执行层不光鲜,但它决定了你的研究离真实世界有多远。
风控与复盘层。 成熟的系统不仅要抓机会,还要限制错误。单日亏损过大是否触发降仓?组合回撤是否触发停机?数据更新失败时是否自动中止?异常行情时是否切回人工确认?还要有报告和日志,让你知道每天为什么买、为什么卖、为什么没动。
没有复盘,量化就不是系统,而只是自动化的冲动。
真正好的量化项目,未必起步复杂,但一定结构清楚。你哪怕只做一只 ETF 的双均线策略,只要把这五层都想明白,学到的东西也远比「抄来一段神奇代码」多得多。
四、为什么 A 股新手更适合从 ETF 开始
我的建议是:先别碰个股量化,先从 ETF 做起。
不是因为个股不值得做,而是因为 ETF 更适合当第一块实验台。它天然帮你平滑掉了很多个股层面的极端事件:业绩爆雷、黑天鹅、停牌复牌断层、题材股瞬间熄火、ST 和退市风险。你在 ETF 上先把数据、回测、信号、报告打通,学习效率会高很多。
还有一个经常被忽略的原因。对初学者来说,研究系统本身比追求 alpha 更重要。
个股策略会很快把你拖进一个复杂世界——股票池怎么选?财务数据用季度值还是滚动值?调仓日和财报发布日期怎么对齐?停牌怎么办?涨跌停买卖不了怎么办?分红送转怎么处理?成分股变更怎么回溯?这些问题都值得学,但它们更适合当第二阶段的课题。
ETF 的好处在于,你可以很快跑出一个完整闭环:下载数据、计算信号、生成持仓、跑净值曲线、算指标、做报告、再做样本外验证。对个人开发者来说,这种「先把小系统跑起来」的成就感至关重要。量化最怕的不是策略差,而是工程项目起得太大,最后什么都没做完。
在 A 股语境里,这种路径也更务实。证监会发布程序化交易管理规定时明确提出「先报告、后交易」,要求投资者按规定报告账户、资金、交易、软件等信息后才可进行程序化交易。对刚入门的人来说,最合适的路径不是一上来就做「无人值守自动报单」,而是先做研究、回测、信号输出、日报生成,再逐步走向半自动决策支持。
把合规意识放在项目初期,比等到准备实盘时再补课要稳得多。
五、数据:量化的地基,也是最大的坑
量化世界里有句老话:垃圾进,垃圾出。
几乎所有初学者都会在数据层吃亏。大多数人把精力花在「策略公式」上,却发现真正决定结果有没有意义的,反而是一些琐碎的细节:交易日是不是对齐了?复权是不是正确?停牌日期有没有空缺?代码映射是否稳定?历史数据有没有重复?某些字段在当时到底能不能拿到?
以 Tushare Pro 为例,它的文档分别提供了 trade_cal 交易日历接口、fund_daily ETF 日线接口、fund_adj 基金复权因子接口。A 股日线接口则明确说明,默认是未复权行情,且停牌期间不提供数据。
这些看上去只是 API 说明,但对量化来说它们几乎是生死线:忘了复权,趋势信号会被分红拆分扭曲;没意识到停牌期间没数据,回测时就可能把「没交易」误当成「价格稳定」;没用交易日历做对齐,不同标的之间的比较就会错位。
很多人一听「复权」就觉得头大。其实复权一点不高深。它只是告诉你:历史价格必须放在同一把尺子上看。如果一只基金分了红,或者一只股票送了股,你不做处理,价格图会突然断一截。而你的策略如果是基于均线、涨跌幅、突破或动量算出来的,它们就会被这次「假断层」误导。结果不是你找到了无敌策略,而是你让错误数据制造了虚假信号。
还有一个容易被忽略的问题:点时可得性。也就是说,你在某个交易日做决策时,到底能看到哪些信息?比如某份财报 4 月 30 日才发布,那你在 4 月 10 日的回测里就不能用其中的数据;某只股票后来被剔出指数,也不代表你可以假装当时就知道它会被剔除。
量化里最值钱的一种诚实,就是承认:当时的你,不知道后来发生的事。
对个人开发者还有一条极其实用的原则:建立本地缓存。不要每次研究都重新在线拉取全部历史数据,也不要让策略直接耦合外部接口。最稳妥的做法是把数据源当「采集器」,把本地 Parquet 或 SQLite 当「真相源」。先落地、清洗、标准化,再由回测模块读取。这样不仅更快,更重要的是可复现——今天的结果、下周的结果、三个月后的结果,至少能在同一份数据快照上讲得通。
最后提醒一句:数据问题不是「前面解决一次就没事了」。每引入一种新资产、新频率、新字段,数据问题都会重新出现。成熟的量化思维不是默认数据没问题,而是默认数据「迟早会出问题」,所以系统里必须给校验、缺失处理、更新日志和异常中止留出位置。
六、新手最值得先掌握的两类策略
「到底先学哪种策略?」这大概是入门者最焦虑的问题。
我的建议很简单:先学趋势,再学轮动。不是因为它们一定最赚钱,而是因为它们最适合当学习框架。
第一类:趋势跟随。
最典型的代表是双均线策略。规则非常朴素:短周期均线向上穿过长周期均线时买入,反向跌破时卖出。或者更简单——收盘价站上某条长期均线就持有,跌破就空仓。
趋势策略直观、容易理解、容易回测。你很快就能看到它真正的优缺点:单边上涨时能吃到大段行情;震荡市里则来回打脸,反复被「洗」。
但趋势策略真正的价值不在于它本身能赚多少,而在于它会逼你思考一系列关键问题:信号按收盘价生成还是盘中生成?成交假设放在下一开盘还是下一收盘?均线参数应该固定还是做网格搜索?空仓时持有现金还是货币 ETF?手续费和滑点会不会把微弱优势吃掉?
一个看似简单的双均线策略,已经足够把量化研究的大多数基本功带出来。
你可以从一个极简版本开始:只研究一只宽基 ETF,每天收盘后检查 20 日均线和 60 日均线。20 日在 60 日上方且当前空仓,就下一交易日开盘买入;20 日跌回 60 日下方且当前持仓,就下一交易日开盘卖出。然后观察净值曲线、最大回撤、换手频率、震荡市表现、趋势市表现。做完这一轮,你得到的不是「圣杯」,而是第一份真正属于自己的量化实验报告。
第二类:ETF 轮动。
背后的想法是:强势资产在一段时间内可能继续强势,弱势资产可能继续弱势。选几个宽基、行业或风格 ETF,按过去 20 日、60 日、120 日的收益或波动率打分,然后在固定周期内持有得分最高的一只或几只。为了避免「在熊市里硬选最强的弱者」,还可以加一个绝对动量过滤:只有入选标的本身收益为正或站在长期均线上方时,才允许买入,否则空仓。
轮动策略比单一趋势多了一层「横向比较」,但又没有个股多因子那么复杂。你可以很快学会组合调仓、排序逻辑、持仓上限、再平衡频率、换手率控制、候选池设计。更重要的是,轮动会让你意识到:量化不是「预测一切」,而是在有限标的中做相对更优的选择。
至于多因子选股和机器学习选股——我不是说不能碰,但别当第一站。一旦进入那个世界,你立刻会被包围:财务数据点时可得性、幸存者偏差、行业中性化、极值处理、缺失值填补、样本内外穿越、标签定义、特征泄露……这些不是「多看几篇教程」就能跨过去的。
真正高效的路径,通常不是一上来就堆模型,而是先把一个简单系统做扎实。
七、回测:量化里最重要,也最容易骗人的环节
量化最吸引人的地方,是它可以回测。量化最危险的地方,也恰恰在于此。
一条漂亮的历史净值曲线,很容易让人产生错觉:既然过去这么有效,未来应该也差不多。但回测不是未来收益的承诺。它只是你在一组历史条件下、基于一套明确假设做出的模拟实验。
这句话听上去平淡无奇,但你真的理解它之后,整个量化认知会上一个台阶。回测问的不是「这套策略能不能赚钱」,而是「如果过去按这套规则交易,在我设定的成交、成本、数据和风险假设下,会发生什么」。注意关键词:过去、规则、假设。改掉任意一个前提,结论都可能完全不同。
回测里有五个经典陷阱。
第一,未来函数。 你在历史里偷偷使用了当时不可能知道的信息。比如当日收盘后才能确定的价格,却被假设成盘中就能成交;季报公布之后的数据,被提前用于公布之前的选股;多年后才知道「哪些 ETF 活到了今天」,却拿这个名单去做过去的策略。未来函数不会让代码报错,但会让结果好得不真实。
第二,幸存者偏差。 你拿今天还存在、还活跃、表现还不错的标的去回看过去,于是得到一个漂亮的历史结论。但那些中途退市、清盘、边缘化的标的,已经被你无声地删掉了。
第三,信号和成交混淆。 很多人回测时默认「看到信号就按当日收盘买入」。但现实中你通常收盘后才能确认信号,所以更合理的假设是「下一交易日开盘成交」。就这一个细节,就能让很多漂亮的回测收益大幅缩水。
第四,忽略交易成本。 很多策略优势本来就不厚,只是在「零成本、零摩擦」的理想世界里才显得出色。一旦加入佣金、印花税、买卖价差、滑点和换手率约束,策略就从「惊艳」变成「平庸」,甚至直接转负。
第五,过拟合。 你不断调参数——20 日均线改 23 日,再改 27 日,加成交量过滤,再加波动率阈值。最后终于找到一组在 2017 到 2024 年特别好看的参数组合。问题是,这组参数可能只是「刚好适配过去」,并不代表它抓住了稳定的市场规律。过拟合最坏的地方在于,它会给你一种「我找到答案了」的心理奖励,恰恰让你最难承认自己只是在对历史做修辞。
所以,成熟的回测不只是「跑出一张净值图」,而是设计一整套防自欺的机制:样本内外拆分、walk-forward 滚动验证、参数敏感性分析、不同市场阶段对比、强制加入成本和滑点、数据版本固定以确保可复现。
回测真正的价值,不是让你兴奋,而是让你清醒。
八、怎样读懂一份回测报告
大多数人看到回测结果,第一眼盯的永远是总收益率。这没错,但如果你只看这一个数字,很容易被误导。
一份真正有用的回测报告,至少要同时回答四个问题:赚不赚钱?难不难拿?靠什么赚钱?在什么情况下最容易失效?
关于收益。 年化收益率当然重要。但任何收益率都必须放在风险背景里看。一个年化 18%、最大回撤 55% 的策略,和一个年化 12%、最大回撤 12% 的策略,不能用「18 大于 12」的小学算术来判断高下。对大多数人来说,真正决定能不能长期拿住的,不是收益上限,而是亏损过程的可承受性。
关于回撤。 最大回撤是最核心的指标之一——账户历史中从高点跌到低点最深的那次。很多人口头上说能接受大回撤,实际一到连续下跌就崩溃。回撤最残酷的地方在于它不是线性恢复的:回撤 10% 需要涨 11% 回本,回撤 20% 需要涨 25%,回撤 50% 需要涨 100%。一旦真正理解这件事,就会明白风控不是保守,而是复利的前提。
关于夏普、波动率、卡玛比率。 这些指标不是提供一个神奇评分,而是帮你判断收益的平滑程度和回撤效率。一个策略如果收益很高但过程像心电图一样剧烈抽搐,真实持有中的心理成本会非常高。很多人不是被市场打败,而是被自己的情绪打败。
关于胜率。 高胜率不等于高收益。一个策略可能 80% 的交易都在小赚,但剩下 20% 会把盈利全吃回去。另一个策略可能只有 35% 的胜率,却靠少数大赚覆盖大量小亏。比起单看胜率,更有意义的是同时看盈亏比、期望值、单笔收益分布、连续亏损次数。量化真正值得研究的,从来不是「赢了几次」,而是「赢的时候赢多少,输的时候输多少,长期下来值不值得做」。
关于换手率。 很多回测很惊艳,问题出在太「忙」了——今天买明天卖后天再买。成本、滑点、执行偏差和心理疲劳都会被高频切换放大。对个人投资者来说,低频、稳定、能解释的策略,往往比高频、炫目的策略更适合长期推进。
真正成熟的回测报告,不只是一张总表,还应该有分年度表现、月度收益分布、回撤区间、持仓变化、交易摘要、参数说明、成本假设和失败阶段分析。你不是在挑一张好看的图片,而是在判断一台系统值不值得继续投入时间和资金。
九、风控不是附属品,而是系统的一部分
很多初学者把风控理解成「出了问题就止损」。这太窄了。
风控不是补丁。它应该从策略诞生那一刻起就和策略长在一起。你设计的不是「怎样赚」,而是「怎样在可能赚钱的同时不被轻易打死」。
第一层:仓位。 同一套策略,10% 仓位和满仓运行,给人的体验完全不同。很多人不是败在策略上,而是败在仓位不匹配自己的承受能力。仓位管理的本质不是让收益变低,而是让你有资格活到下一次机会。市场不会因为你亏了就停下来等你。能否留在桌上,决定你有没有复利的可能。
第二层:分散和暴露管理。 哪怕只做 ETF,也不意味着可以随便堆仓。几个看似不同的 ETF,背后可能高度相关。几个看似分散的方向,真正下跌时可能一起跌。分散不是数量越多越好,而是暴露结构是否真正不同。量化风控要做的,是让组合知道自己到底押了什么。
第三层:规则内的退出机制。 什么时候减仓?什么时候空仓?什么时候停止交易?什么时候认定策略失效?这些都应该尽量前置。我不是鼓励用极端紧的止损把系统剪碎,而是提醒你:退出机制不该靠情绪临时决定。你可以用价格、波动率、回撤、相关性、信号反转甚至系统错误率来定义退出,但最好不要让「再等等看」成为默认选项。
第四层:操作和工程层面的风控。 数据更新失败怎么办?接口异常怎么办?某只标的停牌怎么办?回测结果突然和昨天不一致怎么办?信号生成后人工复核发现异常怎么办?这些不是「技术细节」,而是实打实的风险来源。对个人开发者来说,工程失误、参数写错、数据污染、逻辑错误,同样足以造成真实损失。
风控不是悲观主义。它是对复杂世界保持清醒的方式。你不是在证明自己永远正确,而是在提前承认自己一定会犯错,并为错误设计边界。
十、把量化当技术项目来做,才会越做越稳
如果你把量化只当成「几个买卖公式」,你会很快碰到天花板。真正让量化变成可持续能力的,是工程化。
这一点对个人开发者格外重要。你不是坐在机构里,有现成平台、数据团队、运维团队和执行团队。你得自己搭系统。
项目结构要清晰。 数据采集一层,数据清洗一层,策略定义一层,回测引擎一层,指标计算一层,报告生成一层,入口又是一层。不要把所有逻辑塞进一个 Notebook,更不要把下载数据、计算信号、画图、出报告混成一锅。量化项目一旦没有边界,后续每加一个需求都会把原来的东西拖垮。
结果要可复现。 今天跑出来的结果,下周还能不能复现?换一台电脑、换一个数据目录、换一个参数文件,你还知道自己改了什么吗?成熟的量化项目一定重视配置文件、数据版本、日志输出、随机种子、结果归档。因为一旦认真复盘,最痛苦的不是亏损,而是「我不知道自己为什么得到这个结果」。
研究和执行要分开。 研究模块提出和验证假设,执行模块把假设翻译成操作流程。对个人开发者来说,最好的第一阶段不是自动下单,而是每天定时更新数据、计算信号、生成报告、输出候选动作,再由人工确认。这样既保留了系统化,又保留了最后一道人工风控。等系统足够稳定,再逐步提高自动化程度。
要对测试有敬畏心。 策略代码不是写出来能跑就行,还要能被验证。均线算得对不对?交易日对齐对不对?仓位更新对不对?手续费有没有重复扣?回撤计算是否准确?量化里最可怕的一类错误,不是程序报错,而是程序看起来正常运行,却在悄无声息地给你错误结论。
从这个意义上说,量化最迷人的地方在于它是交易、数据、统计、工程和自我管理的交叉点。你做得越久越会发现:会写策略的人很多,能把系统搭稳的人并不多。
十一、一个适合个人开发者的 90 天入门路径
如果你真的准备开始,我建议用「三个月做出一个小闭环」的思路,而不是「半年做出顶级系统」的幻想。个人项目最怕贪大。最有效的方式永远是先跑通,再做深。
第一个月:跑通最简单的单策略回测。 选一两只宽基 ETF,建立本地数据缓存,写一个最简单的双均线策略,跑出净值曲线、收益、最大回撤和交易记录。这个阶段不追求策略多强,只要系统逻辑清楚、结果能重复、你能解释每一笔交易为什么发生,就算成功。
第二个月:从单策略实验升级到可比较的小平台。 加入一个 ETF 轮动策略,增加参数配置文件,加入样本内外拆分、交易成本和滑点,生成 Markdown 或 HTML 报告,自动输出关键指标、年度收益、回撤区间和交易摘要。到这一步,你已经不是在「试着写个策略」,而是在做一个研究工具了。
第三个月:验证而非炫技。 做 walk-forward 验证,尝试参数敏感性分析,把策略切到不同 ETF 池子测试,尝试每天收盘后自动生成次日候选持仓建议。这个阶段最重要的不是让系统越来越复杂,而是看它在复杂一点之后,能不能保持清晰、稳定和可解释。
三个月之后,你很可能还没赚到什么大钱。但你会拥有一个真正重要的东西:一套可以持续迭代的金融实验系统。接下来无论学因子、学选股、学组合优化还是学风险模型,都会站在一个坚实得多的起点上。
十二、为什么很多回测很好看,实盘却很难受
这个问题几乎每个做量化的人都会遇到。答案没有那么神秘。
回测面对的是「已经发生的世界」。你看到完整的净值曲线,知道哪里只是暂时下跌,哪里后来会创新高,哪里虽然痛苦但扛一扛就过去了。
实盘面对的是「正在发生、而你不知道结局的世界」。连续亏损三周时,你不知道这是正常波动还是策略永久失效的开端。一段漂亮上涨之后,你也不知道它是趋势起点还是最后的疯狂。量化能减少情绪,但不能消灭不确定性。
另一个原因是实盘比回测多了大量摩擦。你可能忘了更新数据,可能手动确认时犹豫,可能实际成交价和假设不一致,可能碰上流动性不足,可能因为节假日、停牌、系统异常影响执行。单笔看不大,长期叠加却会显著改变结果。
还有一个不太被承认但很关键的原因:人在回测时会不自觉地挑自己喜欢的东西。你可能无意识地筛掉了不好看的参数、不好看的时段、不好看的样本,只留下了符合预期的部分。实盘亏钱时,不是市场突然不讲理了,而是你研究时就已经偏向了自己想看的答案。
所以,实盘和回测之间最重要的桥梁,不是「找更强的策略」,而是让回测假设更接近真实、让执行流程更接近纪律、让自己对亏损的心理预期更接近现实。
真正成熟的量化,不是回测有多漂亮,而是回测和实盘之间的落差有多小。
十三、几个高频问题的真回答
零基础能学量化吗?
能。但别指望靠看几篇文章就进入盈利阶段。量化需要的是一组基础能力:一点 Python,一点数据处理,一点统计常识,一点交易规则理解,再加一点长期做项目的耐心。真正难的不是第一段代码,而是把杂乱知识拼成稳定系统。
是不是必须先学高级数学和机器学习?
不是。入门阶段最重要的能力不是推导更复杂的公式,而是把简单规则做正确。先学会定义问题、清洗数据、做回测、看报告、控风险,再去追求模型复杂度。很多人不是输在「不会高级数学」,而是输在「不会老老实实做基础工作」。
资金小还有必要做量化吗?
有必要。对大多数个人投资者来说,量化入门阶段最大的产出不是收益,而是方法。小资金反而适合做实验、练系统、练执行、练复盘。把它当成一门工程实践,收获会比「立刻赚到多少钱」更扎实。
要不要一开始就做全自动下单?
通常没必要。尤其在 A 股环境下,程序化交易有明确的规则框架和报告要求。先做研究、回测、信号输出、人工确认,已经是完整闭环了。自动化不应当是「显得高级」的装饰,而应当是系统足够稳定后顺理成章的结果。
神策略能不能直接抄?
可以研究,但不要直接信。任何公开策略,哪怕思路没问题,也要先问四个问题:数据口径是什么?执行假设是什么?成本怎么算?样本外是否成立?很多「公开神策略」最厉害的地方,不是它真的无敌,而是它省略了最容易让结果变差的细节。
回测不够漂亮,是不是就说明策略没价值?
不一定。很多新手只想看「极致漂亮」的曲线,结果反而被过拟合骗走。一个真实可用的策略,很多时候只是「没那么惊艳,但逻辑清楚、回撤可控、样本外没崩、能长期拿住」。量化世界里,平庸但稳定,常常比惊艳但脆弱更有价值。
什么时候才算真正入门?
不是你第一次写出策略的时候,也不是你第一次回测盈利的时候。而是你第一次能完整回答这些问题的时候:这套系统为什么可能有效?它依赖什么前提?它最可能在哪里失效?成本和摩擦是什么?风险边界在哪里?失效时你准备怎么处理?
能回答这些,才说明你开始从「写代码的人」变成「做系统的人」。
结语
量化听起来像金融技术。做久了你会发现,它首先是在训练一种思维方式。
把模糊的直觉翻译成清楚的规则。把想象中的优势放进严格的验证。把历史里的漂亮结果放进现实摩擦里重新审视。把「我可能是对的」换成「我怎样证明自己不是在骗自己」。
它不是圣杯,不会消灭亏损和焦虑。它甚至会比主观交易更残酷,因为它会把你的错误一条条暴露出来,让你没法轻易用「这次运气不好」糊弄过去。
但也正因如此,量化才值得学。它会逼你把交易从情绪反应变成系统工程,把运气驱动变成流程驱动,把一时冲动变成长期可复盘的能力。
真正的量化入门,不是背会更多术语,也不是找到一套神秘公式。而是开始愿意承认:市场很复杂,自己会犯错,任何优势都必须经过检验,任何收益都要付出风险代价,任何系统都需要维护。
到了那一步,你写的就不再只是买卖程序,而是一套帮助自己在不确定世界里做出更稳定决策的工具。
而这,才是量化最有价值的地方。