深度报告
-
项目起源与发展脉络: Kronos的全称是「Kronos: A Foundation Model for the Language of Financial Markets」,由清华大学交叉信息学院(IIIS)和自动化系的七位研究人员联合开发,核心作者包括余世、付宗良、陈硕、赵博涵、徐伟、张长水和李建。该项目在2025年8月2日首次发布于arXiv,论文编号arXiv:2508.02739,随后经历了快速迭代:2025年8月17日微调脚本发布,2025年11月在NeurIPS 2025 Workshop「Recent Advances in Time Series Foundation Models」上进行海报展示,最终在2026年3月被AAAI 2026正式接收,发表于AAAI Conference on Artificial Intelligence Vol.40 No.30。 从GitHub仓库的统计数据来看,该项目自发布以来保持着极高的社区活跃度:截至目前已累计获得19.4k Stars、3.5k Forks、179 Watchers,收到146个Issues和25个Pull Requests,共有18位贡献者参与开发。GitHub官方页面显示的最新动态标注日期为2025年11月10日,彼时项目刚刚确认被AAAI 2026接收,随即引发开发者社区的广泛讨论。值得一提的是,该项目还被同步镜像到了Gitee和GitCode等国内代码托管平台,进一步扩大了在国内开发者群体中的影响力。 开发团队与机构背景: Kronos的研发团队来自清华大学两大强势学科——交叉信息学院(IIIS,以计算机科学和量子计算研究闻名)和自动化系(传统优势在控制科学与工程),这种跨学科组合为金融时间序列建模提供了独特的技术视角。论文作者中,张长水教授是自动化系知名学者,在机器学习和模式识别领域有深厚积累;李建教授同样在相关领域具有较高学术声誉。微软亚洲研究院作为联合研发机构,为项目提供了算力支持和工程化经验,这种「学术机构+产业实验室」的合作模式在国内AI开源项目中较为罕见,也从侧面反映了该研究的学术价值和商业潜力。
-
Kronos的核心定位是「将金融市场的K线序列理解为一种语言」,通过大规模预训练让模型学会金融市场的「语法」和「词汇」。与通用时间序列基础模型(TSFM)不同,Kronos专门针对金融数据的高噪声、多维度和非平稳性进行了优化设计,能够直接处理股票、加密货币、外汇等资产的K线数据并输出预测结果。 该模型主要支持三种下游任务。第一是价格序列预测,这是最核心的功能,模型接收历史K线数据后输出对未来价格走势的预测,支持1分钟、5分钟、15分钟、30分钟、1小时、4小时和日线共7种时间粒度,输出包括各时间点的开盘价、最高价、最低价、收盘价和成交额预测值。第二是波动率预测,这对于风险管理和期权定价等场景尤为重要,Kronos在已实现波动率预测任务上展现出比传统GARCH模型和通用TSFM更好的表现。第三是合成K线生成,可以基于学习到的市场规律生成逼真的模拟K线序列,这对于数据增强和策略回测具有重要价值——研究者在合成数据上训练的模型在真实数据上的表现甚至优于在部分真实数据上训练的基线模型。 在预测机制上,Kronos支持两种不确定性量化方式:温度采样(T参数)和核采样(top_p参数),允许用户根据风险偏好调节预测的「保守」或「激进」程度。此外,模型还支持批量预测模式,通过predict_batch方法实现GPU并行计算,可以同时对多个资产或多个时间段进行高效预测。GitHub仓库中提供了一个BTC/USDT 24小时实时预测的在线演示,用户可以直观体验模型的预测效果。
-
Kronos采用了创新的两阶段框架来处理金融K线数据。在第一阶段,一个专门的K线分词器(Tokenizer)将连续的OHLCV六维数据(开盘价、最高价、最低价、收盘价、成交量、成交额)转换为离散的Token序列。这里的核心技术是二进制球面量化(Binary Spherical Quantization, BSQ),它将每个K线记录的 embedding 投影到超球面上,生成20bit的二进制编码。为了捕捉多层次的市场动态,每个K线被量化为两个子Token:粗粒度子Token(10bit)和细粒度子Token(10bit),前者编码整体价格水平,后者编码细微波动。在第二阶段,一个Decoder-only的自回归Transformer在这些离散Token上进行预训练,使用因果注意力机制(Causal Self-Attention)确保预测只能基于历史信息,并通过旋转位置编码(RoPE)融入时间顺序信息。 预训练的数据规模是Kronos相比其他TSFM最具优势之处:模型在超过120亿条K线记录上进行训练,这些数据覆盖了全球45个以上交易所的多种资产类别,包括股票、加密货币、期货和外汇,数据时间跨度涵盖多种市场周期。预训练任务采用标准的自回归目标函数,让模型学习细粒度的时间表征和跨资产表征。 Kronos提供了四种参数规模的模型变体以适应不同的算力需求和性能要求。Kronos-mini是最轻量级版本,仅有4.1M参数,但上下文长度达到2048个Token,适合对长周期历史数据进行快速分析,只需约2GB显存即可在消费级GPU上运行。Kronos-small有24.7M参数,上下文长度为512,是目前开源社区中使用最广泛的版本,在性能和效率之间取得了较好平衡。Kronos-base是标准版本,包含102.3M参数,同样使用512的上下文长度,性能更为强大但算力需求也相应提高。Kronos-large是完整版本,拥有499.2M参数,性能最强但目前尚未开源,仅供研究使用。从架构参数来看,Kronos-small使用8层Transformer、512隐藏维度和8个注意力头,Kronos-base扩展到12层、832隐藏维度和16个头,而Kronos-large则进一步扩展到18层、1664隐藏维度和32个头。
-
Kronos提供了完整的微调(Fine-tuning)支持,允许用户使用自己的市场数据对模型进行定制化训练,这被认为是将模型应用于实际交易策略的关键步骤。微调流程基于量化投资平台Qlib实现,分为四个步骤:首先是使用Qlib准备数据,将用户的本地市场数据转换为模型所需的格式;其次是配置实验参数,包括训练集/验证集划分、学习率和批次大小等;然后是分词器微调,让分词器适应特定市场的数据特征;最后是预测模型微调,更新Transformer参数以学习特定资产的规律。GitHub仓库中提供了以A股市场为例的完整微调教程,用户可以参考该教程快速上手。项目文档还特别强调了生产环境部署的注意事项:原始预测信号不等于可直接使用的Alpha因子,需要通过投资组合优化模型进行风险因子中性化处理,并考虑交易成本和市场冲击等现实因素,微调代码本身仅作为演示用途,不构成生产级量化交易系统。
-
Kronos本身是完全开源的MIT许可项目,所有预训练权重均在Hugging Face上公开可下载,不收取任何费用。开源的模型包括Kronos-mini(NeoQuasar/Kronos-mini)、Kronos-small(NeoQuasar/Kronos-small)和Kronos-base(NeoQuasar/Kronos-base),用户可以直接通过Hugging Face的transformers库加载使用,官方号称「仅需4行代码」即可完成模型调用和预测。Kronos-large虽然未开源,但研究团队可能计划通过API付费调用的方式提供服务,这目前尚未明确。 从商业模式角度看,Kronos对研究者和个人量化爱好者极具吸引力,因为它消除了从头训练金融基础模型所需的海量数据和算力门槛。对于商业机构而言,可以基于Kronos开发闭源的增值服务,如针对特定市场或资产类别的专用预测服务、集成到量化交易平台的SDK、或提供模型微调和部署的技术咨询。目前已知的社区衍生项目包括kronos-dashboard(WebUI可视化界面),由GitHub用户haoyuhu开发维护,进一步降低了非技术用户的上手门槛。
-
正面反馈: 从中文开发者社区的讨论来看,Kronos最被认可的价值在于其「首创性」和「开源完整性」。多位知乎和CSDN作者指出,Kronos是「第一个专门为金融K线数据打造的基础模型」,填补了此前没有开源金融专用时序模型的空白。在此之前,开发者如果想用深度学习方法进行金融预测,只能依赖通用TSFM(如TimesFM、Chronos)或自己训练小型模型,前者对金融数据的处理并不理想,后者则受限于数据量和算力。 GitHub的高Star数量(19.4k)也反映了社区对该项目的认可。有用户在Issues中表示,Kronos的两阶段框架设计「非常优雅」,BSQ分词器的思路「有启发性」,让金融时间序列也能像文本一样被Tokenize,为后续研究提供了新的思路。此外,项目提供的BTC/USDT实时预测Demo被认为是「非常良心」的功能,让用户无需任何安装即可直观感受模型的预测效果。 从论文实验结果来看,Kronos在A股回测中的表现也获得了一定认可。研究者在沪深市场数据上的投资模拟显示,使用Kronos预测信号构建的投资组合,其年化超额回报(AER)和信息比率(IR)均为所有测试基线中的最高值。不过需要注意的是,回测结果不代表实盘表现,实际交易中还需考虑流动性、滑点和市场冲击等因素。 批评与质疑: Kronos也面临一些技术和实践层面的质疑。首先是关于「AAAI 2026接收」状态的争议:GitHub页面明确标注了AAAI 2026接收,但OpenReview页面上同一篇论文的收录信息显示为NeurIPS 2025 Workshop Poster,最终核实结果显示论文确实发表于AAAI 2026(DOI: 10.1609/aaai.v40i30.39730,2026年3月14日发布),但其早期传播路径经过NeurIPS Workshop,这种学术会议和Workshop的「先发表再正式接收」的情况在快速迭代的AI领域并不罕见,但可能引起部分用户的困惑。 其次是技术层面的局限性。从Medium上技术博主的深度分析来看,有学者指出「即使预训练了数十亿数据点的通用模型,在K线数据上仍可能逊于手工调优的领域专用架构」,金融数据的非平稳性、高噪声和独特市场微结构使得「一刀切」的基础模型范式难以直接迁移。Kronos的上下文长度限制在512个Token,对于高频交易等需要更长历史数据的场景可能不够用。此外,分词器的离散化表示必然丢失部分细粒度信息,粗粒度Token的实际使用率达到97.66%、细粒度Token为85.25%,说明存在一定比例的码字未被充分利用,可能存在优化空间。 在实践层面,有用户在雪球等平台分享了A股实测经验,指出Kronos对特定股票有一定预测能力,但效果「因股而异」,需要针对不同标的调整采样参数等超参数。还有评论提到预测信号不等于实盘盈利,将模型输出转化为可执行交易策略需要大量额外工作,这部分在官方文档中被描述为「生产建议」而非核心功能。
-
在时间序列基础模型谱系中的位置: Kronos的出现填补了金融专用时序基础模型的空白。从时间序列基础模型的发展脉络来看,2023年至2024年间,Google(TimesFM)、Amazon(Chronos)、Salesforce(Moirai)、Nixtla(TimeGPT)等巨头相继发布通用型时序基础模型,这些模型在各自的基准测试上展现了零样本预测能力,但它们并非专为金融市场设计——训练数据中金融类数据占比不足1%。Kronos的核心洞察在于:金融K线数据具有独特的OHLCV结构、高噪声特性和市场特定规律,通用TSFM的 tokenizer 和预训练目标无法有效捕捉这些特征,因此需要专门为金融市场设计的基础模型。 从架构类型来看,Kronos采用Decoder-only Transformer,这与TimesFM、Lag-Llama等表现较好的时序模型一致,而Moirai采用Encoder-only架构在通用时序理解(如异常检测)上更有优势,Chronos的Encoder-Decoder架构则在灵活性和多任务能力上较为平衡。Kronos的独特之处在于它的两阶段框架——先通过BSQ量化将连续金融数据转换为离散Token,再在Token层面进行自回归预训练,这与所有通用TSFM都不同,是一种针对金融数据的定制化设计。 主要竞品一览: 与Kronos最直接相关的竞品可分为几类。第一类是通用时序基础模型,主要包括TimesFM(Google,200M参数,Decoder-only,1000亿时间点预训练)、Chronos(Amazon,Encoder-Decoder,多领域概率预测)、Moirai(Salesforce,Encoder-only,多变量和异常检测)和TimeGPT(Nixtla,Transformer,API调用模式,精度提升60%)。这些模型的优势在于通用性和跨领域泛化能力,但在金融K线数据上的专项表现不如Kronos——论文显示Kronos的价格预测RankIC领先TimesFM达93%。 第二类是金融专用模型,包括BloombergGPT(Bloomberg,500亿参数,专为金融文本训练,不处理K线数据)和FinGPT(AI4Finance Foundation,开源金融大语言模型,聚焦金融情感分析和文本生成)。Kronos与这些模型形成互补:BloombergGPT和FinGPT处理金融文本,Kronos处理金融价格序列。第三类是学术和开源社区的量化模型,如Open Quant.AI和AI4Finance Foundation生态下的各类工具,Kronos作为「基础模型」与这些上层应用形成上下游关系。 从实际应用角度看,Kronos在金融预测这一细分场景上的性能优势是明确的,但通用TSFM在非金融时序预测任务上仍有优势,有经验的研究者可能会选择同时维护多个模型根据任务切换使用。Kronos的MIT许可和Hugging Face的便捷获取方式,使其成为目前金融K线预测入门和研究的首选工具。
-
Kronos的诞生与AI金融市场的快速发展密切相关。根据多方市场研究数据,2024年全球算法交易市场规模约211亿美元,预计2030年将增长至430亿美元,复合年增长率约12.9%;AI金融市场的规模从2024年的383.6亿美元预计将增长至2030年的1903.3亿美元,复合年增长率高达30.6%。AI算法交易平台市场在2024年约12.6亿美元,预计到2031年将达到33.52亿美元。 这些数据反映了量化交易和AI金融的强劲增长趋势,也为Kronos这样的开源工具提供了广阔的应用空间。Linux Foundation的2025开源金融服务业报告显示,84%的受访者认为开源对金融AI发展至关重要,56%认为基础模型对AI开发影响最大。Kronos的出现正好契合了这一趋势——它不仅降低了金融AI研究的门槛,也为商业机构提供了一个可定制、可审计的底层工具,这在强监管的金融行业具有特殊价值。
-
学术与工程层面的挑战: Kronos面临的首要争议在于「预测不等于盈利」这一根本性问题。金融市场具有高度随机性,即使是技术上领先的预测模型,也无法保证在实盘中获得稳定收益。Kronos论文中展示的A股回测结果虽然乐观,但回测存在过拟合风险——模型在特定历史时期的数据上表现好,不代表在未来能复制这一表现。更重要的是,预测信号只是量化交易流程中的一环,从信号到策略还需要资金管理、风险控制、交易执行等多个模块的配合。 其次是关于「开源大模型」的实际可用性问题。Kronos-large(499.2M参数)未开源,用户只能使用mini/small/base三个较小规模的版本。对于追求最高性能的商业应用,这可能构成限制。而即使是最大的开源版本,其499M参数的Kronos-large相比通用大模型仍属轻量级,在捕捉复杂市场模式方面的能力可能存在上限。 此外,Kronos的预训练数据截止到2024年6月,对于快速变化的市场环境(如突发事件、政策变化),模型的泛化能力可能受限。金融市场的非平稳性意味着历史规律不一定适用于未来,这是所有基于历史数据的统计模型共同面临的根本性挑战。 合规与伦理考量: 在监管层面,将AI模型用于交易决策在许多司法管辖区受到严格监管。Kronos作为开源工具,任何人都可以自由使用,但将预测结果直接用于实盘交易可能触发监管机构的审查,尤其是在高频交易和算法交易受到重点关注的背景下。此外,如果基于Kronos构建的商业服务涉及误导性宣传(如声称「AI预测稳赚不赔」),可能面临合规风险。 从技术伦理角度看,Kronos的预测能力可能被用于市场操纵(如通过虚假买卖制造虚假价格信号),尽管这超出了工具本身的设计范畴。任何金融AI工具的使用都应在合法合规的框架内进行,Kronos的作者也在README中明确声明了这一点。
-
适合使用的场景: Kronos最适合以下几类用户。第一是量化金融研究者,Kronos提供了从原始K线数据到预测信号的全流程baseline,研究者可以在此基础上快速验证新想法、对比不同模型架构,或将Kronos作为消融实验的基线。第二是AI/ML开发者,希望了解或实践「如何将LLM思路应用于时间序列」,Kronos的两阶段框架(分词器+自回归Transformer)是一个很好的学习案例。第三是个人量化爱好者,缺乏从头训练模型的数据和算力,但希望通过深度学习方法辅助自己的投资研究,Kronos-mini的低硬件需求(2GB显存)和简洁的API设计使这类用户也能上手使用。第四是金融科技公司,需要构建原型验证概念或快速迭代产品思路,开源的Kronos可以降低研发初期的投入风险。 使用建议与注意事项: 对于计划使用Kronos的用户,以下几点值得注意。首先,不要将模型输出直接作为交易决策依据,应将其视为众多参考因素之一,并建立完善的风险管理机制。其次,优先从Kronos-small或Kronos-mini开始试用,在熟悉模型行为后再考虑更大规模版本。第三,充分利用项目提供的Qlib微调流程,用自己目标市场的数据对模型进行定制化训练往往能获得比零样本使用更好的效果。第四,关注GitHub Issues和社区讨论,了解其他用户的使用经验和踩坑记录,这比文档更实时。第五,务必阅读官方README中的「生产建议」章节,理解从预测信号到实际策略的gap以及潜在的风险。 替代方案概览: 如果Kronos不适合你的需求,可以考虑以下替代方案。对于通用时序预测需求,TimesFM和Chronos是较为成熟的开源选择,它们虽然不是金融专用,但在能源、交通等领域有广泛应用。对于需要更长上下文和更强生成能力的场景,TimeGPT-2(Nixtla)的Pro版本提供了更高的精度,但需要付费订阅。对于金融文本分析需求,FinGPT和BloombergGPT更为专门化。对于高度专业化的量化交易需求,可能需要结合传统计量经济学模型(GARCH、ARIMA等)和机器学习方法的综合框架。
-
Kronos是金融AI领域一个重要的开源里程碑,它证明了针对金融K线数据专门设计的基础模型能够取得远超通用时序模型的效果。清华大学与微软亚洲研究院的合作背景、AAAI 2026的学术认可、19.4k GitHub Stars的社区热度,以及MIT许可下的完整开源,都使其成为当前金融量化研究和发展中不可忽视的工具。然而,必须清醒认识到,Kronos展示的性能优势主要在技术指标(RankIC、MAE等)上,将其转化为实际投资回报还需要大量额外工作,金融市场的复杂性和不确定性意味着任何预测模型都不是「银弹」。对于真正想在量化领域有所作为的研究者和实践者,Kronos提供了一个高质量的起点和坚实的基线,但最终的价值创造取决于使用者自身的专业能力和判断力。
用户评论
-
KMurray_Max—预测≠盈利,这是基本常识。Kronos论文的A股回测结果虽然漂亮,但回测过拟合的问题谁也说不准。别指望一个模型就能躺赚 -
书生933—19.4k Stars... 说实话有点离谱,一个金融量化模型能这么火确实说明清华+微软这个组合还是管用的。等了这么久终于有专门的金融K线基础模型了,开源免费真的太香了! -
G_erald143—有人试过用Kronos-large吗?499M参数那个,据说效果比small/base好很多,但目前还没开源有点可惜。倒是想看看完整版的性能到底能到什么程度 -
李兰丽—AAAI 2026 接收!学术背书到位了 -
WEram—已经在用Kronos-small跑回测了,确实比通用TSFM好用。但上下文512有点短,高频策略可能不太行 -
Joan_Allen_X707—城投打工人,工资停发一年多,全靠兼职和投资硬扛。今天只聊干货——Kronos这个模型,可能改变游戏规则 -
Gregory.KimIII—部署确实简单,官方说15分钟跑起来。我自己实测,模型加载+数据准备+predict调用,全流程下来差不多20分钟,关键是显存真的只要2GB,1060用户狂喜。不过说好的效果展示呢,文章里连具体准确率都没给,只有一堆曲线图... AIGC辅助内容,大家自行判断吧 -
2t03qn1—部署过程中遇到点问题,PyTorch版本不兼容,CUDA报错。最后装了CUDA 11.7+PyTorch 2.0才解决。另外FP16精度确实能省显存,但推理速度也慢了大概30%,大家自己权衡吧 -
Brian_Brown_20206—2GB显存就能跑!消费级显卡的春天来了。我1060终于不是摆设了,赶紧部署起来试试 -
lazywolf616—Kronos-mini只有4.1M参数但上下文2048,而且开源,这点真的很良心。Small版本24.7M参数512上下文,是目前生态最活跃的版本 -
Nicole_Ortiz_X—对比测试结果:价格预测RankIC比TimesFM高93%,比非预训练最佳基线高87%,波动率预测MAE低9%。数字很亮眼,但要注意这是在基准测试上的表现,实盘能不能复制就不好说了 -
BGonzalez_202098—说实话,数据量120亿条K线是真的离谱... 其他模型根本不敢比。但Token使用率的问题,粗粒度97.66%、细粒度85.25%,说明有优化空间 -
Bobby_Nguyen520—跟LSTM、GRU、XGBoost比了一下,在RankIC指标上确实有提升,但也不是碾压性的优势。胜在零样本泛化能力强,不用调参 -
Pamela.Morgan_Pro—基于Kronos做了个完整股票预测系统,配合Streamlit做可视化,效果比想象中好。GitHub上4.8k阅读确实不是白来的 -
JHicks—猫哥AI量化亲测!A股实测教程来了,Qlib数据+微调全流程都有。对散户来说门槛真的降低了不少 -
Christian_Mendoza_2020—开源项目里难得有完整文档和微调教程的,GitHub README写得很详细。但有一个问题——预训练数据截止到2024年6月,之后的市场环境变化模型能跟上吗?这个感觉是个隐患 -
孟晨怡—神器级开源项目!120亿条K线数据训练,45个全球交易所,7种时间粒度,清华这波真的秀 -
任飞伟—Kronos在GitHub Trending上刷屏了... 19k Stars不是盖的。国内开源项目能冲出海的真的不多,清华这个牌子在海外还是有号召力的 -
AnthonyTorresX—第一个真正面向金融K线的开源大模型! -
Sophia109_lab—已跑通A股回测全流程,Qlib数据准备->Tokenizer微调->Predictor微调->跑top-K策略。官方demo确实很良心,但说白了就是个demo,实盘还远着呢 -
PLmar—花了三天把A股微调流程跑通了,踩了不少坑:Qlib数据格式转换比较麻烦,Tokenizer微调loss下降慢,Predictor微调要调参。不过跑出来的预测走势看起来还算合理,配合Qlib的backtest跑了个简单策略,勉强跑赢了基准。实盘?不敢想。 -
Bobby.Thompson_99—研究了一下BSQ分词器的设计,感觉有一定信息损失——离散化表示必然丢失部分细粒度信息。但话说回来,这种权衡可能是必须的,不然没法用Transformer处理 -
MrDemidBoyarchuk—花姐测评来了!一句话:第一个真正意义上的面向金融K线数据的开源大模型。微调案例用Qlib跑A股,完整流程都给了 -
tpatevziq—专门用于解码并预测金融时间序列数据的开源模型,用了都说香! -
JudithPerez168—被LSTM、GRU折磨了两年的我,看到Kronos的瞬间感觉看到光了... 清华李健教授团队突然扔出个Kronos,120亿条K线数据训练,这数据量真离谱 -
EsatKöylüoğlu—说实话,AAAI 2026这个title有点水分?查了半天实际是NeurIPS 2025 Workshop先发的... 当然论文质量本身是够硬的 -
Logan_Jackson_722—金融AI圈子里的人应该都知道,预测信号≠可交易策略。Kronos官方README里也特别强调了这一点,从信号到策略还需要投资组合优化、风险中性化、交易成本处理... 这些工作量可不比建模小 -
Ryan.SmithIII7—两阶段处理框架确实有东西,专用Tokenizer将连续OHLCV数据转化为离散Token,捕捉价格波动的层级结构。怎么说呢,思路很新 -
mim3ev6jwl—MIT许可开源,真香!Hugging Face直接下载,4行代码就能跑起来,终于不用自己训练了 -
KEbro—收藏了,感觉能用来做很多事情