第15章 新的研究方向 (第3/3页)
识别市场中的统计学规律,并依据这些规律进行自动化交易。
通俗来讲,可以把那些基于复杂模型和算法的量化交易策略,抽象的看成是一个Y=f(X)的函数。
X代表了各种市场数据、经济指标等等,也就是所有可能影响市场走势的信息。这些可以是历史价格、成交量、订单簿数据、新闻情感、公司财报、宏观经济数据等等。
Y代表了模型的交易决策或预测,比如买入/卖出信号、仓位大小、预测的价格方向或波动率等。
这其实和神经网络是一样的,因为神经网络的本质就是通过海量的数据来尝试拟合或学习一个复杂的非线性函数。
所以现在的量化交易越来越普遍地使用神经网络,尤其是深度学习模型。
只不过这种模型肯定都是不可能开源的,毕竟这都是人家吃饭的家伙事。
周昀越想越觉得可行。
如果真的能搞出来,毫不夸张的说,他就真的不缺钱了。
但是饭要一口口吃,科研也得一步步来。
想要训练一个涵盖整个股市的模型,光凭现在的资源肯定是远远不够的,但是如果只是仅仅训练一个可以预测一支股票的模型,周昀觉得,可以尝试一下。
确定了接下来的研究方向,周昀当即就行动起来。
这种股票预测任务,在AI领域有一个专门的名词叫做——TSF,即Time Series Forecasting,时间序列预测。
现有的TSF算法很多,但如果想将这些算法直接运用到股票交易的预测中,那不给你底裤亏光都算是不错了,
毕竟如果真这么简单的话,研究这些算法的人,一个个早就变成亿万富翁了。
主要的难点其实可以总结为两个。
第一个就是高质量且海量的历史数据,这个其实不难搞,就是麻烦,毕竟要把他们整理成可以训练的数据还是需要一些处理的。
第二个就是算法本身了,别看很多论文里把自己的算法吹的有多牛逼,但那都是在特定数据集上的结果,
事实上很多算法别说换数据集了,哪怕是稍微调整一下数据集的数据分布,结果都会大为不同。