催化类基金指标怎么写?
题主是写论文还是做什么? 如果单纯从研究目的的角度来说,其实没必要把类别都分出来,因为对于大多数金融工程研究问题来说,我们往往最终希望得到一个“普适”的结果(对于特定条件下的特殊结果往往是通过调整模型中的参数来得到)。因此本质上分类的问题实际上就是模型选择的问题。 但是如果是论文写作或者实际工作应用的话,确实需要考虑各个因素对结果的解释力。所以我建议: 首先是样本量,不同类的数据其样本量的来源必然不同,如果直接对比,很容易出现偏差; 所以最好是计算每类数据自身的样本标准差,然后进行标准化处理。
其次是对应的预测精度,由于本题没有给出具体的预测任务和要求,我以股票市场的收益率为例来讲(其他问题可以类似处理): 一般我们评估预测精度的指标有平均绝对误差、均方误差和R^2值等,考虑到本文的目的在于分析不同类型数据对预测结果的影响,因此最好的方法是以每个类别数据的预测精度作为因变量,以对应的数据类型为自变量进行回归,这样可以通过F检验来考察各变量的显著性水平以及P值来评估整体模型的拟合程度。
当然,也可以以单个数值来代表每种类型的数据,比如以每个数据集的均值作为特征向量为每一类数据构造一个d x 1的矩阵,其中 d 为特征个数,然后将所有数据集中的特征向量连接起来得到总体的特征向量,最后利用线性回归的方法即可。 以上两种方法是基于预测精度这个宏观角度来考虑的,但如果需要考虑各个指标的具体含义以及它们对结果的不同影响程度,则需要做更多的基础工作了。
首先是需要构建正确的预测模型,然后针对模型的输出结果进行评价。 建模的方法非常多,最典型的就是时间序列的ARIMA模型,不过我认为对于金融时间序列数据,更好的方法是考虑利用随机过程或贝叶斯的方法来进行建模,至于具体的方法则取决于数据的特点及问题的类型。
模型的输出结果的评价通常有误差分析和假设检验两方面的内容。 在建立模型的过程中,需要对未知参数等进行估计,此时需要的参数估计的误差分析内容;在模型建立完成后,需要对预测精度进行衡量,这涉及到了假设检验的问题。所以无论是建模的过程还是模型的验证过程,都需要注意选择正确的统计量,同时进行有效的统计推断。