您当前所在位置:

利用数据挖掘技术 做好档案编研选题之探析

2013-01-10

建立模型是个反复寻求最佳模型的过程。我们把挖掘数据库分成两部分:一部分用来进行模型训练,另一部分用来测试模型。我们首先利用训练集建立一个用户模型,然后用测试集对模型进行测试;根据测试结果,对训练数据进行一些修改或新建预测变量,再生成新的用户模型。建立新的用户模型可以使用与上次一样的算法,也可以取用其他算法建模。最后,从建立的几个用户模型中选择一个最有效的模型。

(5)评价和解释

档案用户模型建好后,需评价其实用性和有效性,解释其价值。我们可从原始信息数据库中拿出一定百分比的数据作为测试数据,对建立的模型进行测试。通过对模型给出的结果和原始数据信息进行比较,测量出模型的准确率。若准确率高于既定的标准,就认为这个模型是有效的;若低于既定标准,则需找出错误原因,并重新进行挖掘。

威廉希尔app  档案学栏目