利用数据挖掘技术　做好档案编研选题之探析_档案学

您当前所在位置：

利用数据挖掘技术　做好档案编研选题之探析

2013-01-10

建立模型是个反复寻求最佳模型的过程。我们把挖掘数据库分成两部分：一部分用来进行模型训练，另一部分用来测试模型。我们首先利用训练集建立一个用户模型，然后用测试集对模型进行测试;根据测试结果，对训练数据进行一些修改或新建预测变量，再生成新的用户模型。建立新的用户模型可以使用与上次一样的算法，也可以取用其他算法建模。最后，从建立的几个用户模型中选择一个最有效的模型。

(5)评价和解释

档案用户模型建好后，需评价其实用性和有效性，解释其价值。我们可从原始信息数据库中拿出一定百分比的数据作为测试数据，对建立的模型进行测试。通过对模型给出的结果和原始数据信息进行比较，测量出模型的准确率。若准确率高于既定的标准，就认为这个模型是有效的;若低于既定标准，则需找出错误原因，并重新进行挖掘。

威廉希尔app 档案学栏目

下一篇：《档案法》中的法律责任探析

利用数据挖掘技术 做好档案编研选题之探析

利用数据挖掘技术　做好档案编研选题之探析