基于隐私政策条款和机器学习的应用分类

为了提升隐私政策可读性并评价其质量,提出一种基于机器学习的中文隐私政策条款自动分类方法。首先,确立条款分类指标体系,从不同类别条款中提取特征;其次,建立和训练基于机器学习算法的层次多标签分类模型,在测试集上通过实验对比各算法性能;最后,基于分类结果检测隐私政策的虚假性和完整性,同时设计了隐私政策评价方法对其进行评分。实验结果表明,支持向量机模型在分类效果上优于其他模型,准确率达到 86%,验证了该方法在自动分类隐私政策条款上的可行性。此外,对华为应用市场中1500 篇隐私政策检测发现,其中 38.5%不是隐私政策,余下隐私政策中92.5%的内容不完整,大部分得分偏低。

朱璋颖,陆亦恬,唐祝寿,张 燕

Leave a Reply

Your email address will not be published. Required fields are marked *