摘要:基于用户击键特征的身份认证比传统的基于口令的身份认证方法有更高的安全性,现有研究方法中基于神经网络、数据挖掘等算法计算复杂度高,而基于特征向量、贝叶斯统计模型等算法识别精度较低。为了在提高识别精度的同时有效降低计算复杂度,在研究现有算法的基础上提出了一种基于遗传算法与灰色关联分析的击键特征识别算法。该算法利用遗传算法根据用户训练样本确定表征用户击键特征的标准特征序列,通过对当前用户击键特征序列与标准特征序列进行灰色关联分析实现用户身份认证。实验结果表明,该算法识别精度达到神经网络、支持向量机等算法的较高水平,错误拒绝率与错误接受率分别为0%与1.5%。且计算复杂度低,与基于特征向量的算法相近。
关键词:
用户身份认证;击键特征;遗传算法;灰色关联分析
0引言
采用生物特征识别的身份认证是根据用户独特的生理特征(如指纹、虹膜、语音、击键特征等)来认证用户的合法性。与传统的身份认证相比,它具有更好的安全性。在这些生理特征中,击键特征不需要增加新的硬件设备,在用户输入口令时,由系统自动提取其特征,对口令和击键特征同时进行认证,比其他的生物特征使用更加方便。
击键特征用于用户身份认证最先由Gaines等人[1]于20世纪80年代提出,此后出现了许多这方面的研究成果。Leggett[2]和Bleha [3]等人用统计分析理论,在假设样本为正态分布的前提下,将测试样本与训练样本进行比较。该方法识别精度低,需要一定的训练样本而且目前尚没有实验数据和理论依据证明击键特征符合正态分布。Ru等人[4]采用了模糊数学的方法,将击键速度分为快、中、慢3个等级后,进行模糊处理并判断,随后Tapiador等人[5]也尝试了模糊算法,但该类方法特征选取不充分,分类不精确,Brown和Rogers[6] 和Cho等人[7]用神经网络的方法,Enzhe Yu[8]将遗传算法和支持向量机理论结合,获得较好的效果,但所需训练样本空间大、训练时间长。Aykut Guven[9]等人提出一种基于特征向量的快速识别算法。他只取该用户上一次成功登录原为:登陆的击键特征向量作为标准向量与测试样本进行比较来确定用户身份,这种简单的处理方法虽然有效降低了计算量,识别速度快,但也同时降低了系统的鲁棒性,导致较高的误报率。
本文基于遗传算法和灰色关联分析理论,提出一种计算复杂度低而识别精确度较高的击键特征用户身份认证算法,该算法采用全局搜索性强的遗传算法,基于训练样本,得到最佳描述用户击键特征的标准特征序列,然后通过计算当前用户的击键特征序列与合法用户的标准击键特征序列之间的灰色斜率关联度来认证用户的合法身份。实验结果表明,该算法识别精度可以达到神经网络、支持向量机等算法的较高水平,其正常用户的平均拒绝率(FRR)为0%,非法用户的平均通过率(FAR)为1.5%,而且计算量及识别速度与Aykut Guven[9]等人的算法相近。
1遗传算法与灰色关联分析
1.1遗传算法
遗传算法是一种模拟生物进化过程的随机方法,它的思想来源于生物遗传学和优胜劣汰的生存竞争规则。它将问题的可能解集通过基因编码构成初始种群(父代)开始迭代,计算父代个体的适应度,满足优化准则,跳出迭代;否则,通过选择、交叉或基因重组、变异等操作形成新的个体(子代),计算子代个体的适应度,子代插入到父代中,重新开始循环,直至满足优化准则,使种群的进化到包含近似最优解的状态。其流程图如图1所示。
1.2灰色关联分析
灰色系统理论由我国学者邓聚龙教授于1982年提出,用于处理信息不完备、不确定,数据较少的系统。灰色系统理论与概率和数理统计的方法相比,需要的样本空间小,数据不一定服从典型的分布,计算量小,不会出现量化结果和定性分析结果不符的现象;与模糊数学相比,不依赖经验,强调信息优化,研究现实规律[10]。
距离空间只限于点点的距离比较,其距离作为比较的测度,点集拓扑是整体的比较,是领域的比较,但没有测度。距离空间与点集拓扑空间相结合,就构成了灰色关联分析空间[11]。它是一种有参考系的、有测度的整体比较。灰色关联分析是根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线相似程度越大,相对应的序列联系越紧密,关联度越大,反之,关联度就小。灰色关联分析反映出灰色系统各因素之间发展趋势的相似或相异的程度。灰色斜率关联度根据序列曲线的斜率的接近程度来判定曲线的接近程度,曲线斜率相差越小,序列的关联度就越大。灰色斜率关联度[8]的相关定义如下:
设X(t),t=1,…,n为参考序列,Y(t),t=1,…,n为比较序列,称
为X(t)与Y(t)在t时刻的灰色斜率关联系数。
其中:
2本文算法
2.1击键特征模型
击键特征是指人在敲击键盘时的力量和速度特性,不同的人,敲击键盘的节奏模式就不相同,属于人的生物特征之一。击键特征主要体现在:击键延迟时间(keystroke duration time)和击键间隔时间(keystroke latency time),D(i)表示第i键的延迟时间,指第i键按下与第i键弹起之间的时间,L(i)表示第i键与第i+1键的间隔时间,指第i键弹起到第i+1键按下之间的时间。
击键特征序列由D(i)和L(i)共同构成。对于m位长的密码,击键延迟时间和击键间隔时间分别为:D(i),i=1,2,…,m和
2.2遗传算法产生标准序列
本文的算法是通过计算合法用户的标准序列和登录用户的测试序列的灰色斜率关联度,来判断用户的合法性,其中标准序列能否真正的反映合法用户的击键特征成为一个重要的制约因素。由于遗传算法的适应性强,能搜索到全局最优解的良好搜索能力,我们对于训练样本采用遗传算法来搜索,寻找最佳的标准序列T*,该标准序列与样本空间的所有序列的灰色斜率关联度都很大。
对于新用户,采集用户键入密码稳定时的特征序列Ti(i=1,2,…,S)构成训练样本,将训练样本Ti(i=1,2,…,S)作为初始种群,采用二进制的编码方式。个体i的代价函数Ψi的定义:
其中εij表示i个体与训练样本空间中的训练序列j的灰色斜率关联度。
Ψi越小,反映出个体i与样本空间的序列越相似,越能代表用户的击键特征。种群的代价函数Ψ={Ψ1,Ψ2,…,ΨS},适应度计算我们采用了rankscale[12] 的方法,对种群的代价函数值进行升序排列,排在第j位的个体适应度为:
代价函数j越小,其适应度越大。
我们采用轮盘赌和跨世代精英的方法来进行选择。根据适应度进行轮盘赌的选择机制,被选中的个体进行单点交叉和变异的遗传操作,形成中间种群,该种群与父代种群合并,计算合并种群中每一个体的代价函数,适应度,将适应度从大到小排序,适应度大的前S个个体作为下一代种群,进行下一次的循环。
当种群中含有代价函数Ψi小于0.02的个体时,循环结束,即找到了最优个体;或者迭代结束时,代价函数最小的个体为最优个体。
2.3基于灰关联的击键特征识别算法
对于熟练的计算机使用者,按照上述击键间隔时间的定义,可能会出现负值,而灰关联分析是对非负序列进行分析的,必须对数据进行预处理。灰色斜率关联度和序列的空间位置没有关系,仅与其几何形状有关。我们对训练样本的序列及登录时测试序列的各个因素都加上数值K,来保证数据的非负性。
基于灰关联的击键特征识别算法为:当用户登录时,生成比较序列T,而由训练样本通过遗传算法形成的标准序列T*作为参考序列,根据式(3)计算两序列的灰色斜率关联度ε,两序列的关联度越大,说明比较序列越相似于参考序列,根据实验,设置合适的阈值M,当ε>M时,判定用户为合法登录;当ε≤M时,判定用户为非法入侵。
3实验结果及分析
本文数据采集通过VC++ 6.0编程获得,精度为ms级。随机设置口令4个,长度为4~10个字符,对于每个口令,采集合法用户在一段时间内击键样本280个,模拟入侵样本230个, 合法用户的测试样本由用户间隔几个小时输入密码一次和模仿人疲惫时,连续不断的输入密码两种形式构成,对于每一个口令均有4个以上的非法入侵者,模拟恶意入侵的情况连续输入密码50次,构成入侵样本。在击键样本中随机抽取80个,在模拟入侵样本中随机抽取30个做训练样本集A,其余构成测试样本集B。
3.1实验结果
对每个口令, 在训练样本集A中随机抽取50个合法用户的击键样本,根据遗传算法确定合法用户的标准特征向量, 交叉率取0.8,变异率取0.005。计算训练样本集中剩余击键样本与标准特征向量的灰色斜率关联度,结果如图2所示, 其中横轴为灰色斜率关联度,纵轴为样本数。
由图2可以看出,对于合法用户样本, 灰色斜率关联度特征分布非常集中,类内离散度很小。由于入侵样本来自不同人的击键模式,所以分布较为分散,但其值均小于0.9,因此阈值M选为0.89。用测试样本集B对此算法的性能进行了测试,结果见表1。
3.2实验结果分析
由图1可以看出,用灰色斜率关联度作为分类特征,合法用户样本的类内离散度很小,入侵样本虽然分布分散,类内离散大,但与合法用户的样本分布有一定距离,所以灰色斜率关联度是一种很好的分类特征,由表1可以看出非法用户的通过率(FAR)和正常用户的拒绝率(FRR)都非常小,平均为
1.5%与0%,显著优于基于特征向量、贝叶斯统计模型等算法,已经达到了神经网络方法、数据挖掘和支持向量机算法的最高水平。本算法虽然在利用遗传算法获得描述用户击键特征的标准特征向量有一定的算法复杂度,但其识别过程只需要计算当前用户击键特征向量与合法用户标准击键特征之间的灰色斜率关联度,其时间复杂度与基于特征向量的快速识别算法相当,是一种计算复杂度低、识别精度高的基于击键特征的用户身份认证方法。
4结语
本文提出一种基于击键特征的用户身份认证方法,该方法利用遗传算法在训练样本集中确定能表征用户击键特征的标准特征向量,然后计算待识别用户的当前击键特征序列与标准特征向的灰色斜率关联度来识别合法用户和非法用户,实验表明,该算法性能显著优于基于特征向量、贝叶斯统计模型等算法,已经达到了神经网络方法、数据挖掘和支持向量机算法的最高水平。其识别过程只需要计算当前用户击键特征向量与合法用户标准击键特征之间的灰色斜率关联度,其时间复杂度与基于特征向量的快速识别算法相当,是一种计算复杂度低、识别精度高的基于用户击键特征的身份认证方法。
排行
- 公司治理结构与会计信息披露:一
- 存货跌价准备审计全程精解
- 对法航货机穿越中国领空“壮举”
- 农产品出口突破技术贸易壁垒的思
- 数控技术专业数控机床编程与加工
- 浅谈电子商务中的安全问题
- 熟悉的陌生人—浅析鲁迅笔下的三
- 公司治理模型的发展与评价
- 李清照词在不同时期所表达的情感
- 分配理论的陈述——与卫兴华、谷
- 网络经济中的“赢家通吃”现象与
- 论我国夫妻财产制的不足与完善
- 关于“文化产业”定义的一些思考
- 从认知语言学看名词临时作量词的
- 百花齐放 异彩纷呈----浅析《红楼
- 数控技术发展趋势及对策
最近更新
基于遗传算法和灰色关联分析的击键特征识别算法


联系我们
返回 计算机论文 列表