"); //-->
在生活愈发数字化的今天,身份识别直接关系着每个人的切身利益,但如何在数字世界中安全地证明 “自己是谁”,一直是一个棘手的难题。
账号密码或者手机验证码登录是最常见的方法。再升级一下,指纹、虹膜等生物特征识别技术算是更高级的识别手段。
不过这些身份验证手段并非绝对安全可靠,即使有多重验证等保护措施,被盗号、被偷钱的事情还是屡见不鲜,随之泄露的还有个人隐私和敏感数据。
如何打造“数字身份证”,在当前数据开放、互联、共享的计算环境下防范隐私数据的非授权访问,已经成为迫切需要解决的问题。
这也是西安交通大学教授沈超的主要研究方向之一。
他认为,随着智能设备的普及,现有身份验证手段难以满足未来的数字生活需求。因此他提出了一系列基于人机交互行为特征识别的新型数字身份识别理论和技术。
简单来说,就是从你使用电子设备的习惯判定是不是本人在使用。有点类似于现在许多科技公司通过IP地址判断账号是否存在被盗风险,但更精准、易用、个性化,而且难以模仿。
在此基础上,他还以用户与传统计算机终端、智能触屏设备、可穿戴设备等新型移动终端中广泛存在的多源人机行为作为研究对象,研究多源人机行为协同建模的身份识别技术和方法。
相关研究填补了人机行为理解、身份建模、身份主动识别等方面的空白,不仅发表在领域内多个顶级会议和期刊上,多次获得最佳论文奖,还被集成到了自主研发的网络与信息安全防护产品中,被 800 多家公司和机构所使用。
基于上述贡献,沈超入选了《麻省理工科技评论》“35 岁以下科技创新 35 人”2020 年中国区榜单。
对应“物理身份”和“数字身份”
2003 年,沈超在西安交大开始了大学生涯。在好奇心的驱使下,他了解到了时任西安交大电子信息工程学院院长管晓宏组建的 “智能网络与网络安全教育部重点实验室” ,并且争取到了实习机会,第一次见识到了网络安全和人工智能等前沿技术。
当时他已经获得了保研资格,实习经历进一步加深了他对网络安全相关领域的兴趣,于是就将网络安全和人工智能确定为主要研究方向。
“我觉得自己很幸运,能把兴趣和从事的工作紧密结合起来,而且大部分研究都是兴趣驱动,”沈超在采访时表示。
以硕士身份加入实验室后,他如愿以偿地踏入了科研领域,随后凭借实力获得了管晓宏教授的认可,得到了前往美国卡内基梅隆大学进修的联合培养博士资格。
攻读博士期间,沈超的主要研究方向是基于人机行为分析的身份识别技术。他告诉 DeepTech,之所以选择这个方向,是因为自己注意到许多人经常会忘记账号密码,所以想找到一种更好的方式来对应“物理身份”和“数字身份”。
正如文章开头所说,身份证是物理世界中证明个人“物理身份”的主要工具,而在数字世界中,人们也需要类似的东西来证明“自己是谁”。
目前主流身份识别手段包括账号密码、多重验证、生物特征识别等等,但它们或多或少存在安全隐患,比如被遗忘、丢失、盗用、破坏。
沈超选择另辟蹊径,从“人机行为描述、行为身份表征、行为多视图分析”三个维度审视数字世界身份识别理念,开展了基于人机交互行为特征识别的新型数字身份识别理论和技术研究,面向移动互联网、电子商务等多种应用场景。
这种基于人机交互行为的身份识别技术,理论上可以实现安全的动态认证,因为交互行为难以模仿,同时又无需额外硬件,用户也不用记忆密码,验证凭证难以被伪造和窃取。
基于人机互动行为的身份识别
具体来说,无论是在物理世界还是数字世界中,每个人都有一套独一无二的行为习惯。比如上楼习惯先迈左腿还是右腿,打字习惯用双手还是单手,打字的节奏等等,这些行为都可以作为识别身份的验证信息。
但说起来容易做起来难,因为交互行为大多是微妙的、非结构性的细节,很多时候用户自己都注意不到,难以捕捉和建模。
为此,沈超提出了一系列能够准确表征和建模人机交互行为的理论和技术,能够对动态行为关联及隐含结构进行描述和表征,还能解析动态非结构性特征。相关成果可以对人机行为动态语义信息进行完整描述,应对场景迁移后的人机行为表示。
另一方面,像是触摸手机这样的简单交互行为表征起来过于宽泛,而且人机交互过程中充满随机性和不确定性,可能导致底层特征与高层身份表征不一致,这又被称作“语义鸿沟”。
针对该问题,他提出了人机行为与身份表征之间关联映射机理的建模方法,基于黎曼流形变换的映射模型可以有效缓解人机行为波动带来的认证精度的负面影响。
这种建模过程十分复杂,涉及到行为采集,行为描述和语义提取。例如要对手部进行建模时,一只手就有两千多个关节,要用到很多摄像头和传感器来捕捉、描述手指的运动过程,然后才能提取行为特征进行建模和描述。
此外,人机行为的捕捉和分析还存在迟滞性,难以满足身份识别场景所追求的高效性。
通过利用和量化不同场景下的人机行为先验知识,沈超构建了一套贝叶斯框架下的人机行为分类器,继而对人机行为的长周期趋势性变化规律,以及多视图场景中的行为一致性与差异性进行深入分析。
由此诞生了新颖的多视图融合的在线主动身份认证和监控方法,可以有效解决行为趋势性变化和行为模型的迟滞性难题。
虽然这些科研项目是在他读博期间开始的,但后续研究持续至今。
“因为人机交互身份识别是很新兴的领域,最早开始研究的时候几乎找不到什么参考资料,”沈超回忆道,“所以只能慢慢摸索,有一年多的时间几乎没有任何成果,挺苦的。”
好在终于苦尽甘来。这些成果有的推动了领域内后续研究,有的被斯坦福大学等国际知名高校选为课程阅读材料,还有数篇论文斩获了领域内顶级会议的最佳论文奖。更重要的是,它们最终融合到了沈超团队研发的人机行为身份识别系统中。
这套系统兼顾传统终端、网页终端、移动终端等多种终端类型,适用于多种应用场景,目前已集成到他的团队研发的网络与信息安全防护产品中,应用于 800 余家国内企事业单位的业务系统安全模块中。
时空大数据协同计算
在卡内基梅隆大学进修两年多后,面对导师给出的留任 offer,沈超一番权衡,还是决定回国,为中国发展贡献自己的力量。
“我们整个实验室都很遗憾看到他离开。我的实验室有很多实习生,沈超无疑是其中最出色的,”导师 Roy Maxion 教授毫不掩饰自己对沈超的认可。
就这样,回到西安交大的沈超在 2014 年拿到了博士学位,继而留在母校担任副教授。2018 年,他升任教授和网络空间安全学院副院长。算下来,他已经在西安交大学习、生活、工作了 16 年。
任教之后,除了延续身份识别方面的研究,沈超还将科研方向拓展到了数字世界的时空大数据协同计算问题。
所谓时空大数据,指的是从时间和空间两个维度来处理用户行为产生的大数据。而协同计算指的是对来自不同终端的数据进行收集,建模,计算和分析。
此类数据具有典型的多源异构、快速多变等特性,比如智能手机和智能手表收集上来的行为数据存在较大差异(多源异构),使得传统的机器学习、信息检索、数据挖掘等计算方法不能有效支持时空大数据的处理、分析和计算。
此外,时空大数据中包含大量无意义的噪声,如何取其精华,提炼成具体关注某个地区、某个人群、某种属性、某个年龄段等等的有应用价值的时空小数据,也是沈超重点研究的方向之一。
他带领团队首次提出了一种基于图切割和图挖掘的时空大数据融合与计算框架。如果将每个用户视为网络空间中的一个节点,那么两个用户之间的关系就构成了一条边,用户之间互动行为也可以当作一条边。这样就构建了一张图出来。
随后沈超团队采用了图切割和图挖掘的方法,建立了基于图嵌入的时空数据关联计算与挖掘的新模式,可以实现对某个或某类节点的追踪和切割(分类),进而挖掘出更有价值的信息。典型应用包括追踪商品在用户之间的传播方式,探索购买力的形成,挖掘用户与商品之间的关系等等。
基于该框架和相关数据分析及挖掘技术,他还带领团队开发了可视化系统,满足了工业界对大数据挖掘与可视化的需求。
相关技术成果已经被集成于大型企事业单位的数据库引擎中,在电商交易环节中的物流管理、地域库存管理等众多时空场景下发挥作用,还能拓展到智慧交通、城市大脑、地理遥感测绘等众多云计算领域。
对抗环境下的人工智能安全与深度测试
谈到未来的科研计划,沈超表示当今社会正在经历着由深度学习技术推动的人工智能浪潮,以往的机器学习理论大多没有考虑开放甚至对抗的系统运行环境,人工智能系统的安全和隐私问题正逐渐暴露出来。
他所在的团队近年来从人工智能系统的 4 个关键环节——数据输入(传感器)、数据预处理、机器学习模型和应用输出逐步开展了安全分析及对策研究。
同时,针对深度学习模型自身的黑盒“不可解释性”及区别于传统逻辑驱动软件的“数据驱动特性”所带来的“可信人工智能”挑战,他们还开展了对深度学习系统在安全攸关领域中应用安全的风险评估。
下一步,他将继续围绕数字世界中可信人工智能系统展开研究,探索对抗环境下人工智能系统的内生安全,以及面向可靠人工智能的深度测试。
在采访的最后,沈超总结道,“西安交大成立之初有许多来自上海交大的老教授,虽然当时西部环境艰苦,但他们还是选择留在这里教书育人。身为教授,我认为要向前辈们学习,除了科研任务,还要恪尽教书育人的本职工作,培养更多的优秀人才。”
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。