With the rapid develop and popularity of smart phone devices, E-commerce and E-government services on smart phones, more and more sensitive information is also stored in the smart phones. Users may face the risk of sensitive information leakage if they agree the privacy policies without reading or understanding them. In this project, we focus on the problem of sensitive information protection in Android apps, especially in the aspect of automatic interpreting and presenting privacy policies of Android apps. The research topics of this proposal include three parts. Firstly, we extract the contents related to accessing, storing and sharing sensitive information from Android app privacy policies based on natural language processing and machine learning techniques. To cater the special domain of Android privacy policy, we propose a new model to incorporate global context information. Secondly, we analyze Android app APK files to find the real behavior of accessing users’ sensitive information, and compare with the information extracted from the privacy policies to find inconsistencies. Lastly, we employ the human-computer interaction theory and method and design expressive user interfaces and formats, to present the information extracted from the previous steps to Android users. This project aims at aiding users in accurately understanding the privacy policy contents, and getting aware of the potential information leaking threats that they may encounter. Through the study of this project, we want to raise users’ attention of privacy protection, decrease the possibility of sensitive information leakage, which will further increase the security level of Android phones, and prevent users from facing threats on economic, or even reputation perspectives.
随着智能手机的普及以及电子商务,电子政务在移动端应用的快速发展,用户的诸多敏感信息也存储在智能手机之中。在不能仔细阅读或准确理解隐私协议内容的情况下同意或接受协议,将使用户面临潜在的敏感信息泄露的风险。本项目着眼安卓用户的敏感信息保护问题,着重研究自动解释与展示安卓应用的隐私协议问题。本课题的研究分为三个部分。首先,通过自然语言处理和机器学习等方法,考虑全局上下文信息,提出全新的面向安卓应用隐私协议的信息抽取模型,进而抽取敏感信息访问相关的内容。然后,从安卓应用APK文件中抽取敏感信息访问的真实行为,与从隐私协议中抽取的信息进行比对,检测不一致性。最后,利用人机交互的理论和方法,设计合理有效的用户界面以及展示形式,帮助安卓用户更准确高效的理解协议的内容。该研究课题可以提高用户对隐私保护的意识,降低用户敏感信息泄露的可能性,进而减少安卓用户潜在的经济,乃至名誉等方面的损失。
随着《中华人民共和国个人隐私保护法》在2021年11月1日正式实施,中国公民的个人隐私数据开始受到法律保护。然而,个人隐私保护意识的薄弱,以及在多种情况下的信息不对称导致个人用户的隐私数据在不知情的情况下被侵犯。例如用户在不能仔细阅读或准确理解隐私协议内容的情况下同意并接受协议,将使用户面临潜在的敏感信息泄露的风险。本项目从安卓用户的敏感信息保护问题入手,研究与隐私协议自动分析理解以及可视化相关的问题。本课题主要研究三部分的内容:首先,通过自然语言处理和机器学习等方法,考虑全局上下文信息,提出面向隐私协议的信息抽取、篇章分析以及句子分析模型,进而帮助理解敏感信息访问相关的内容。第二,对来自不同数据源的信息的合规性及一致性的检测问题,例如隐私协议与法律法规的合规性检测问题,安卓应用GUI界面与真实API行为的一致性检测问题。第三,利用可视化与人机交互的理论和方法,设计合理有效的用户界面以及展示形式,帮助用户更准确高效的理解协议的内容。围绕上述三个研究内容,我们设计了3个基于自然语言处理的深度学习模型、分别进行段落、语句分类以及隐私信息实体抽取,我们还开发了可视化界面,用以展示上述提取的信息,并将上述模型集成到一起,以支撑隐私协议重构、隐私协议合规性检测等上层应用任务。依托该项目发表国内外高水平会议、期刊论文14篇(包括CCF A类论文6篇,B类5篇),申请专利5项并被授理,构建2个数据集并开源,开发原型系统1个。培养硕士研究生6名,其中5名毕业,1名在读。该项目的研究成果对个人用户理解隐私协议,应用开发者编写隐私协议,以及国家监管部门进行市场监管均可起到重要的借鉴及参考作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
针对安卓应用的软件自动修复算法研究与系统构建
安卓软件行为分析与构建的关键技术研究
安卓应用开发中模式驱动的代码推荐与完成技术研究
融合无线传感网的工业控制协议安全分析和隐私保护关键技术研究