传统的Web内容挖掘技术主要是利用网页上的文本数据来进行分析,但实际上,Web网页上往往同时存在着多种类型的数据,这些多模态数据之间往往隐含了一定的联系,如果能够有效地协同利用这些不同类型的数据,可望能够更有效地对网页内容进行分析。这方面的研究不仅引起了学术界的关注,还引起了软件业的巨头微软的重视。本课题拟对基于机器学习的Web上图像和文本协同挖掘技术进行研究,拟提出一种快速准确地对Web网页上与考察主题有关的图像和文本定位的方法;提出一种高效且有效地提取Web图像和文本包含的语义特征信息的方法;提出一种有效地对Web图像和文本包含的语义信息特征进行结合分析的方法;提出一种有效利用未标记网页数据提高协同挖掘性能的方法;在国际刊物、会议和国内一级学报上发表5~8篇高质量论文;申请国家发明专利1-2项;培养研究生3-4名。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
Web文本意见挖掘关键技术研究
基于迁移学习的Web挖掘研究
基于Web挖掘的图像和视频标注与搜索关键技术研究
WEB文本挖掘中知识模式的抽取和评价机制