Current Web vision and mining communities focus on the content analysis and understanding for Web texts, images and videos.There is scant research on the analysis of the appearances of Web pages. Nevertheless, users'access for Web pages is a process of human-computer interaction. Besides content, there are several other factors such as visual attributes (e.g., aesthetics, complexty, readability, accessibility) of Web appearances that significantly affect users'access. The analysis and mining the visual attributes of Web pages is sumarized as a new research topic, namely, Web appearance mining. This project aims to investigate the key issues in the Web appearance mining. (1)Feature extraction for Web appearance. How to apply state-of-the-art image feature extraction methods,specifically, the local descriptor, into the feature extraction for Web appearances. (2)The analysis of multiple attributes of Web appearance. How to quantitively describe the correlations among visual attributes. (3)The evaluation/measurement model construction. How to train effective models in order to classify, score,or rank Web pages according to their appearances. (4)Applications. How to combine Web appearance mining with computer graphic techniques such as color transfer in order to automatically edit and enhance the appearances of Web pages. Web appearance mining is a cross-discipline research topic. This project will utilizes thoeries and methods from multiple research areas (including Web mining, machine learning, human-computer interaction, vision and graphcis) to promote the research on Web appearance mining.
现有的Web视觉与挖掘研究主要集中在网页的内容分析与理解上,对其视觉表观进行分析的研究相对较少。而用户对网页的访问是一个人机交互过程,除了内容之外,网页还有很多因素特别是其表观属性影响着用户的访问过程。这些属性包括美学、复杂度以及可读性等。本项目针对网页表观分析与挖掘的研究现状,拟从四个方面来深入研究网页表观挖掘的关键科学问题:(1)网页表观的特征提取,要研究如何将图像领域的局部描述子应用于网页表观上。(2)网页表观的多属性分析,要挖掘并构建多个表观属性之间的关联关系。(3)表观属性的评价与度量模型构建,以实现对网页的分类、打分以及排序。(4)表观挖掘应用,要结合表观挖掘与计算机图形学方法来实现网页的自动编辑与视觉增强。项目要借鉴并利用Web挖掘、机器学习、人机交互、视觉与图形学等多学科的理论和方法,在网页表观挖掘上形成系统性的创新,进一步完善并推动Web视觉和Web挖掘理论的发展。
网页表观的视觉属性对于一个网页具有重要的意义, 分析与挖掘网页的视觉表观,自动对其视觉属性进行评价与度量,对于我们评价一个网页以及网页相关的应用,具有重要的实际价值。尽管网页表观的分析与挖掘对认识基于Web的应用起着重要的作用,但到目前为止,网页表观挖掘尚未引起Web挖掘、视觉信息处理和机器学习等领域专家学者的足够重视,极少看到相关研究。如何结合Web挖掘、人机交互、视觉信息处理以及机器学习等多学科的理论方法来进行网页表观挖掘是一个新的多领域交叉的科学问题。. 本项目的研究目标在内容上包括:研究网页表观特征提取、属性分析以及评价模型构建中的系列关键问题,初步构建网页表观挖掘的基本理论与方法,并探索其在实际中的应用。在量化指标上包括:提出一整套网页表观挖掘的基本理论与方法,预计在国际高水平会议与刊物上发表录用论文9-12篇;构建一个网页表观挖掘实验平台与网页颜色传递原型系统,能够实现对网页表观的多属性度量与评价,并初步对网页的颜色进行自动增强与编辑。. 本项目针对上述研究内容,做出了一系列探索新的研究工作:1)提出了一种新的网页表观标签的表达方式来体现表观属性的主观性;2)全面引入计算机视觉与网页挖掘的相关理论与方法来提取网页的细节视觉特征,包括结构块特征、纹理特征、文字特征等等;3)提出了新的机器学习方法来讲标签的主观性、属性的关联性等特点融入到模型学习与预测中去;4)提出了一个网页颜色属性度量与颜色迁移框架,能够对网页颜色进行自动增强与排序。. 无论是从研究内容上还是量化指标上,目前研究目标均已完成。特别是在包括IEEE Transactions on Multimedia来内的领域权威期刊和top级会议上发表10篇,在网页表观挖掘上取得了系列的较为原创性的学术成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
面向工件表面缺陷的无监督域适应方法
跨网页多源异构数据社会关系挖掘方法及应用研究
时空数据挖掘中若干关键问题研究
面向文本挖掘的特征选择关键问题研究
目标导向的网络挖掘与推荐关键问题研究