With the advent of Web 2.0, the past few years have witnessed the rapid rise of social media, on which users can exchange information, express thoughts, and reconfigure existing explicit knowledge. An increasingly large amount of user generated content (UGC) is available in a number of social media platforms in various forms. The era of "big data" is upon us. These information sources are characterized by the use of disparate data models and their unstructured content with implicit knowledge. The ability to assess the relevance of topics and related sources in these information-rich environments is critical to organization success when scanning business environments. An organization has great need for an automated methodology to aggregating heterogeneous data from various social media platforms. This study follows the design science research paradigm in management information systems, by addressing issues pertaining to the design and development of knowledge management system capable of integrating diverse information sources in social media. First, we will develop spidering program to collect a massive amount of UGC from various social media platforms such as microblogs, Web forums, Blogs, and social networks. Second, we will propose knowledge management solutions to integrate and analyze the complex UGC data which is multi-sourced, voluminous, heterogeneous, and interconnected in diverse social media platforms that the UGC data is embedded in. These theories and methods we propose will help an organization to make strategy planning and discover business opportunities, and ultimately gain competitive advantages.
随着Web 2.0的迅猛发展,越来越多的网络用户通过多种终端、多种社会化媒体平台输出数字内容,驱动整个互联网世界迈入"大数据时代"。社会化媒体中蕴含着大量用户产生的内容 (UGC),这类大数据既包含有价值的资讯又聚集着广大网民的观点和经验。然而,不同社会化媒体平台中的UGC不仅来源广泛、数量庞大,数据结构也不尽相同。本课题拟采用信息系统设计科学的范式展开研究,提出面向知识管理的社会化媒体多源信息整合方案。首先,我们开发系统,从微博、网络论坛、博客、社交网络等多种形式的社会化媒体中提取特定的UGC。然后,我们设计面向知识管理的解决方案,处理不同社会化媒体平台环境下UGC数据存在的多源、海量、异构以及相互关联等复杂问题。本研究提出的理论和方法可以帮助企业和政府组织利用社会化媒体中的大数据寻求决策依据,发现其中蕴藏的商业机遇,进而提升组织的竞争力。
随着Web 2.0兴起,社会化媒体迅速成为人们交换信息、表达思想、重构已有知识的理想场所。与此同时,社会化媒体产生了大量用户创造的内容(User Generated Content, UGC),驱动整个互联网世界进入大数据时代。然而,不同社会化媒体平台中的数据资源是分散的、海量的、非结构化的。如何充分利用UGC为企业和政府机构提供科学的决策至关重要。本研究采用信息系统设计科学的范式展开研究,提出面向知识管理的社会化媒体多源信息整合方案,处理不同社会化媒体平台环境下用户产生内容(User Generated Content, UGC) 数据存在的多源、海量、异构以及相互关联等复杂问题。主要研究内容包括:(1) 基于半监督式机器学习的社会化媒体多源文本信息收集;(2) 从大规模社会网络中进行数据抽样;(3) 不同社会化媒体平台数据资源的整合;(4) 影响社交媒体知识交换质量的因素分析。我们的项目基本按照预定计划执行,针对以上研究内容,我们设计并实现了基于半监督式机器学习的算法,支持热点话题的识别;提出了面向大规模社会网络数据抽样的理论和方法,支持大规模异构在线社区的侦测和结构的变化;建立了多源异构UGC数据的整合方法,实现多源UGC的深度关联挖掘;利用结构方程模型分析了社交媒体影响知识交换质量的因素。总体来说,本课题达到了预期的研究目标,为企业和政府组织有效利用社会化媒体所特有的交互模式及其所蕴含的大数据提供了新思路和新方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
黄河流域水资源利用时空演变特征及驱动要素
服务经济时代新动能将由技术和服务共同驱动
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
知识整合视角下移动社会化媒体对创新团队绩效的影响机制研究
面向国家战略传播的社会化媒体管理模式研究
基于计算实验的社会化媒体隐私多源互动泄露机理研究
面向网络媒体信息的知识建模与行为预测方法研究