基于SemRank的CWME专家权威度计算方法研讨
来源:网络 时间:2017-07-01 00:32:00
3 研讨实例及其分析
下面以一个初步形成的研讨厅体系的专家研讨过程为例(文献[7]中的示例),来说明基于SemRank专家权威度计算方法。其中,发言专家是以一些博士研究生和硕士研究生进行的仿真,专家的发言是经济专业人士帮助并提供的。其中,Zh代表主持人,T、C、G、L、M代表不同的专家,在主持人的主持下专家们进行研讨的过程与结果如图1所示。
Zh:好,如果各位专家没有意见,现在进入研讨。首先请对今年的经济形势作一个基本判断。
T:在扩大内需政策影响下,经济增长幅度止跌回升。今年仍有趋好潜力。首先,除了出口增幅趋缓外,投资、消费需求增速均有所提高;其二,结构矛盾继续缓解,产销衔接较好;其三 ,上半年工业企业经济效益明显好转。
C:(除了T提到的几个因素外)另一个积极因素是工业经济在结构调整中增长加快,上半年工业增长保持了10%以上,势必对今年经济起到积极作用。
G:(除了C和T提到的因素外)另外启动了一些供给政策,如对中小企业的支持、技改贴息提高装备水平、国企改革等, 对改善宏观经济发展环境是十分必要的。
L:(我不同意他们三人的分析)我担心的是,世界经济形势会对我国经济增长产生极其不利的影响。根据世界银行估计,美国经济今年预计增长0.7%(去年5%),世界经济增长2.9%,全球贸易增长5.2%。
T:(不同意 L的分析)我认为不必过分忧虑。实际上去年内需也起到重要作用。只要今年继续坚持积极的财政政策,加上公务员增资、提高低收入者收入水平等政策到位,内需增长会弥补出口下滑对经济增长的不利影响。
M:L的意见确实值得注意。我国对美国的出口占全部出口的21%,如果美国经济出现衰退,必将影响我国出口,还将对我国吸引外资、资本市场、投资信心等方面产生影响,因为……
Zh :L,按你的判断,今年经济形势走势会如何?
L:(响应 Zh)我不太乐观,受世界经济的影响,我国今年经济增速会比上年下降,GDP增长 7%……
M:我同意L的看法……
T:(不同意 L)我认为,经济增长幅度还会有所上升,到达 8.3%……
C:( 对他们两人L和T的意见都不太赞同)从总体上,我对今年经济增长还是有信心的,GDP增长与上年持平,达到 8%。但以下问题值得注意:一是非国有经济投资问题;二是消费增长具有一定的不确定性;三是农民收入连续多年没有多大的改善,影响到总体的消费水平……
G:(不太同意L、T、C的意见)考虑到出口会受到影响,GDP增长幅度将比去年略有下降,达到7.6%~7.8%……
将2.2节中论述的基于SemRank的专家权威度计算方法应用于上述的研讨过程,专家的每次发言为一个节点,用专家研讨时的ID和发言时间或者次数标志类节点,为清楚起见,用“专家ID+t+发言的次数”来标志节点,获得了以下的专家个体互动关系:
Tt1;
Ct1→Tt1; Gt1→Tt1,Ct1;
Lt1→Tt1,Ct1,Gt1;Tt2→Lt1;Mt1→Lt1;
Zht1→Lt1; Lt2→Zht1;Mt2→Lt2;
Tt3→Lt2; Ct2→Lt2,Tt3;
Gt2→Ct2,Lt2,Tt3;
上述的研讨数据需预处理,这里采用中国科学院计算所ICTCLAS2008进行中文分词,将专家的每条发言表示成tf-idf向量形式。根据2.2节中的算法计算专家发言的权威值,设置允许的输出误差error为0.000 1,式(6)中的阻尼因子为0.15,考虑前面提到的两种时间衰减函数,共迭代了9次,获得最终的结果如表1所示。作为对比,表1列出了采用基于HITS的链接结构分析算法[7]计算的专家发言权威值。由于HITS算法是不收敛的,采用的迭代次数为3。
表1 专家发言权威值
专家发言
采用f?1(u,v,T)?时间衰减函数
权威值排序
采用f?2(u,v,T)?时间衰减函数
权威值排序
基于HITS的链接?结构分析算法
权威值排序
Tt11.00 11.00 10.173
Ct10.71 30.74 30.134
Gt10.31 60.41 60.076
Lt10.86 20.87 20.067
Tt20.14 90.14 90.008
Mt10.14 90.14 90.008
ZHt10.56 40.56 40.008
Lt20.49 50.49 50.281
Mt20.14 90.14 90.008
Tt30.22 70.26 70.182
Ct20.18 80.21 80.105
Gt20.14 90.14 90.008
根据上述专家每条发言的权威值,对每位专家所有的发言的权威值求和,再求平均,获得专家的总体权威度如表2所示。分析表2可知,在采用2.1节中提出的两种时间衰减函数时,专家的总体权威度排序比较一致。根据排序结果,本文主要重点关注专家L、T和C的发言(由于主持人主要是引导研讨过程的,尽管排序是第2位,这里不关注他的发言)。从这三位专家的发言可以归纳出今年的经济形势,有三种不同的意见:a)经济增长幅度止跌回升,今年仍有趋好潜力;b)世界经济形势会对我国经济增长产生极其不利的影响;c)工业经济的结构调整,势必对今年经济起到积极作用。根据表1可知,采用基于HITS的链接结构分析算法计算专家发言权威值时,不可避免地出现了专家发言权威值为0的情况(如Tt2、Mt1),这是由于HITS算法本身的特性决定的,如果某条发言无人响应,该权威值就为0。采用SemRank方法时,专家发言的权威值不会出现为0的情况。由式(6)可知,每位专家的权威值都有非0的初始值d/N,这与现实情况是一致的,因为每位参与研讨的专家都是领域和行业专家,其发言都具有一定的参考价值和权威度。
表2 专家的总体权威度
专家发言
采用f?1(u,v,T)?时间衰减函数
总体权威度排序
采用f?2(u,v,T)?时间衰减函数
总体权威度排序
基于HITS的链接?结构分析算法
总体权威度排序
T0.453 30.467 40.1172
C0.445 40.475 30.1153
G0.225 50.275 50.0354
L0.675 10.680 10.1701
M0.140 60.140 60.0005
Zh0.560 20.560 20.0005
以专家G的第一条发言为例说明专家发言在研讨中的权威值变化的情况。如图2所示,采用SemRank方法时,在时刻2专家Gt1发言的权威值取得了最大值,这与实际情况是相符的。在发言Gt1提出来以后,其他专家会对这条发言评论,表达自己的意见。在某个时刻权威值会取得最大值,随着研讨的深入,大家讨论的内容会发生改变(上述研讨的示例,只是实验所采用的研讨脚本的一部分内容),讨论的议题演变成如何帮助中小企业度过这次经济危机,因此专家发言Gt1的权威值将会随着时间变小,这也说明了SemRank方法利用语义以及时间因素来计算专家发言权威值是正确的,并与实际情况是相?符的。
采用基于SemRank的专家权威度计算,可以衡量专家每条发言的权威值,评估每个专家的总体权威度。通过权威度计算以及排序,可知哪几个专家发言是需要重点关注并引起最多争议讨论的,对形成最终的决策提供了有力的支持。
[1]钱学森,于景元,戴汝为.一个科学新领域——开放的复杂巨系统及其方法论[J].自然杂志,1990,13(1):3-10.
[2]王寿云,于景元,戴汝为,等.开放的复杂巨系统[M].杭州:浙江科学技术出版社,1995.
[3]戴汝为,李耀东.基于综合集成的研讨厅体系与系统复杂性[J] .复杂系统与复杂性科学,2004,1(4):1-24.
[4]戴汝为.系统学与中医药创新发展[M].北京:科学出版社,2008.
[5]李耀东,崔霞,戴汝为.综合集成研讨厅的理论框架、设计与实现[J].复杂系统与复杂性科学,2004,1(1):27-32.
[6]赵明昌, 李耀东.一个新的综合集成研讨厅软件框架[J].计算机工程与应用,2008, 44(11):1-4.
[7]崔霞,戴汝为,李耀东.群体智慧在综合集成研讨厅体系中的涌现[J].系统仿真学报, 2003,15(1):146-153.
[8]李敏花,戴汝为,李耀东.一种基于即时发言评价的专家权威度计算方法[J].模式识别与人工智能,2008,21(4):469-475.
[9]李晓明,闫鸿飞,王继民.搜索引擎——原理、技术与系统[M].北京:科学出版社,2005.
[10]BIANCHINI M,GORI M,SCARSELLI F.Inside PageRank[J].ACM Trans on Internet Technology,2005,5(1):92-128.
[11]HASSAN A,FADER A,CRESPIN M H,et al.Tracking the dynamic evolution of participant salience in a discussion[C]//Proc of the 22nd International Conference on Computational Linguistics.Morristown,NJ:Association for Computational Linguistics,2008:313-320.
下面以一个初步形成的研讨厅体系的专家研讨过程为例(文献[7]中的示例),来说明基于SemRank专家权威度计算方法。其中,发言专家是以一些博士研究生和硕士研究生进行的仿真,专家的发言是经济专业人士帮助并提供的。其中,Zh代表主持人,T、C、G、L、M代表不同的专家,在主持人的主持下专家们进行研讨的过程与结果如图1所示。
Zh:好,如果各位专家没有意见,现在进入研讨。首先请对今年的经济形势作一个基本判断。
T:在扩大内需政策影响下,经济增长幅度止跌回升。今年仍有趋好潜力。首先,除了出口增幅趋缓外,投资、消费需求增速均有所提高;其二,结构矛盾继续缓解,产销衔接较好;其三 ,上半年工业企业经济效益明显好转。
C:(除了T提到的几个因素外)另一个积极因素是工业经济在结构调整中增长加快,上半年工业增长保持了10%以上,势必对今年经济起到积极作用。
G:(除了C和T提到的因素外)另外启动了一些供给政策,如对中小企业的支持、技改贴息提高装备水平、国企改革等, 对改善宏观经济发展环境是十分必要的。
L:(我不同意他们三人的分析)我担心的是,世界经济形势会对我国经济增长产生极其不利的影响。根据世界银行估计,美国经济今年预计增长0.7%(去年5%),世界经济增长2.9%,全球贸易增长5.2%。
T:(不同意 L的分析)我认为不必过分忧虑。实际上去年内需也起到重要作用。只要今年继续坚持积极的财政政策,加上公务员增资、提高低收入者收入水平等政策到位,内需增长会弥补出口下滑对经济增长的不利影响。
M:L的意见确实值得注意。我国对美国的出口占全部出口的21%,如果美国经济出现衰退,必将影响我国出口,还将对我国吸引外资、资本市场、投资信心等方面产生影响,因为……
Zh :L,按你的判断,今年经济形势走势会如何?
L:(响应 Zh)我不太乐观,受世界经济的影响,我国今年经济增速会比上年下降,GDP增长 7%……
M:我同意L的看法……
T:(不同意 L)我认为,经济增长幅度还会有所上升,到达 8.3%……
C:( 对他们两人L和T的意见都不太赞同)从总体上,我对今年经济增长还是有信心的,GDP增长与上年持平,达到 8%。但以下问题值得注意:一是非国有经济投资问题;二是消费增长具有一定的不确定性;三是农民收入连续多年没有多大的改善,影响到总体的消费水平……
G:(不太同意L、T、C的意见)考虑到出口会受到影响,GDP增长幅度将比去年略有下降,达到7.6%~7.8%……
将2.2节中论述的基于SemRank的专家权威度计算方法应用于上述的研讨过程,专家的每次发言为一个节点,用专家研讨时的ID和发言时间或者次数标志类节点,为清楚起见,用“专家ID+t+发言的次数”来标志节点,获得了以下的专家个体互动关系:
Tt1;
Ct1→Tt1; Gt1→Tt1,Ct1;
Lt1→Tt1,Ct1,Gt1;Tt2→Lt1;Mt1→Lt1;
Zht1→Lt1; Lt2→Zht1;Mt2→Lt2;
Tt3→Lt2; Ct2→Lt2,Tt3;
Gt2→Ct2,Lt2,Tt3;
上述的研讨数据需预处理,这里采用中国科学院计算所ICTCLAS2008进行中文分词,将专家的每条发言表示成tf-idf向量形式。根据2.2节中的算法计算专家发言的权威值,设置允许的输出误差error为0.000 1,式(6)中的阻尼因子为0.15,考虑前面提到的两种时间衰减函数,共迭代了9次,获得最终的结果如表1所示。作为对比,表1列出了采用基于HITS的链接结构分析算法[7]计算的专家发言权威值。由于HITS算法是不收敛的,采用的迭代次数为3。
表1 专家发言权威值
专家发言
采用f?1(u,v,T)?时间衰减函数
权威值排序
采用f?2(u,v,T)?时间衰减函数
权威值排序
基于HITS的链接?结构分析算法
权威值排序
Tt11.00 11.00 10.173
Ct10.71 30.74 30.134
Gt10.31 60.41 60.076
Lt10.86 20.87 20.067
Tt20.14 90.14 90.008
Mt10.14 90.14 90.008
ZHt10.56 40.56 40.008
Lt20.49 50.49 50.281
Mt20.14 90.14 90.008
Tt30.22 70.26 70.182
Ct20.18 80.21 80.105
Gt20.14 90.14 90.008
根据上述专家每条发言的权威值,对每位专家所有的发言的权威值求和,再求平均,获得专家的总体权威度如表2所示。分析表2可知,在采用2.1节中提出的两种时间衰减函数时,专家的总体权威度排序比较一致。根据排序结果,本文主要重点关注专家L、T和C的发言(由于主持人主要是引导研讨过程的,尽管排序是第2位,这里不关注他的发言)。从这三位专家的发言可以归纳出今年的经济形势,有三种不同的意见:a)经济增长幅度止跌回升,今年仍有趋好潜力;b)世界经济形势会对我国经济增长产生极其不利的影响;c)工业经济的结构调整,势必对今年经济起到积极作用。根据表1可知,采用基于HITS的链接结构分析算法计算专家发言权威值时,不可避免地出现了专家发言权威值为0的情况(如Tt2、Mt1),这是由于HITS算法本身的特性决定的,如果某条发言无人响应,该权威值就为0。采用SemRank方法时,专家发言的权威值不会出现为0的情况。由式(6)可知,每位专家的权威值都有非0的初始值d/N,这与现实情况是一致的,因为每位参与研讨的专家都是领域和行业专家,其发言都具有一定的参考价值和权威度。
表2 专家的总体权威度
专家发言
采用f?1(u,v,T)?时间衰减函数
总体权威度排序
采用f?2(u,v,T)?时间衰减函数
总体权威度排序
基于HITS的链接?结构分析算法
总体权威度排序
T0.453 30.467 40.1172
C0.445 40.475 30.1153
G0.225 50.275 50.0354
L0.675 10.680 10.1701
M0.140 60.140 60.0005
Zh0.560 20.560 20.0005
以专家G的第一条发言为例说明专家发言在研讨中的权威值变化的情况。如图2所示,采用SemRank方法时,在时刻2专家Gt1发言的权威值取得了最大值,这与实际情况是相符的。在发言Gt1提出来以后,其他专家会对这条发言评论,表达自己的意见。在某个时刻权威值会取得最大值,随着研讨的深入,大家讨论的内容会发生改变(上述研讨的示例,只是实验所采用的研讨脚本的一部分内容),讨论的议题演变成如何帮助中小企业度过这次经济危机,因此专家发言Gt1的权威值将会随着时间变小,这也说明了SemRank方法利用语义以及时间因素来计算专家发言权威值是正确的,并与实际情况是相?符的。
采用基于SemRank的专家权威度计算,可以衡量专家每条发言的权威值,评估每个专家的总体权威度。通过权威度计算以及排序,可知哪几个专家发言是需要重点关注并引起最多争议讨论的,对形成最终的决策提供了有力的支持。
4 结束语
针对综合集成研讨环境中的专家权威度评价问题,本文提出基于SemRank的专家权威度计算方法。该方法既考虑了专家之间的交互结构,又考虑了专家发言内容之间的语义关联,同时引入了时间衰减函数来反映交互的动态复杂性。实验结果表明,本文提出的专家权威度计算方法合理、有效,可帮助专家快速了解当前的交互结构,避免思维的过分发散,加快专家群体的自组织过程,为深化认识、激发思维奠定了较好的基础。
本文所提的权威的计算方法尽管考虑到了发言之间的语义关联关系以及时间衰减因素,但是由于这种关联程度计算方法并不足以严格划分发言的主题,在研讨话题发生变化时,会在一定程度上导致权威度更新的滞后与混淆。在下一步的工作中,可以加入更多的语义理解及分析内容,采用分类和聚类方法,对专家发言进行动态主题建模,获取专家主题的转移趋势,进而在此基础上更加准确地计算专家在某一主题上的权威度,以及在所有主题上的综合权威度。
参考文献
[1]钱学森,于景元,戴汝为.一个科学新领域——开放的复杂巨系统及其方法论[J].自然杂志,1990,13(1):3-10.
[2]王寿云,于景元,戴汝为,等.开放的复杂巨系统[M].杭州:浙江科学技术出版社,1995.
[3]戴汝为,李耀东.基于综合集成的研讨厅体系与系统复杂性[J] .复杂系统与复杂性科学,2004,1(4):1-24.
[4]戴汝为.系统学与中医药创新发展[M].北京:科学出版社,2008.
[5]李耀东,崔霞,戴汝为.综合集成研讨厅的理论框架、设计与实现[J].复杂系统与复杂性科学,2004,1(1):27-32.
[6]赵明昌, 李耀东.一个新的综合集成研讨厅软件框架[J].计算机工程与应用,2008, 44(11):1-4.
[7]崔霞,戴汝为,李耀东.群体智慧在综合集成研讨厅体系中的涌现[J].系统仿真学报, 2003,15(1):146-153.
[8]李敏花,戴汝为,李耀东.一种基于即时发言评价的专家权威度计算方法[J].模式识别与人工智能,2008,21(4):469-475.
[9]李晓明,闫鸿飞,王继民.搜索引擎——原理、技术与系统[M].北京:科学出版社,2005.
[10]BIANCHINI M,GORI M,SCARSELLI F.Inside PageRank[J].ACM Trans on Internet Technology,2005,5(1):92-128.
[11]HASSAN A,FADER A,CRESPIN M H,et al.Tracking the dynamic evolution of participant salience in a discussion[C]//Proc of the 22nd International Conference on Computational Linguistics.Morristown,NJ:Association for Computational Linguistics,2008:313-320.
- 上一篇:智能主体的信念认知时态子结构逻辑模型
- 下一篇:基于连续型条件属性的模糊规则约简算法
相关论文
最新论文
热点论文
- [中等教育] 职专政治教育中的德育渗透
- 帮助学生树立正确的价值观和人生观,提升学生的个人品德与思想素质,是职专政治教育的主要目标与根本目的。但受限于传统政治教育的教学 [全文]
- [中国哲学] 传递“中国梦”正能量是记者的神圣使命
- 摘要:中国梦是中华民族伟大复兴的梦,是当今中华民族前进的动力,是当前中国最具影响力、最具感染力、最具普遍性的正能量。记者作为以 [全文]
- [财务控制] 论企业集团财务控制的对策
- 摘 要:市场经济飞速发展促使企业集团组织形式发生非常大的变化,那么企业集团需要有效利用自身发展优势,促进现代化经济发展。 改革逐渐 [全文]
- [财务控制] 中小企业的财务控制问题分析
- 摘 要:随着市场经济体制不断完善,我国中小企业进入快速发展阶段,其在国民经济发展中的作用被不断凸显出来。本文中笔者以中小企业财务管 [全文]
- [职业教育] 分析音乐课堂中的情感互动及学生体验
- 【摘要】针对音乐课堂中的情感互动及学生体验进行分析,基于学生的实际音乐学习需求、音乐学习目标等予以教学设计,以期能够不断提升音 [全文]
- [市场营销] 新时期下市场营销的演变趋势分析
- 摘要:随着全球经济互相影响,新市场格局的形成让新时期环境里市场营销不断发生变革。而本文主要是对当今市场新形势进行一个分析,找出对市 [全文]
- [国际贸易] 国际贸易融资创新及风险控制
- [摘 要] 国际贸易企业融资风险的主要表现有两种:一是国际贸易企业无法以自身的流动资金偿还债务,要通过集资的方式偿还债务本金和利息; [全文]
- [国际贸易] “互联网 +”时代下国际贸易发展策略研究
- 摘 要:随着网络技术和经济全球化的进一步发展,互联网关系到国际贸易领域的方方面面,并以全新的国际贸易形态,将分散在世界各地的市场, [全文]