信达关于口碑的句子是个词语还是个句子,是词语又怎样解拜

优捷信达:舆情监测如何了解网络口碑
舆情 舆情软件
优捷信达:舆情监测如何了解网络口碑
双十一、双十二电商大战如火如荼的进行着,电子商务的巨大市场机遇和网民潜在的需求让许多人感慨不已,虚拟网络居然以创造如此巨大的实际价值。对此,国内领先的新媒体信息处理领导企业优捷信达公司表示,网络蕴含巨大的能量,不仅包括电子商务,还包含巨大的网络口碑信息。如何更好的挖掘海量消费者网购评价和微博、论坛信息,将是未来企业竞争胜出的重要砝码。
在消费者市场,其显著的特点就是消费者的购买行为具有很大程度的可诱导性,包括消费者需求的内在诱因和外部环境诱因。消费者的购买行为很大程度上受需求、购买能力和拥有欲望支配。如何深入分析消费者需求和购买行为,获得真实、全面的信息,对于企业非常重要。同样,深入研究消费者客户体验的分享,可以了解企业在市场中的形象,以及这一形象对潜在消费者的吸引程度和不足,从而帮助企业调整改进,提高营销效率。
现有市场调查方法的局限
现有客户体验调查方式,不管是问卷调查,还是焦点小组讨论,虽然能够获得比较详细的调查报告,也可以根据受访者的背景条件归纳出消费者背景信息,但由于技术和成本的局限,现有的调查方法都具有其局限性。
首先,现有调查方法无法实现大样本的统计。由于成本因素,不管是定性调研还是定量调研,每一个访问都意味着不小的成本费用,因此实现大样本的普调意味着巨大的成本,基本无法实现。第二,调查周期长,时效性差。同样由于现有调研方式是人工完成,调研时间都比较长,无法实时了解和统计消费者客户体验和需求。第三,调查结果的真实性存疑。由于现有调研工作的发起者是企业,受调查者是被动接受调查,因此,调查结果并非是受调查者真实意愿的表达。最重要的一点,由于是一对一直接接受访问,受调查者大多是对企业具有一定配合意愿的消费者,他们一般不会有太强烈的反感,即便有也不会直接讲出来,因而现有调查方式无法获得准确的负面评价。而负面评价对企业的影响比正面评价更重要,负面评价意味着消费者需求尚未满足,同时负面评价的忽视对企业伤害更大。
基于信息监测分析软件的调查方法
随着互联网技术的发展,移动互联网、微博等社交媒体的兴起,互联网上关于某一个品牌或某一个产品的消费者用户体验和需求信息非常之多,如何通过一种合适的方法,及时了解,全面收集,深入分析消费者在互联网表达的相关口碑信息,将成为企业了解消费者需求的全新方式。随着优捷信达科技专利的搜索技术和自然语言处理技术的成熟,优捷信达科技推出了慧眼舆情监测分析系统,并得到了众多知名企业的应用。
慧眼舆情监测系统首先是利用互联网搜索技术,将企业品牌、产品等特定主题的相关信息进行实时监测,全面收集并进行数据库备份;第二步是利用数据处理技术,将收集的海量数据进行处理,剔除不相关的垃圾数据,合并重复数据;第三步是进行自然语言分析处理,将整理之后的文本数据根据表达的意思进行归类,整理出数据的正负面情感,语义判断和正负面情感强弱的赋值。此外,还可以根据海量数据整理出核心情感词语,品牌形象和消费者体验感受等。
通过计算机软件智能调查方法,可以全面掌握消费者口碑,了解消费者各方面的意见,更重要的是能够及时准确全面的获取信息,帮助企业客观了解自身形象,加以改进。还可以根据消费口碑分析潜在需求,顺势而为推出对应的新产品和服务。
公司联系方式
联系我时,请告知来自搜了网!
地址:朝阳北路103号金泰国益大厦11层
邮编:100020
公司最新产品
*免责声明: 以上所展示的信息由企业自行提供,内容的真实性、准确性和合法性由发布企业负责。搜了网对此不承担任何责任。转:不仅分析语义,更关注词组结构_小妮子_cxy_新浪博客
转:不仅分析语义,更关注词组结构
woboy | 15 八月, 2012
文章作者:优捷信达研究员 Annie
在上一篇题为《基于语义特征的网络舆情正负面监测》的文章中,本人结合在优捷信达科技的研究工作为您详细介绍了情感分析中与舆情正负面分析密切相关的“极性分类”。本文将延续这一主题,详细描述具体的正负面辨别方式,并分析其优缺点,以帮助您了解市场上流行的“舆情监测”、“口碑监测”、“消费者调研”等互联网海量信息处理系统的工作原理。
网络评价和信息的正负面识别,需要通过计算机提取具有情感倾向的相关词语,这叫做“特征提取”(feature
extraction)。简单来说,计算机判别正负面,就是通过先提取句子中的正负面词语,进而分析这些词语的分布来判断文章的正负面倾向。
& 基于优捷信达科技的研究调查,目前业内主要特征提取技术有基于语义和词的出现及频率的两种模式。本文将重点介绍后一种模式,并讨论这种模式的优缺点。
基于词条出现及频率规律的特征提取模式比基于语义的模式出现更晚。这种模式不分析情感关键词所代表的含义,而将重点放在了评估高频率词语的情感极性。尽管这种基于统计的方法并不符合直觉,但由于其在处理包含复杂句法结构甚至表达结构的句子时的优良表现,得到了业界越来越多的关注。以下将重点介绍两种典型方法。&
&1.&比较词语的出现及频率的方法
提取情感词条的出现特征,最直接的方式有两种,第一种是观察情感词条是否出现,第二种是计算情感词条出现的频率。频率的方式在信息检索的领域中已经得到成功的运用,具体方法是使用预先选定词条的出现次数作为特征向量的值。与频率的方式不同,第一种方式将情感词条是否“出现”直接作为特征,也就是将频率简化为了一个是与非的二进制问题,如果一个词条出现了,与它对应的特征矢量就记录为1,否则则记为0。Bo
Pang和Lilian
Lee做实验在电影评论的方面比较了这两种方法,结果显示第一种“是否出现”的方法效果优于第二种“计算频率”的方法。
&这个意料之外的结果其产生的原因可能可以归结为主题分析(如谷歌通过关键词查找相关文章)和情感分析(如舆情口碑监测)的根本区别。主题分析的td-idf方法的成功从一个角度表明了一个文档的主题会以基本相同的形式在网络上大量存在,因此通过搜索相关的句子或短语就可以搜索到相应的内容。但是情感分析却不能用这种方式来实现,因为人们很少以雷同的内容表达主观意见。例如,人们在表达“苹果手机好”这样一个意思的时候,并不会简单地重复这一句话,而是会说苹果手机为什么好,因为什么原因感觉到苹果手机好。简而言之,对于苹果手机的各种正面评价,“苹果手机好”这一句子直接出现的概率很低。&
2.&基于词的子序列与依赖子序列(即词组结构及相互关系)的方法
& 2005年,Shotaro
Matsumoto等人提出了一种提取高频词序列和高频句子结构做为特征向量以进行情感分析的机器学习的方法:
第一步,通过Prefixspan(一个开源的api)挖掘所有高频词的子序列。越多的句子中包含一个词序列,这个词序列被赋予的频率就越高,而高于预设阈值的词语就会被采用。Prefixspan从单字词开始,每次迭代新增一个字的宽度,直到当前语句里的所有词组都被遍历。
第二步,通过FREQT挖掘所有的高频句子结构。越多的句子中包含某个句子结构,这个句子结构被赋予的频率就越高。换句话说,FREQT与PrefixSpan使用相同的方式提取一个句子里所有可能的子句结构的依赖关系。
作为评测,这一方法(使用16种特性组合)被应用于两组影评的分析,这两组影评与Pang-Lee在2002年试验时采用的一样。在分析中,基于“单词+双词词组+词干依赖关系”的特征模版组合对于两个影评都是最优方案。而通过使用支持向量机(SVM),第一个影评的准确率从Pang—Lee(2002)达到的82.9%(一元模型算法)提升到了88.3%,第二个评论的准确率从87.1%(Pang-Lee,一元模型算法)提升为93.7%。
更高的精度证明了这些基于统计方法的特征提取的可行性和重要性。与其它方法相比,使用高频词或依赖子序列子句依赖关系特征的方式具有显著的优势。特征本身可能会包含复杂的句式信息,如双重否定。而这种方法把我们从解析复杂的句子结构的工作中解放了出来。而解析复杂的句式结构可能在相当长的时间里,还将会一直是一个难以解决的问题。
这种基于词语出现模式的特征本身就包含了句子结构的信息,因此给了我们征服复杂句式的可能性。如今,包括优捷信达科技在内的许多研究机构及其人员正在使用类似的方法来应对复杂的句式结构。一个例子是Shilpa
Arora, Elijah Mayfield, Carolyn Penstein-Ros&
and Eric Nyberg
2010年开发的一个用以挖掘具有代表性话题层面子序列的子图挖掘方法,这个方法通过结合初始特征,可以逐步生成新的更复杂的复合特征。
小妮子_cxy
博客等级:
博客积分:0
博客访问:234
关注人气:0
荣誉徽章:君,已阅读到文档的结尾了呢~~
网络评价和信息的正负面识别,需要通过计算机提取具有情感倾向的相关词语,这叫做“特征提取”(feature extraction)。简单来说,计算机判别正负面,就是通过先提取句子中的正负面词语,进而分析这些词语的分布来判断文章的正负面倾向。
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
优捷信达解密舆情监测--不仅分析语义,更关注词组结构
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 秋天的词语和句子 的文章

 

随机推荐