桃花坞 Rotating Header Image

Rory Cellan-Jones

大选结果预测信谁的?

英国大选距投票开始已不到20个小时,对大选结果的预测达到了白热化阶段。当然今年大选的特点是变数太多,谁也不敢说自己的预测有多准,“预测不了”是最好的预测。

BBC 的科技编辑 Rory Cellan-Jones 在他的博客上提到了3种不同的预测方式和平台:民意调查、博彩公司、社会媒体

1. 民意调查提供的数据,目前来说仍然是最受重视的。现在有五六家公司同时在做民意调查,结果略有出入,但相差不大,保守党一直领先,约32-36%左右,工党和自由民主党相差不大,在26-28%附近。

从民意调查数字,转化为对议席的预测,采用的是“均一转移”(uniform national swing)的模式,即假定选民投票意向的改变,在全国范围内是一致的。这样做显然有较大的误差,因为每个选区在当地事务、候选人受欢迎程度、投票率上都不同。

根据BBC的民意调查综合结果:保守党 35%,工党 29%,自由民主党27%。

采用“均一转移”的议席预测是:工党 272,保守党 270,自由民主党 79。

所以,如果相信民意调查和议席转换模型,那么没有一党可以获得超过半数的326席,“无多数议会”是最可能的结果,自由民主党的立场将起决定性作用。

2. 博彩公司的预测。在英国,博彩公司的赔率决不可小视。他们为不同的选区开出不同的赔率,收集数据的细致程度超过民意调查。博彩公司的问题是,他们收集的毕竟是间接数据,预测中有相当多的经验成份,而且不会象民意调查公司那样公开自己的模型,所以他们的预测不如民意调查受重视。

今年大选,立博(Ladbrokes)在所有选区都开出了赔率,他们对大选结果的预测是:

保守党 313,工党 212,自由民主党 88。

另一家在所有选区开出赔率的博彩公司 Betfair 的预测是:

保守党 325,工党 212,自由民主党 86。

显然,博彩公司相信保守党能够胜出,不需要和自由民主党联盟,就能以与其它小党结盟的方式,或是以少数派政府的方式,上台执政了。

3. 社会媒体预测。这是根据社会媒体上对三党的评论来分析投票取向。这样做显然误差更大了。不是每个候选人都活跃在社会媒体上,使用社会媒体的选民成份都多大代表性也有很大疑问。根据一家分析 Twitter 数据的公司 Tweetminster 的预测:保守党 35%,工党 30%,自由民主党 27%。

低科技解决方案

在林海峰的电影《废话小说》中,有一段故事的主角是一位老伯。他挤坐在一个不知是何处的黑暗狭小空间里,喝茶看报吃杯面,跟着收音机里的粤剧摇头晃脑地打拍子,但是会经常地打开墙上的一个小窗口,往里头扔一罐饮料或是一包零食什么的。最后他终于站起来打开门走了出来,我们发现这扇“门”原来是商场里的一台自动售货机的外壳。

这种“高科技”--至少是“自动化”门面后是“低科技”的手工劳动的事,最近也在英国发生了。Spinvox 是一家高科技公司,号称解决了用电脑系统自动完成语音到文字转换的难题。他们提供的服务主要有两项,一种是帮用户把电话留言转为文字发到用户手机上,另一种是给那些希望用语音代替文字写博客或做其它记录的。第一种服务,据说在商务和传媒人士中颇受欢迎。

虽然 Spinvox 网站上提到在识别过程中,可能会有“专家”(human expert)介入,但是整个系统给人的印象是这是个基本自动的过程,采用高科技提供了一项新颖有用的服务,不过是偶尔有专家校正一些而已。

但是BBC 的科技记者 Rory Cellan-Jones 发现,原来这个公司在南非和菲律宾雇佣了大批电话中心的职员,用人工听写的方式,来做号称是机器做的事。除了从公司的内线和电话中心得到情报,他还在他的博客上做了一次测试,把同一段留言连发5次,发现每次收到的文字都不相同,他因此判断他的5段留言被不同人听读,而不是通过机器获得一样的答案。

Spinvox 公司并不否认雇了海外电话中心职员做人工听读,但是不肯透露人工听读的比率是多少。Rory Cellan-Jones的内线则称其实大部份听读都是人工完成的。

在一篇后续的博客中,Rory Cellan-Jones 回应了一些Spinvox公司创始人 Christian Domecq 的回应。根据一些语音识别专家的意见,目前自动识别的难题并没有理想的解决方案。从平时的阅读中,我知道语音识别系统可以用人工智能通过反复学习提高准确性,但是很难想像如何让机器学习电话留言中不同人的口音和习惯。Spinvox 的声称非常有吸引力,但其实是给自己提出了一项不可能的任务,所以高科技的低成本解决方案,就不得不用低科技的高成本人工来完成了。

 
Real Time Web Analytics