本篇文章是一份公民媒体资料分析计画的其中部分。该计画是由回声计画(RuNet Echo)和马里兰科技暨人文学院共同合作。请上总统们的所有贴文一文页面,探索完整的文章系列。
我们锁定的这超过600万笔推文数据样本涵盖了众多语言,但这可不表示推友实际的所在地区。虽然我们主要感兴趣的是俄国人和乌克兰人对於他们的总统都讨论些什麽,然而我们也同样好奇,这些推文来自何方? 我们搜集了所有包含俄乌两国总统名字的推文──包含了俄文(Путин, Порошенко)丶乌克兰文(Путін, Порошенко)丶英文(Putin, Poroshenko)的拼写。地理标记有助我们更能观察出,讨论这两位的推友们都分布在哪里。
要标记推文的位置可以是一项棘手的工作,因为推特提供许多方式让使用者表现他们的位置。首先,使用者可以明确指示一个「地点」,即透过推特上现有的位置清单,手动选择一座城市或邻近地区。接着还有「详细位置」──即一组由卫星定位系统或三角测量提供的经纬度。地点通常是藉着桌上型电脑或是其他可设定地点的装置手动选定的。一个用户结束一段旅途後,他的最终位置仍会反映在他的推文上面,而这会让其定位方法更不精确;详细位置的经纬度虽然通常采自行动装置内建的卫星定位,且较准确,但其实这还会受到推特 APP 的限制,所以用户必须更改他们的帐户设定,好让定位更为准确。
Leetaru 等人从2012年秋季起便着手收集推特样本,每一天搜集全球各地所发推文数量的10%。而在他们透过Decahose得到的推文样本进行的研究发现,只有1.6%的样本包含了详细位置。而Semiocast在2012年中得来的推文样本则更广。他们指出,在所有公开推文中只有0.77%包含地理经纬度。
上面图片展示了 Leetaru 等人所有推文样本的详细位置。但由於他们搜集到有地理标记推文的比例,小到可被忽略,单纯根据这些推文所做的研究,对整个推特圈的观察当然会扭曲,特别是如果只采集短期内的资料的话。然而,就地理标记而言,这张地图却说明了,推特存在着极大的地理分布差异。图上大部分的国家都有一些地理标记过的推文。当然,详细位置的采用,也和许多国家行动网路普及丶智慧型手机的使用有紧密关联。这一切意味着,地理标记推文作为资料的单一来源,其实代表性并不足够,但是就提供关於推文趋势资讯这方面来说,它们可以提供一些有趣的见解。
而在我们搜集到的这总计634,2294笔标有波洛申科和普丁的推文资料中,有地理标记的推文有31013笔,占0.49%。比上面介绍的研究中标有地理位置的推文的比例,还来得少一些,但仍和整体趋势相吻合。
从我们锁定的样本中得来的所有被标记过的推文,已呈现在下面这张互动图表里,每个点代表一笔推文。某些地区的推文十分饱和,则会用彩色表示。一个推文越多的地方,红色就会比黄色多。推文少的地方,黄色就会比红色多。你可以藉着地图左上方的「 +/-」在地图上放大缩小,以看清楚在特定地区里的推文分布位置。在每一个点上按一下的话则会跳出视窗,里面会有现成的连结导往推文。
透过视觉化技术很明显地可以看出,在我们的数据资料里,地理标记在北美丶西欧和东欧部分地区的推文占掉了有标记地理位置的最大部分。南美洲一些地区也包含在内。这完全反映了在更大型且未锁定样本的研究中,全球有地理标记推文的分布位置。而亚洲是例外。在我们的样本中,亚洲总体而言有更多附地理标记的推文。
而这张地图也能让你藉着右上方的搜寻框框,在特定地区里放大。以下是根据我们样本标记在各特定城市中的推文,利用分布密度所做出的比较。图片皆放大至相同程度。
位置标记在一些城市里的推文,其相对密度比例来说大致呼应了 Leetaru 等人在2012年采集的地理标记推文样本中,前20名的城市。在它们所做的排名中,纽约排名第二,巴黎是第五名,伦敦位第七名而莫斯科是第二十名。而我们锁定的样本有特定的主题,预测柏林那里关於普丁或波洛申科的推文会比较多,应该是很合理的,因为德国在此时对俄乌两国的政治纠纷涉入甚深。但是,柏林的用户们似乎没有帮他们的推文打卡的习惯。
标记在基辅的推文数量无法和标记在莫斯科的相比,就乌俄两国各自的人口数量和智慧型手机普及率来说这其实不意外。而标记在纽约的推文,比起巴黎或伦敦还相对地少,也许这反映了纽约和俄乌政治事务之间的地理和政治距离。
虽然这微小的地理标记推文资料不能完全代表这整整600万笔的推文,但它们以热图呈现後,也给了我们一些判断对这两位总统的关注,在全球分布情况的见解。
校对:YH Lin
2 则留言