注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

酒神精神 强力意志 重估一切价值

父爱如山 情牵万里

 
 
 

日志

 
 

新浪微博之话题(转)  

2013-03-20 15:48:55|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
根据新的研究表明,尽管有3亿用户每天发布1亿条新内容,中国的审查者仍然努力地删除那些他们不想在新浪微博上出现的内容,而且相当迅速。新浪微博是中国主要的博客平台。
  莱斯大学[1]Dan Wallach新研究的作者之一,他说:“有趣的是尽管要微博用户数量不断增加,他们能非常有效率。”
  这项由来自莱斯大学、鲍登学院[2]以及新墨西哥大学[3]的计算机科学家进行的研究表明,三成被删除的微博发生在微博出现的30分钟内,九成被删除的微博发生在24小时之内。新浪微博是与推特相同的服务商,中国屏蔽了后者的网站。
  为了找出微博如何能被快速的删除,研究人员锁定了3 500名新浪微博用户的删除历史。从2012年7月20日到9月8日,这些用户被仔细的监测。
  阅读这项研究早期的数据报告中删除对多的题目,就像是在阅读一份报纸。[4]
  例如7月22日,在网民愤怒声讨政府对于大雨的应对不力,造成至少77人死亡之后,新闻微博被禁话题的第一名是“北京暴雨”。这一主题在接下来的几天里保持了被禁话题第一名的位置。
  
  尽管在钓鱼岛问题上与日本的关系持续紧张,新浪微博紧紧控制着网上的讨论。在第一轮**游行在中国爆发时,8月17日、19日、20日,“**”主题是新浪微博禁止最多的主题。
  Wallach说:“毫无疑问,如果没有借助于技术设备,一房间的人是无法看紧3亿发布人的。”
  他补充道,大部分新浪微博的发布指向一个高度自动的处理机制。
  据报道显示,如果一名有效率的员工每分钟阅读50条微博,就需要1 400名审查者来阅读每分钟发布的7万条微博。如果一名工人每天工作8小时,这就需要超过4 000名员工来删除敏感的内容。这显然不可能实现。
  他说,“基于我们的数据,新浪内部看起来有一个政策办公室,这里的人们的工作就是说‘哦,老天,有太多关于朝鲜核试验的讨论了,关掉它们。’”一旦处理决定下达,删除工作就马上进行。[5]
  研究还发现,删除量从午夜到凌晨4点一直下降,而到了早上,审查者赶着删除晚上和早上发布的微博,删除量就会剧增。
  Wallach指出新浪是一家公司,并不是政府部门,为了继续运营就要与政府搞好关系:“为了政府不对你下手,你必须进行审查。他们走在刀尖上。”
  他补充道,新浪微博的审查不需要完美,只要足够好就可以了。当一些主题如一胎政策、言论自由和“蔑视政府”显然是审查的目标,然而一些需要禁止的主题却没有。
  Wallach说:“在我身上,审查从来没有出现在色情和赌博等你不会想去讨论的问题,他们不愿意让你讨论群体性行为。”
  7月31日,仅仅是单词“事故”也在被删除最多的主题之列。
  新浪微博的用户试图绕过审查者的一种方式是使用昵称、暗语或字谜来指拐弯抹角地涉敏感话题。另一个方法是用一个相似的汉字代替可能引发审查的汉字。
 “所有有趣的花招可以拿来躲避自动审查。只到政策部门的人发现它们。”Wallach说,毕竟写一些软件来检查这些敏感词的替代物并“把它们删掉”是相对简单的事情。
  机器和人工的结合能否压制禁忌话题“是一个有趣的问题”。
  评论这张
 
阅读(125)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017