图书:互联网的动力引擎

来自集智百科
跳转到: 导航搜索

本书主要提出了如下观点:推动互联网世界不断向前演化的理论主要是人类的注意力流动。为了论述这个观点,我们回顾了注意力经济学派、计算广告学、集体注意力研究、人类行为大数据分析等领域的主要理论成果,我们进一步提出了自己的占意理论,并针对不同的互联网现象给出了新的占意理论解释。进一步,我们综述了有关众包、人类计算和游戏的相关进展,指出游戏就是互联网的动力引擎,它可以为互联网提供源源不断的动力。

关于本书的写作方式以及其他说明,请看众包图书:互联网的动力引擎

这本书是基于Jake的一次集智俱乐部的讲座,讲座录音在录音+PPT,PPT在讲稿,如果有不理解本书内容或意图的,请查看该讲座。

第一阶段写作指南:第一阶段写作指南PPT

样章:众包与人类计算

下面的粗斜体字是未分配的部分任务

目录

众说纷纭

这一章是一个开场白,主要讲述互联网的发展历史等几个阶段,以及伴随着互联网的深入发展,越来越多的新社会现象、社会形态的产生。并在最后引入注意力。

风雨50年

[历史] 互联网发展的几个重要阶段

从1969年美军DARPA网投入使用到今天,已经经历了将近50年的历史。在这46中,互联网本身不仅仅获得了突飞猛进的发展,而且还对整个人类社会造成了举世瞩目的影响。我们主要关注互联网对人类社会的影响。它大致可以分成如下几个阶段

  1. 从DARPA到WWW时代
  2. 门户网
  3. 搜索引擎
  4. WEB2.0
  5. 移动互联网
  6. 物联网?

自从2013年以来,一股从比特到原子的颠覆大潮开始到来,这使得人们越来越多地开始关注互联网。这样,“互联网思维”兴起。要理解互联网思维,需要先了解一些互联网世界与原子世界不同的地方。这一章将主要回顾理论家们看到的千奇百怪、光怪陆离的现象

长尾

[案例] 亚马逊、淘宝

所谓长尾理论是指,由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。这些需求和销量不高的产品所占据的共同市场份额,可以和主流产品的市场份额相比,甚至更大。商业和文化的未来不在于传统需求曲线上那个代表“畅销商品”(hits)的头部;而是那条代表“冷门商品”(misses)经常为人遗忘的长尾。

长尾.jpg

以亚马逊为例。亚马逊在创立初期将图书作为在线零售商品,创始人杰夫·贝索斯曾就原因谈到“图书有非常不同寻常的特征,它有非常多的图书品种,任何给定时间都有近150万册英文图书,如果考虑全球所有语言,则不少于300万册。当谈及如此庞大的数目时,计算机的排序和组织能力就能得到充分发挥,没有哪一家物理书店能存放我们网站的110万种图书”。除了利用虚拟商品的储量无限大,生产运作成本低的优势,亚马逊还充分利用了“长尾理论”实现创收。举例来说,一家大型书店通常可摆放10万本书,但亚马逊网络书店的图书销售额中,大概有四分之一来自排名10万以后的书籍,也就是被人们遗忘的“长尾“。

随着时间的增长,现在在亚马逊网上书店成千上万的商品书中,一小部分畅销书占据总销量的一半,而另外绝大部分的书虽然个别销量小,但凭借种类繁多积少成多而占据总销量的另一半。正如亚马逊副经理史蒂夫·凯塞尔说的“如果我有10万种书,哪怕一次仅卖掉一本,10年后加起来它们的销售就会超过最新出版的《哈利·波特》”。一个前亚马逊公司员工精辟地概述了公司的“长尾”本质:现在我们所卖的那些过去根本卖不动的书比我们现在所卖的那些过去可以卖得动的书多得多。

将在线图书作为起点,亚马逊成功利用“长尾理论”,在1998年实现了收入6亿1千万美元,较上年增长312.7%;1999年实现收入进一步提升至14亿美元。从客户规模上来说,用户数达到了1200万。现在,亚马逊已经不仅仅是世界上最大的书店,通过不断扩充商品种类,亚马逊已经成为电子商务领域的“巨鳄“。2013年,亚马逊全年净销售额年增长22%,达744.5亿美元, 其中图书销售额为52.5亿美元,仅占7%。

同样的,作为电子商务领域的领头羊,马云创立的阿里巴巴集团旗下的淘宝网也正是成功利用“长尾理论“赢取了高额利润。淘宝网号称“没有淘不到的宝贝,没有卖不出去的宝贝”,不管是奢侈品、数码产品,还是衣服鞋子零食,甚至是虚拟世界的账号,在淘宝上都能找到。淘宝网的成功不在于它所经营的那些大品牌商品, 而在于它包括了所谓的冷门、小众商品。每天成交的数以万计的商品中80%都是那些位于最基层、利润空间已经很小的商品。对于80%的小众冷门商品的交易来说,其实小众只是一个相对的概念, 从绝对数上看, 这就意味着一个上千万人的大市场,将这些数量众多的群体汇集起来, 就形成了非常可观的经济利润。截至2013年底,淘宝、天猫与聚划算构成的“中国零售平台”交易总额(GMV)达到15420亿元,约合2480亿美元。远超eBay和亚马逊,成为全球第一。淘宝和天猫的活跃买家数超过2.31亿,活跃的卖家数大约为800万。

从亚马逊和淘宝的运作过程中, 可以看到长尾理论改变了企业营销与生产的思维, 带动互联网时代的商业变革。关注畅销商品的人会发现, 畅销商品带来的利润越来越薄, 而愿意尝试长尾商品的人, 则可能积少成多, 积累庞大商机。

参考文献

http://blog.sina.com.cn/s/blog_604de73f0100fgpm.html

http://fj.qq.com/a/20140211/013279.htm

潘昕 解读淘宝抓牢长尾赢取商机

开源

[案例] GNU、LINUX

众包

[案例] 搜寻马航MH370

2014年3月8日凌晨,马来西亚航空公司由马来西亚首都吉隆坡飞往北京的MH370航班起飞后不久与地面失去联系,与之一起失踪的,还有机上239名成员,其中有154名中国乘客。马航失联引起世界各国的广泛关注,搜救行动也随即展开。然而搜寻范围之大在3月18日扩至224万平方海里,超过绝大多数国家的国土面积。特别是搜寻重心由南中国海、泰国湾等海域转向南印度洋、安达曼群岛等海域,其中南印度洋堪称全球最偏远的地区之一,也是海水最深的地区之一。针对此次马航客机失联时间长、搜寻面积大的情况,美国DigitalGlobe公司迅速采取相应,从3月10日起,逐步调动旗下所有的5颗卫星对失事海域进行拍摄。这5颗卫星都有着1米以下分辨率,大概可以识别手提箱大小的物品,每天可以采集300万平方公里的高分辨影像。

在采集影像第一时间发布的同时,该影像还被上传到DigitalGlobe公司的众包平台Tomnod上。通过号召大众力量,搜寻失联航班踪迹。Tomnod是DigitalGlobe公司于2013年收购的一家致力于众包的团队,Tomnod借助众包的力量实现对遥感影像的分析,从而帮助人们更好的认识自己所处的世界。在马航事件之前,DigitalGlobe公司曾使用Tomnod平台利用众包的力量成功搜寻帆船“妮娜号”、标注台风海燕袭击菲律宾期间受损的建筑民宅等。 3月11日,在Tomnod页面上开设马航MH370失联客机专题页。在该页面上,事故海域的影像被分割成数个方块并编号,访问者可以通过对某个编号影像的标记,表述自己的判读结果,如标记海面油膜的发现、飞机残骸的发现等。然后Tomnod会通过后台对同一区域多个用户的判读结果进行统计分析,一旦足够多的人标记同一个影像,Tomnod专业团队将会审查确认,并统计排在前十位左右的最为可疑的地区,并与有关政府机构共享信息。随着更多信息的出现、搜索半径的扩大,网站也会及时更新影像数据。

众包界面.png

据Tomnod众包平台提供的统计数据,在页面开放的第一天,至少60万人登录网站排查图片,累计点击量超过650万次,给网站带来了“前所未有”的访问负荷。截至3月14日,该网站吸引了超过300万人,对290多万个特征点进行了标记。上传的卫星图片获得超过2亿5千万的浏览,平均每个像素点被肉眼至少检查过30次。截至3月19日,Tomnod众包平台注册用户几近翻倍抵达48.5万人,地图阅读量翻了3倍超越4.8亿次,众包参与者人数则抵达630万。

此外,访问者还可以通过右下方的“Share this Map”来分享该区域的影像到社交平台或者发送给朋友,来共同分析探讨,为搜寻线索贡献力量。

参考文献

http://conews.3snews.net/2014/0312/4195.html

http://leicaili2.cn/eat20150925/178.html

翻转

案例:中国好声音

互联网给我们现在的生活已经带来了非常大的冲击,很多东西都在翻转。

例如,《中国好声音》的娱乐方式就很特别。《中国好声音》刚刚结束了第四季的播出,最后在鸟巢举行的总决赛几乎可以说是全民关注了,相信很多人的微博、朋友圈在10月7号的晚上都或多或少的被刷了屏。根据数据显示,《中国好声音》第四季总决赛收视率高达6.87,收视最高峰达7.518。不分段CSM50城收视率6.566,份额接近30%,也就是说,在当晚打开电视的观众中,至少每四人就有一人在收看《好声音4》总决赛。创下了《中国好声音》四季最高收视纪录,更是再度刷新了自己保持的近五年内地综艺节目收视纪录。《中国好声音》的收视神话还不止表现在传统电视平台,作为网络独播平台的腾讯视频在当晚点击量也不断刷新,同时在线观看人数最高峰值超过1000万,截至8号下午,总决赛的播放量已经超过9200万,直逼1亿。

自开播以来,《中国好声音》的收视率一直居于同类电视节目的榜首。如今已经播出到第四季,每季播出前的宣传活动,都极大的吸引了观众的眼球,播出过程更是中注重观众的互动体验,通过官方微博微信发布话题,给观众提供交流讨论的平台。在10月7号好声音第四季决赛当晚,官方微博平台发出诸如#巅峰之夜#之类的话题,阅读量达到1.1亿,参与讨论的人数有13.7万。

《中国好声音》的出现,使中国电视音乐节目进入了选秀2.0时代。那么,与传统的电视音乐节目相比,《中国好声音》有哪些不同呢?在这里不做专业的分析,就从互联网角度来说。首先,《中国好声音》迎合了互联网的翻转思维。以前,人们在看演唱会或者音乐类电视节目的时候,都是观众坐在台下,歌星在舞台上表演,形式比较单一;而现在这种模式却被反转了过来,观众通过海选后可以作为参赛选手在舞台上唱歌,明星却是作为导师坐在台下,对选手的表现进行评论、和选手互相选择组成战队,然后导师带的领队伍再进行比赛,最后选出总冠军。这种以前只能作为普通观众,而如今可以像明星一样在舞台上表演的形式在播出之前就吸引了大量观众的关注,毕竟很多人都有一个明星梦。其次,在整个节目播出的过程中,电视机前的观众也不再是普通的观众,他们可以通过互联网参与到微博话题的互动中,讨论选手们的表现,为自己最喜欢的选手投票,在决赛阶段还可以对选手进行打分等,强烈的参与感使他们成为节目的忠实观众,甚至自发为节目宣传,也就是“自来水军”。总之,《中国好声音》所进行的翻转模式本身就很吸引观众,再加上整个比赛的过程中充分调动了观众的互动体验,这也难怪《中国好声音》会创下收视神话,成为这几年来最好看的电视音乐类节目。

参考文献

http://yuleguan001.baijia.baidu.com/article/194257

翻转课堂

还有一个关于翻转的例子是翻转课堂。“翻转课堂”(Flipped Classroom)就是将课堂内外师生的教与学的时间进行重新安排。在这种学习模式中,课外的时间从过去让学生做作业“翻转”为现在让学生在线上或线下自学或者协作学习教师预录(或预留)的教学内容;课堂内的时间从过去由教师讲授知识“翻转”为现在由教师对问题答疑或引导学生互动讨论。“翻转课堂”将课堂的主导权从教师转移到学生,真正意义上实施以学生为中心的教学设计、实现以问题或项目任务为导向的学习(Problem or Project-Based Learning,PBL)。这种课程设计也真正做到了深度学习、主动学习和探究学习。2012 年盖茨基金会专项捐赠100 万美元给MIT用于开发基于“翻转课堂”在线学习课程模式,以提高在线学习的教育质量和开放教育资料的利用效率。

以开放、共享为理念的开放教育资源的发展要从MIT 的开放课程(OCW)运动开始,早在2002 年,MIT 就把自己大量的课程放在网上供人们免费学习。后来,随着开放教育资源(OER)运动的发展,越来越多的高校和教育机构将优质资源共享。2012 年,开放教育资源这一领域又开始出现新一轮的高潮,以在线课程为核心的互联网公司纷纷涌现并获得飞速发展,从Udacity、Coursera 到edX、Udemy,它们以免费、高质量的课程内容为卖点,对学习者提供广泛的在线支持,包括课程任务布置、学习评估、师生和生生之间的互动交流,甚至为顺利完成课程的学生提供学习证书。这类服务受到了广泛的欢迎,人们将这一类新兴的大规模开放在线教育模式称为MOOC (Massive Online Open Course), 并将2012 年称为“MOOC 之年”。

“MOOC元年”开启之后,MOOC迅速在全球升温,平台建设风起云涌。先是美国顶尖大学及其教授相继创办了Coursera、edX、Udacity等数个MOOC平台,成为MOOC的领头羊,吸引许多国家的顶尖大学投身其中。然后是欧洲、亚洲和澳洲的一些国家争先恐后地创建自己的MOOC平台,备受瞩目的MOOC浪潮也在中国产生新聚变——清华大学发布了大规模开放在线课程平台“学堂在线”,面向全球提供在线课程,将打造为全球首屈一指的中文大规模在线教育平台,以抢占在线教育发展的先机。

伴随着平台建设的风起云涌,上线课程和用户的数量也突飞猛进。截至2013年12月,Udacity共开设5个学科的33门课程,用户数量为百万级;Coursera平台有557门课程上线,涵盖25个学科,汇集了英语、汉语、法语、俄语等12种语言,注册的学生数达到580多万;edX共开设125门用英语讲授的课程,涵盖25个学科,用户数量也为百万级。 MOOC的出现无疑是对传统教育的一大挑战,这种翻转课堂的模式使得教育越来越个性化。虽然现在MOOC还有许多的缺点,比如结业率低、教育质量有待商榷等等,但是随着互联网的发展,相信在不久的未来,MOOC的发展会越来越完善,这种教育模式也会越来越主流。

参考文献

MOOC的发展历程与主要特征分析 陈肖庚

在线教育的“后MOOC时代”-SPOC解析 康叶钦

共享

[案例]Uber、Airbnb

共享经济模式是眼下最热门的话题。如今,该词语被正式录入牛津英文字典,其定义为:“在一个经济体系中,通过免费或收费的方式,将资产或服务在个人之间进行共享。信息一般以互联网的方式进行传播: 多亏了共享经济,你可以在自己的需求得到满足的情况下,将闲置的资产比如汽车、公寓、自行车,甚至Wi-Fi网络出租给他人。” 显然,共享经济作为一门新生事物,正以其迅雷不及掩耳的速度冲击着我们传统的生活方式。正因如此,创业型企业也在资本市场的推动下,如雨后春笋般地在全球生根发芽。其中最具代表性的是交通行业的Uber和旅游住宿业的Airbnb。

Uber作为打车软件的鼻祖,它的诞生和美国传统的出租车行业状况很有关系。Uber 出世之前的出租车行业,面临着车脏,叫车慢,服务态度差,昂贵和无法接受信用卡的种种问题。而按照Uber创始人Travis Kalanick(以下简称 TK )所说,乘客们要的服务,无非是手机上点几下就可以迅速叫到车。正是带着这个想法,TK创立了Uber。

打开Uber的手机App,一共有四类车型可供选择——高级轿车、uberXL、uberX和人民优步。除了提供类似滴滴和快的打车的专车叫车服务,“共享经济”则是体现在“人民优步”之中。不仅价格较前三者亲民不少,与一般“的哥”不同的是,“人民优步”的司机中上有旨在改善乘车效率的公司CEO、下到希望补贴家用、丰富生活的家庭主妇。凡是在Uber平台上提出申请且符合资格审核的车主都可成为拼车合作司机,Uber在其中主要承担了公益性拼车服务平台的角色。

Uber的出现,逐渐打破了传统出租车行业的格局,凭借其便利性和独特的体验,Uber用户人数也在迅速增长。TK在2015 年一月份在一次讲演中提到,硅谷北端的旧金山市,传统出租车业务一年的营收大约一亿四千万美元。与之相比,Uber 的营收五亿美元,已经是它的三倍多。但旧金山使用 Uber 的用户还不到总人口的25%,在旧金山这个局部市场,Uber 一年的营收增长速度是200%。在旧金山,纽约,伦敦,Uber 载客的人次数,每年正在以三到六倍的速度增长。

同样作为共享经济的代表,Airbnb带来的是短租市场的变革。与传统的入住酒店不同,Airbnb给出行的人提供了一个新的住宿选择--住在陌生人的家里。房东可以充分利用闲置的资源,与全世界的人分享他的房间;对于入住的房客来说,则是能体验到家一样的服务,在独特的地点拥有独特的体验,比如说在城堡住一周,在别墅住一个月,再比如去巴黎旅游,可以住在巴黎人的家里,充分体验当地的风土人情等等,就像Airbnb的Slogan表达的这样:家在四方(Belong Anywhere)。

因为互联网的高速发展,Airbnb表达的“Live like a local(像当地人一样居住)”以及高度个性化的居住体验使得它能够迅速的发展壮大。截至到2015年一月份,Airbnb上已经有了100万个被提供住所,2600万房客,最高一晚的房客达到55万。

虽然现在还存在法律和信任上的问题,但是不可否认的是,随着互联网和科技的发展,共享经济的浪潮将会越来越强烈。对于个人来说,通过共享,人们可以更加合理的利用空闲资源,可以体验更多个性化的服务。另外,共享经济的发展可能催生越来越多的自由职业者,人们可以充分调动自己的才能,自由选择自己的任务、工作时间和工资。对于企业来说,共享经济将会引起众多行业的变革,创新型公司的成长将不可估量。根据PWC2015年的一份报告,在未来五年内,共享经济的风口主要集中在五大行业,包括:旅行、车辆共享、金融、人力资源、音乐及视频。到2025年,全球共享经济的市场价值预计将超过3350亿美元。

参考:

http://www.time-weekly.com/html/20150825/31016_1.html

http://www.iwamei.com/index.php?m=content&c=index&a=show&catid=7&id=28985

http://mt.sohu.com/20150903/n420416232.shtml

平台

[案例] 淘宝(平台经济),其它案例? 可以参考“平台经济学”

跨界

【微信】

微信 (WeChat) 是腾讯公司于2011年1月21日推出的一个为智能终端提供即时通讯服务的免费应用程序。通过消耗少量网络流量,微信支持跨通信运营商、跨操作系统平台通过网络快速发送免费语音短信、视频、图片和文字。显然,微信的出现使得移动、电信和联通的日子变得不好过。通过数据流量进行移动通信交互,完全“跨越”了运营商的短信业务;同时,微信开发的语音对讲功能,也冲击了运营商的语音业务,给运营商的盈利和维护带来巨大挑战。移动、电信和联通竞争很多年,然后突然发现,原来腾讯才是最大的竞争对手,三大运营商收费的主营业务因为微信的跨界而变得岌岌可危。有调研数据显示,用户使用微信后三个月与其前三个月相比,人均短信下降16%-17%,MOU(平均用户每月通话时间)下降5%。而对于微信来说,除了与运营商跨界竞争,随着移动互联网的发展,微信的跨界逐渐包含了更多的业务。

对微信公众平台的利用,再加上2013年微信推出了微信支付的功能,使得微信营销成为可能,也促进了移动跨界营销模式的出现。2014年微信和嘀嘀打车合作成功实现了移动跨界营销。用户进入微信后,在“我的银行卡”界面中可以看到“嘀嘀打车”入口;除了获取叫车服务,用户还可以使用微信支付向司机交付打车费用。与此同时,嘀嘀打车应用也已同步接入了微信支付,使用嘀嘀打车并且用微信支付每次能随机获得12~20元不等高额补贴,每天3次。运营数据显示,嘀嘀打车接入微信支付当天微信支付超过 6000 单。一个月之后,嘀嘀打车中平均日微信支付订单数为 70 万单,总微信支付订单约为 2100 万单,补贴总额高达 4 亿元。嘀嘀打车用户突破 4000 万,较活动前增长了一倍;日均订单为 183 万单,微信支付订单峰值过 200 万单。嘀嘀打车开通服务的 58 个城市均有成功使用微信支付来支付打车费的记录,其中 33 个城市日均微信支付订单超过 1 万单。

此外,微信的红包策略也成功实现了对移动支付行业的跨界。2014年春节微信推出的微信红包,仅仅两天就绑定个人银行卡2亿张,实现了支付宝8年的成果,同时也将微信支付业务的用户人群从青年推广到了全民。而在2015年,据统计微信红包春节期间的单日收发总量已超过去年除夕峰值的10倍。

截止到2015年第一季度,微信已经覆盖中国 90% 以上的智能手机,月活跃用户达到 5.49 亿,用户覆盖 200 多个国家、超过 20 种语言。此外,各品牌的微信公众账号总数已经超过 800 万个,移动应用对接数量超过 85000 个,微信支付用户则达到了 4 亿左右。

参考

http://baike.baidu.com/subview/5117297/15145056.htm

http://www.t2th.cn/news/show-14322.html

【支付宝】

支付宝的发展实现了多方面的跨界。支付宝是阿里巴巴旗下的第三方支付平台,现已成为全球最大的移动支付厂商。支付宝起初主要提供支付服务,包括网购担保交易、网络支付、转账等等。后来开始提供信用卡还款、手机充值、水电煤缴费等服务,在进入移动支付领域后,为零售百货、电影院线、连锁商超和出租车等多个行业提供服务,还推出了余额宝等理财服务。截至2012年12月,支付宝的注册账户已突破8亿,日交易额峰值逾200亿元人民币。10年间,支付宝已经潜移默化地改变了很多人的金融消费形态。实际上,在第三方互联网支付市场,凭借淘宝和天猫电子商务平台年超万亿元交易量,支付宝占据了近一半的市场份额。易观智库分析数据显示,2012年,中国第三方互联网在线支付市场交易额达3.8万亿元,支付宝占比46.6%。

余额宝是支付宝跨界理财行业的一大成功产品。余额宝主要提供小额金融理财服务,跟传统基金理财户均7万至8万元的投资额相比,余额宝用户的人均投资额仅1912.67元。根据支付宝与天弘基金联合发布的数据,余额宝上线18天累计用户数达到251.56万,累计存量转入资金规模达57亿元。另外,这18天中,有二次及二次以上转入行为的用户达到57.96万人,显示超过23%的用户有重复使用余额宝的习惯。按照保有的转入资金规模50亿计算,余额宝上线以来的日均净转入资金达到2.8亿元,远超此前业内预测的5000万至6000万元/天。这一数据也使得天弘基金的增利宝货币基金成为中国用户数量最大的货币基金。

此外,余额宝也在不断尝试跨界。比如,2013年推出的余额宝购车使得用户用户在余额宝中授权冻结全部购车款后就可在实体店提车,提车后的三个月内,冻结的车款仍然留在用户的余额宝账户内,产生的收益也全部归用户所有。三个月后,购车款才会划到汽车厂商处,用户相当于免费开了三个月的车。另外,去年余额宝还推出了旅游产品支付服务,消费者用余额宝购买淘宝旅行的产品后,钱可以继续冻结在余额宝账户中,一直到旅行完毕,“确认收货”之前,都可以享受余额宝收益。余额宝在跨界上的不断尝试显示出互联网行业与传统行业的碰撞融合的趋势。

参考

http://finance.sina.com.cn/money/fund/20130709/132316063165.shtml

http://tech.ifeng.com/bat3m/detail_2014_08/07/37904179_0.shtml

社群

[案例]小米手机、罗辑思维(罗友会)、罗氏霸王课。 这里要主要展示社群的强大威力,可以参考《社群营销》、《产品型社群》等书

连接

[案例] 微信(主要是微信是如何做到链接一切的?)

注意力

[案例] 美国的案例:被盗窃的sidekick(参见《人人时代》)、中国的案例:例如2015年的女司机遭暴打的事件,或者其它事件。主要目的:展示公众的注意力是如何改变事态的进程的。


故事:《黑客帝国》中的场景

《黑客帝国》这个电影中的情节可以很好地诠释很多我们看到的东西。《黑客帝国》说,在22世纪,机器统治了人类。方法不是杀掉人,而是把人圈养起来,造了一个大型的虚拟世界,叫Matrix,所有人接入电极,生活在这个虚拟世界里。而真实的肉体的人,则变成了一块块“电池”,将生物电供给机器。因此人对机器起的作用就是供给能量,而机器给人就是提供了一个大型虚拟世界,供人们醉生梦死。虽然这是科幻,但在换个角度来看,这个场景一点都不陌生,因为它现在正在发生。只是我们需要换一种方式理解能量,它不是实实在在的能用焦耳衡量的能量,而是我们的注意力。

大家想想看,你一天24小时的生活除了睡觉、吃饭,是不是有80-90%的时间是在面对屏幕?各种各样的屏幕。当你注视这些屏幕时,你已经在把你的注意力投射给屏幕背后的机器世界了,只有被你注意到的程序和应用,才会向前发展、才会更新换代。比如现在微信野心非常大,它的公众平台要变成一个互联网的新操作系统,把APP、iOS、Android等等平台全部架空。为什么它可以做到?就是因为它有注意力,因为它有非常大量的用户群,因此就获得了巨大的能量,可以自己生长、进化。所以注意力就是一种“能量”,如果你这样去理解的话,你就会发现黑客帝国所描述的情景正在发生着,而且人类贡献的能量百分比还会越来越高。因为越来越多的人买手机、平板、电视进入虚拟世界,现代人缺少虚拟世界就无法生活。

那么,将人类注意力作为计算机的能量,为什么可以这样去看呢?如果我们把计算机看成生态系统,那么每个01程序段就是一个生命体,而CPU 时间就像太阳的能量一样:能够争夺到CPU时间的程序才可以完成运算,经常的被使用,人们才有可能去改进它。反过来,没有人使用的程序,实际上是没有用的。进一步讲,什么东西决定了CPU时间的分配呢?恰恰是坐在屏幕前的人,是你的注意力。你注意到的程序才可能使用它。所以说人就像太阳,注意力就像能量,是它辐射了程序世界,促成了它们的进化。注意力流也会像能量流一样做功,这就是众包及人类计算,下文将会详细提到。

第一推动

本章主要综述有关注意力的科学概念。包括何谓注意力,它的生理学解释如何(这部分不要太展开,简单科普到即可)。以及注意力各个学派和历史进展。

注意力为何物

[科普] 什么是注意力,注意、意识与感知的关系是什么?注意力的认知神经科学、生理学基础


注意力经济

[人物] Herbert Simon

赫伯特•西蒙(Herbert A.Simon)是美国著名的学者,他在经济学、计算机科学、管理学、社会科学等众多领域都有建树,他于1978年凭借着“经济组织内的决策过程进行的开创性的研究”荣获了诺贝尔经济学奖。1956年的夏天,包括西蒙先生在内的数十名来自数学、心理学、神经学、计算机科学与电气工程等领域的学者聚集到美国新罕布什尔州汉诺威市的达特茅斯学院,召开了具有历史意义的人工智能会议,西蒙与参会的纽厄尔(A. Newell)、麦卡锡(J. McCarthy)和明斯基(M. Minsky)被公认为是人工智能的奠基人。西蒙也很早就提出了注意力经济学的思想,认为丰富的信息会导致注意力的短缺。现在,这一概念也越来越多地受到人们的关注。

早在1971年,西蒙就指出在一个信息丰富的世界里,会出现信息消费的不足。任何新的技术都不能增加一天的时间和人类心智吸收信息的能力。西蒙认为真正的问题不是提供更多的信息,而是分配接受信息的时间。西蒙本人没有提出“注意力经济”的概念,这与他把对注意力经济的思考仅仅限定在决策研究有关,其偏好影响了自身对注意力经济进一步的研究。心理学上有对“注意”的定义是说有机体在长期的进化中发展起来的一种对外界信息的选择机制,人对外界的信息不是被动的接受,而是主动地有选择地加工其中最有意义的部分。人的时间消费体现为注意力的支出,人的注意力消耗伴随着时间的消耗。

[人物] Goldharbor

迈克尔•高德哈伯(Michael H. Goldharbor)被公认为注意力经济之父,是最早研究注意力经济的学者之一,其研究视角与众不同,有很多独特之处。

高德哈伯认为,获得一个人的注意力,意味着你的影响力要超过他对你的影响力,如果得到一个人全部的注意力,你就可以引导他的行为,让他做你所希望他做的任何事情。高德哈伯认为注意力经济不是关乎时间和金钱的问题,他把注意力经济描述为由“明星”和“粉丝”主导的系统,这一系统不止局限于好莱坞,而是被广泛应用。他认为注意力经济的思想可以应用到人类社会的任何事情上,由此把注意力经济学的关注面大大地扩展了。

[人物] Davenport

托马斯•达文波特(Thomas Davenport)是埃森哲战略变革研究院主任,有着多年的管理实践经验,是全球最杰出的的管理权威之一。他出版的《注意力经济》是第一本详细地分析研究注意力在商业中的影响的著作。

意向性经济

[人物] Doc Searls

[案例] 网站:Crowdspirit,猪八戒网

[人物] Steve Pavlina

[案例] 加拿大青年别针换豪宅

体验经济

[人物] B. Joseph Pine II

[案例] 不同时代做蛋糕的方法、住家摄影师、密室逃脱、第二人生游戏

计算广告学

计算广告学可以看作是利用注意力与货币之间的交易寻找盈利点的一门非常实用的学科。

欢迎这方面的专家单独领这一节。

[科普] 什么是计算广告学

[科普] 计算广告学的发展简史

[案例] 谷歌的自动印钞机

用户数据分析

网站分析、留存分析等等都是用来分析用户的日志文件,进行商业挖掘的典型应用。希望专业人士能够承包这小节

[科普] 流量分析、留存分析 等概念

机遇与挑战

占意理论

这一部分主要提出我们的理论,首先用占意的新概念总括已有的注意力理论,包括注意力、意向和体验等等。其次,我们将主要建立占意流的生态学类比,然后,我们将讨论占意的一些性质。之后,我们将介绍一些与占意相关的一些概念:包括“爽”、黏性、好玩、心流等等。

什么是占意

阐述占意的概念,特别是与注意、意向和体验的关系。

占意的计算类比

主要叙述人类头脑与计算机的类比,以及占意与CPU计算的类比

提出观点:人类的计算优于机器的计算更容易吸引注意力

占意流网络

守恒性
耗散性
层级性

互联网生态系统

建立人-机关系的生态食物网的类比,对比能量流和占意流,绘制互联网生态图

占意的相关性与创造性

[案例] Google的品牌,Google是否垄断?微信的例子、快速迭代法、精益创业

基于占意的优化

[案例] 淘宝对支付宝

[案例] 技术对体验:微软和苹果

黏性
心流

求专业人士补充

[人物] Mihaly Csikszentmihalyi

[科普] 心流理论

解读互联网

本章力图用上面的占意理论来解读前面提到的互联网世界发生的各种各样的现象。

粉丝经济

宁可花钱,也不能放过注意力

碎片化

从占意流生态的角度讲,碎片化相当于是形成了大规模的基础性的低级的植物有机体(生产者),它们的规模都很小。但是,成熟的互联网必然会脱离这一阶段,形成更高的营养级和更大规模的占意流。

社群

[科普] 什么是社群

[案例] 小米的例子

精益创业

[科普] 什么是MVP、PMF、快速迭代、用户反馈

[案例] Facebook创业成长模式(参见 埃里克·莱斯:《精益创业》)、Webvan对亚马逊(参见龚焱:《精益创业方法论》)、微信成长的例子

增长黑客

[科普]什么是增长黑客、AARRR转化漏斗模型

[案例] Hotmail病毒营销、A/B测试 LinkedIn

情感与占意

未来,占领意识就会占领一切。利用情感是占领意识的最好手段。

[案例] 苹果公司与情感、Uber运营软文、锤子手机情怀营销、《Journey》游戏

众包与人类计算

本章主要介绍各类众包与人类计算的实例,并尝试给各类众包、人类计算、社会计算等进行分类与阐释。

交互式演化计算

案例:Biomorph程序

理查德·道金斯(Richard Dawkins)是一位生物学家,他在1986年出版的著作《盲眼的钟表匠》一书中提到了一个叫做“生物变形”(Biomorph)的小程序,用以展示自然选择、优胜劣汰的生物进化法则。

一群由简单编码构成的数字生物形态被绘制在屏幕上,用户通过鼠标点选其中一个看起来比较“顺眼”的数字生物,于是该程序就会按照遗传算法(参见框中的内容)的方法以该程序为母代进行模拟繁殖:将此生物的基因串复制若干份,并且在每一次复制的过程中都会以一定的概率发生变异。新产生的子代会替换掉原来屏幕上的所有生物形态而展现在玩家的面前,于是玩家再进一步选择……

Biomorph程序生成的数字生命形态

下图展示了一个被用户选择出来的生物形态进化轨迹:

一次连续点选得到的生命形态

在该程序中,用户扮演了上帝的角色,它会对随机生成的数字生物形态进行选择。于是,在用户一系列的鼠标点选操作下,数字生物形态开始不断地改进自身,从而越来越符合用户的“审美”标准。

案例:Johnson的人脸选择程序

人们发现,理查德.道金斯的这套方法实际上还可以应用到更有实际意义的应用中去。例如,美国新墨西哥州立大学的约翰斯顿教授(Victor s. Johnston)就开发了一个人类面孔生成的程序。这个面孔会在人点击的作用之下不断地演化,并用于辅助目击者寻找杀人凶手。

首先,约翰斯顿等人将成千上万张人脸进行编码。他们用一个基因编码鼻子的形状、一个基因编码眼睛的大小、另一个基因编码额头的宽度等等。然后,任意给定一串编码就可以对应一张特定的人脸。之后,与“生物变形”程序一样,计算机随机地选择一串编码就能在屏幕上生成一系列人脸,并让人进行选择。

进化中的人脸

玩这个程序的人不是普通用户,而是凶杀案目击者。他(她)需要选择一张最像罪犯的脸,而不是一张看起来最好看的脸。人们通常不知道如何描述罪犯的面部特征,但却可以轻松地识别出哪一张脸更像凶手。于是,只要目击者在电脑屏幕前不停地点选那些更像罪犯的脸孔,它就会一点点地把真正的罪犯面孔进化出来。洛杉矶警方后来真的利用这个程序帮助目击者寻找到了杀人凶手。

后来,这套方法被广泛地应用在了图形图像处理、语言和声音处理、工业和艺术设计、知识获取和数据挖掘、教育和娱乐等领域。人们将这种方法命名为“交互式演化计算”。

众包

[案例] WIKIPEDIA, 红气球挑战赛、Waze

案例:Wikipedia

桑格和威尔士就是受到了《大教堂与集市》一文的启发,决定采用开源的方式做一部基于互联网的百科全书。他们仿照斯托克的命名法,将这部百科全书命名为Nupedia(GNUpedia=Nupedia)。然而,Nupedia一开始的运作并不成功。桑格和威尔士精心地设计了一套挑选潜在作家的方法——每个参与者编写的词条都需要经过七个步骤耗时的评阅。正是这套繁琐的方式,使得他们的项目运作在不知不觉中再次变成了大教堂的方式。

Crowdsourcingwikilogo.png

一年后,桑格决定东山再起。一方面,桑格将一个名为WikiWikiWeb的编辑器程序装入了系统中。这使得成千上万的网民可以同时对同一个词条进行编辑,而所有的历史版本都被保留了下来,因此网民们可以清晰地看到这个词条的编写历史。另一方面,桑格转换了运作Nupedia的方式。在以前,他为了保证词条的质量和准确性,曾专门聘请各个领域的专家来编辑词条,其结果是虽然单个词条的准确度很高,但却使得整个项目失去了活力。后来,在WikiWikiWeb的技术支持下,他开始放手让大众去参与。结果,几个月后大众的参与却创造了3700多个词条,这已经远远超过了老Nupedia的数目和增长速度。

2001年,他们又打造了全新的百科全书Wikipedia,并将Nupedia百科全书的词条和编辑纳入了新百科全书中。Wikipedia一建立就以突飞猛进的速度增长着。到了2007年9月,它已经成为全世界最大的百科全书。到目前为止,Wikipedia已经有288个不同语言版本,其中,最大的英文Wikipedia共收录了490万个词条。2005年,Jim Giles在Nature上发表文章并指出,在比较了42个科技词条之后指出,Wikipedia已经达到了大英百科全书的精准度。

欢迎大家进一步补充关于Wikipedia社群的东西


案例:Clickworkers

受到开源软件运动影响的不仅仅是桑格和威尔逊。2000年的夏天,行星地质学家古力克和NASA(美国国家航空航天局)的软件工程师凯恩斯基尝试将开源的理念用于火星图像分析。科学家们为了寻找水存在于火星的证据,需要在卫星图像上识别和测量地貌,比如环形山、山脊、峡谷等,这是一项乏味冗长的工作,需要雇佣大量的人力才能完成。但是,凯恩斯基的想法是,是否能够借助开源软件的思想,将这些任务放在网上,并“外包”给大众来做呢?但是,她很快又有了退却的念头,“这些大众能分辨出新的环形山和退化的环形山的差别吗?这对于未经训练的人来说的确是个不小的挑战。”

但是,总归要试一试,于是古力克和凯恩斯基决定先做一个试验来测试一下大众的能力。他们将古力克已经识别、测量和分类好的一共8.8万幅火星图片拿出来交给大众,让他们再次识别、分类。由于已经有了标准答案,她就可以检测大众的能力。NASA将这个资料库发布到了网上,让那些时刻关注网站的业余天文学家帮助专家来分析图像。他们将这个项目命名为“Clickworkers(点击工人)”。令人吃惊的是,不到一个月后,上千名参与者就成功分析了资料库里面的所有图像。大众得到的结果既比专业人士得到的结果速度更快,同时准确度也相当地高——所有的分析结果都与标准答案极其匹配。这让古力克和凯恩斯基兴奋不已。2001年,NASA重启了Clickworkers计划,但这次是动真格的了。志愿者们负责的工作是从美国火星勘察器上传回的上千幅高清图像分析地貌。每个人每天花费10分钟的事却帮助了古力克的大忙。他们为科学研究做出了真正的贡献。

案例:红气球挑战赛

2009年12月5日,美国东部时间早上10点,为了庆祝ARPANet(互联网前身)诞生40周年, DARPA(美国国防部高级研究计划局)举办了著名的“红气球挑战赛”(Red Balloon Challenge)。参赛队伍需要在规定时间内找到部署在全美大陆未知地点的10只红色气象气球,率先找到全部10只气球地点的队伍将会获得4万美金。该挑战赛旨在探索如何利用互联网和社交网络解决分布式、时间紧迫的地理定位问题。

挑战赛在正式开始前一个月宣布,规则如下:在正式开赛后,主办方将会把10个直径为8英尺的红色气象气球分别固定部署在全美大陆,部署地点均在便于发现的公共场所。此外,还有两个在开赛前未公布的细节:第一,每个气球上面都有DARPA的横幅;第二,每个气球专门配备了颁发地点验证证书的工作人员。参赛队伍需要将他们找到的气球地点提交给DARPA的网站,并且会在当天给予反馈,告知哪些地点是正确的。DARPA计划每天在气球所在地时间下午5点卸下气球,并于第二天早上(10点?)重新部署。提交程序将开放一周,直至一支队伍找到全部10只气球。最后,将近4000支队伍参加了挑战赛。

红气球在美国大陆的分布情况

最终,来自MIT的研究团队“Red Balloon Challenge Team”在仅耗时8小时52分41秒情况下,找出全部10支气球地点,赢得4万美元的奖金,值得一提的是,MIT团队在开赛前几天才得知该项挑战赛。他们采用了一种递归激励的方式将参与者的利益与赢得比赛这一目标紧密结合,具体来讲,他们的方法如下:对于每个气球,他们承诺,奖励第一个告知这个气球地点的人2000美金,奖励把找到气球的人邀请加入团队的人1000美金,然后奖励前面这个邀请人的邀请人500美金,以此类推。剩余的奖金将被捐赠给慈善机构。此外,他们为了辨别可能出现的故意误导地点(实际上也确实发生了,甚至有些团队就采取了这个策略),他们制定了两个策略:第一,观察气球提交地点模式——故意误导通常都局限在同一个地点;第二,比较气球地址和报告人的IP所在地址——不一致可以判定为误导。如果是通过照片的方式提交,那么根据前文所说的两个未公开细节(只有各支队伍知道)即可判别。据赛后MIT团队统计,他们的递归激励方式构筑的邀请链条最长达15个人,扩散团队信息的推文有1/3来自美国本土外,共计有5000名以上的参与者,其中包括一些美国本土以外的人,而且平均每名参与者又将他们团队的信息通知了400名朋友,总计大约有200万人帮助他们寻找红气球。在如此仓促的准备时间下能取得巨大成功,不得不说,这真的是一个了不起的成就!

获胜团队的激励策略

第二名是来自GTRI(Georgia Tech Research Institute)的“I Spy a Red Balloon”团队。尽管他们未获得冠军,但他们也在仅耗时8小时59分11秒的情况下,成功找到了9只红气球的位置。由于他们早在开赛前三周就得知了挑战赛相关事宜,因此他们有充足的时间做准备,他们采取的方法如下:第一,在得知比赛后,第一时间就建立了专用网站(ispyaredballoon.com)招募参与者;第二,注册谷歌语音账号((262) I-SPY-SPY)来接收参与者关于气球地点的报告;第三,建立Facebook小组专门提供参与者与团队交流沟通;第四,尝试与美国主要的航运公司合作,希望他们的司机能帮助寻找,但公司出于司机安全和工作重心影响问题考虑,拒绝合作。他们的策略主要在于利用先机,大力提升团队的知名度(前三周就建立网站,利用大众媒体报道团队,以及搜索引擎优化提高网站排名),此外,他们也希望通过宣布将奖金捐赠给慈善组织,通过利他主义这一动机鼓励人们帮助自己。同样,他们也面临辨别报告真假的问题,而他们的策略比较保守:他们相信慈善行为能够一定程度的组织虚假报到。需要确认的话,如若方便,则团队成员亲自确认;否则,联系附近的商店帮助确认。赛后统计,他们的团队募集了将近1400名参与者,虽然未能获得冠军,但也是很了不起的成就。

第十名是由全美五所高校组成的“iSchools DARPA Challenge”团队。虽然他们最终只找到6只红气球,仅获得第十名,但是他们的方法却很具有代表性:他们从两个方面着手,第一:从他们所在学校募集参与者搜寻气球;第二,使用爬虫技术从Twitter、其他参赛队网站等公开访问站点爬取与红气球搜寻相关的信息。他们采用的判别策略如下:第一,通过照片分析和亲自确认二次验证的方式判断;第二,比较有意思的是,比赛中有一支队伍无意中泄露了一个红气球的精确地点,虽然希望借助配图文字的误导来弥补,但是该团队通过爬取多方数据最终确认得到了正确信息。赛后统计,他们团队绝大多数的气球数据都是通过爬虫技术得到的。虽然很遗憾未能获得好成绩,但是他们的方法很具有代表性,值得学习。

此外还有许多其它方法,比如,与其他团队交易红气球地点信息、通过IOS App收集结果等等,也都是取得了不错的结果。很有意思的是,第九名团队专门有一部分人发布虚假信息误导其它队伍。

参考文献

http://cacm.acm.org/magazines/2011/4/106587-reflecting-on-the-darpa-red-balloon-challenge/fulltext

案例:Waze
Waze界面

Waze是一款基于移动互联网的众包APP。除了传统的GPS定位以及路径导航等功能以外,Waze还允许用户动态地标注路况信息,包括某个路段的拥堵情况、是否有事故发生,甚至是当地汽油的价格信息等等。

传统的地图定位、导航软件的信息传递模式都是单向的,也就是只有从程序到用户的信息传递,而没有从用户到软件的反馈信息。这就导致导航程序无法应付实时动态的信息。Waze通过众包的方式,让所有的程序使用者参与到其中,它不但可以利用用户的实时行为校准地图,而且还可以让用户动态地为地图添加更多的有用信息。Waze甚至引入了游戏的机制,激励用户参与到这个大的动态地图中,让用户体会到无穷的乐趣。

案例:Polymath项目

从维基百科,到Clickworkers、Waze,所有这些众包项目的普遍特征是,它们都是由一系列很小而且彼此独立的任务组成的。但是,显然还有很多的任务是不具备这种特征的,任务的完成需要一个阶段一个阶段的进行,例如数学定理的证明。众包方法是否也适用于这类问题呢?

答案是肯定的,PolyMath就是一个致力于用众包方法进行数学定理证明的项目。2009年,数学家Timothy Gowers在他的博客上发起了一个不寻常的试验,他试图利用众包的方式完成组合数学中著名的DHJ(the density Hales-Jewett)定理的证明。在当时,数学家们已经找到了一个证明方法,但这个方法冗余而乏味,并不能为人们提供深刻的洞察。于是,Gowers希望通过众包的方式找到全新的证明方法。

在Gowers刚刚发布这个证明邀请的时候,仅仅有少数数学家进行了一些简短的评论。然而,仅仅37天后,这个帖子就有了800个重要评论。就这样,全球各地的数学家们零散地贡献着自己的想法和评论。3个月的时间过去后,Gowers发现PolyMath的参与者们已经找到了一个特例的证明,而这个证明是可以推广到整个定理的。此后不久,就在Gowers他们撰写论文的时候,加州大学的研究生Tim Austin就宣称在PolyMath重要思想的影响下,他自己也独立地找到了另一种新的DHJ定理证明方法。 与以往的数学问题求解不同,PolyMath项目并没事先进行任务分配和层级化管理,而且整个证明全部是公开透明的,这在人类科学历史上还是第一次。也是有史以来第一次利用众包方式求解这么难的问题。

人类计算

[案例] Duolingo、折叠游戏(Fold it)、通过游戏进行生物制药

求更多有意思的人类计算的案例

人物:Luis von Ahn
Luis von Ahn

Luis von Ahn是卡耐基梅隆大学的一位计算机科学家。早在2000年的时候,他与Manuel Blum合伙开发了一个CAPTURE程序,用于在用户登录网站的时候识别他是人还是爬虫程序。2005年的时候,他以“人类计算”为题完成了他的博士论文研究。在论文中,他讨论了ESP、Matchin等项目,主张开发“Game on purpose”(有目的的游戏)而充分利用人类的计算资源帮助计算机解决问题。2006年的时候,他在Google以Human Computation为题做了一次演讲,使得他一夜成名。2008年,Luis又在CAPTURE项目的基础上开发了reCAPTURE程序,利用人力帮助计算机解决字符识别问题。2006年获得Mac Arthur大奖。2014年,开展Duolingo项目,开始用人类计算的方式翻译互联网。

案例:reCAPTURE

2007年的时候,Google正在做一个大项目:将美国各大图书馆中的图书全部电子化。在电子化的过程中,有一个关键步骤就是如何将扫描的图书图片自动识别成计算机可以处理的字符,这就是工业界所说的OCR(Optical Character Recognition,光学字符识别)问题。在当时,OCR的识别准确率非常低,仅仅能达到83.5%的水平。在这种准确率水平下,文章读起来会感觉错字连篇。为了提升那剩下的16.5%的准确率,Google需要花费大量的资金雇佣工人劳力来对未识别字符进行修改,这既没有效率,又浪费成本。

于是,Luis von Ahn突发奇想,为什么不将他以前做的CAPTURE项目和这个OCR问题联系起来呢?我们知道,当人们使用电子邮件或者其他的网络应用的时候,会经常要输入验证码,以证明用户是一个真正的人而不是一个电脑程序。CAPTURE程序就是根据特定的算法将已知单词故意扭曲让用户识别。于是,每一分钟,都有成千上万的人浪费在了这个刻意的字符识别任务之中。可是,这样大量的人力事实上都被浪费了啊!就这样,Luis想,我们为什么不让用户直接识别那些OCR软件识别不出来的字符呢?这就是reCAPTURE程序的来源。

在reCAPTURE中,网站给用户的信息将包括两张图。一张图就是CAPTURE程序生成的扭曲的字符,以辨别用户是人而不是程序;另一张图则展示了OCR无法识别的书籍中的字符。如下图所示:

Recaptureprojectsillustration.png

用户需要同时输入这两个词才能通过网站的测试。第一个单词验证这是人而不是程序,第二个单词经过一定的交叉验证程序得到了对可疑字符的识别。交叉验证可以通过3个以上用户输入的字符完全相同来实现。最后,由于Google拥有庞大的注意力资源,当它采用了reCAPTURE程序后,就可以以平均每天160本的速度完成了自动校对的工作,其准确率从原来的83.5%上升到了后来的99.1%。更关键的是,在整个校正过程中,Google没有花一分钱。后来,Luis将这一项目总结为一篇论文在Science上发表。在文章结尾,他感叹道:“‘浪费的人力’是可以被我们利用起来以解决那些计算机很难求解的问题”。

目前,reCAPTURE程序又有了新的识别模式。如下图所示,用户需要从九张较为模糊的照片中选出特定类型的照片出来,比如有路标的照片,有门牌的照片。通过这样的识别方式,极大地借用了人力资源,巧妙的实现了图像识别的目的。

New-recaptureprojectsillustration.png

参考文献

Luis von Ahn, Benjamin Maurer, Colin Mcmillen, David Abraham, and Manuel Blum. reCAPTCHA: Human-Based Character Recognition via Web Security Measures. Science, (321)5895:1465-1468, Aug 14, 2008

案例:Matchin
Matchin界面

另一个例子叫MATCHIN,它也是利用玩家玩游戏来给图像的美丽程度打分。游戏一开始,玩家A和B的屏幕上就会同时出现同样的两张图,系统要求每个玩家都选出一张对手觉得更美的图出来。为什么选对手觉得更美的图,而不是你认为更美的图?因为这样可以迫使玩家放弃自身的审美而尽量采用大众审美来判断以达到一定的客观性。于是,当两个人在尽量短的时间内投票出了一致的结果后(在两张照片中选出了同一张照片),游戏给双方加分并进入了下一轮。就这样,系统随机地从图片库中抽取两两的图片对让玩家做比较,从而给所有的图片打分排序。结果,用这种方法,系统真的能找出非常美丽的图片,如下图所示。就这样,这个Matchin系统通过游戏的方式把人类内心对美的感受揭示了出来。

Matchin筛选结果

案例:Verbosity
verbosity界面


Verbosity就是一个利用游戏的方式解决语义网络构建问题的人类计算系统,它可以帮助计算机更好地理解世界。比如,我要建立一个与笔记本电脑(LAPTOP)这个概念相关的语义网络。于是,我会让两个玩家一起玩一个游戏,他们在不知不觉中就会完成知识的输入。具体玩法是,计算机在玩家A的屏幕上打出LAPTOP这个词,并要求A用一些标准的语句描述LAPTOP,比如A会说它包含一个键盘、或者拥有一块屏幕等等。与此同时,在玩家B的电脑上,B不能看到LAPTOP这个原始词,但却可以看到A输入的那些描述LAPTOP的词。于是B开始尽自己的最大努力猜玩家A看到的原始词是什么。最后,直到B猜出来那是LAPTOP,这一轮游戏结束,系统会根据时间的长短给两个玩家增加分数。而在A和B共同娱乐的同时,系统已经收集了大量关于LAPTOP的语义知识,至少系统已经知道笔记本电脑包含键盘和屏幕了。

案例:ESP
ESP游戏界面

还有一个游戏叫ESP,也是两个人玩。两个人看到同样一张图片,然后他们就一起输入一些单词描述这张图片,直到两个人输入的单词一模一样了为止,两个人各自加分。最后,玩家得到了娱乐,系统得到了一堆图片的标签。这些图片标签会对日后图片检索、分类、理解有着巨大的帮助作用。

游戏的世界

在整个概念体系里,占意是动力,而游戏是未来互联网发展的动力引擎。所以,本质上讲,人是通过玩游戏而产生占意的投入,从而趋势整个互联网不断演化的。这一章重点阐述什么是游戏,抽取出其背后的本质;回顾整个游戏的发展及其脉络,讨论游戏与复杂性的关系;以及讨论游戏在未来的新发展。特别强调的是游戏+时代的发展趋势。

本章招募心理学、游戏业的大拿出手,可以全面重新规划这一章

什么是游戏

求认领这一节

发展简史与分类

求认领这一节

平行实境游戏

[案例] 墓碑德州扑克、调查你议员的开支、……(求更多的平行实境游戏,参见《游戏改变世界》)

游戏+时代

游戏对生活的渗透,游戏化

占意与人工智能

人工智能无非是现在发展最为迅猛的一门技术。很多人预言人工智能将取代人类成为这个世界的主宰。但按照我们的理论,人工智能作为技术这个更大载体的一部分也必然受到整个人类集体占意的推动向前发展的。那么,突飞猛进发展的人工智能技术又将意味着什么?它将以一种怎样的方式与人类的占意相结合?本章将主要讨论这个问题。

人-机交互

机器能否产生注意?

众包+人工智能

参与者的宇宙

这一章在上述各章的基础上展开偏向哲学思辨和纯粹科学形而上性质的讨论,争取把这套理论从哲学理论深度层面把背后的世界观和出发点说透。

量子力学与不确定性

简单引述量子力学发展历史以及对人们世界观的冲击。重点阐述量子力学中的本征不确定性。

惠勒的参与者的宇宙

重点阐述惠勒的参与者的宇宙这一核心观点,以及他的那张著名的自观察系统图

图灵机-观察者模型

给出图灵机-观察者模型,包括从人-机的角度审视计算机程序与交互,还包括人-机的演化以及最终的相变。

人机系统与量子比特

引入量子认知与量子决策理论,阐述人-机系统可以看作是一个量子测量系统。这部分不必讲深,否则科学理论味道太浓,主要是把思想阐述清楚,并让人感觉到互联网的量子类比是有基础的。

互联网与量子场

这部分是对上一个小节的延伸讨论,主要阐明多个人-机交互系统可以看作是量子多体系统,于是可以用量子场论的形式描述互联网。同时,可以引入产生-湮灭算法与虚拟世界的关系。这部分纯属YY,但会让人感觉颇具启发性和冲击力。

走近2050

本章尝试对未来(2050年,按照库兹维尔德理论,技术奇点将在这段时间左右到来)进行大胆的畅想,争取总结出几条比较靠谱的预测。

欢迎各种YY,各种不靠谱想法,但都要跟注意力、占意的推想有关

体验交换

创新无用

全方位的沉浸

语言消失

争鸣与讨论

这是一本众包图书,大量不同的作者都会参与进来,这样大家免不了就会对一些问题存在分歧。由于正文叙述必须统一,否则书的可读性就会下降,所以我们讲分歧争议的部分都归为统一的最后一章。

货币流与注意力流

相关词条

众包图书:互联网的动力引擎

个人工具
名字空间
操作
导航
工具箱