编辑推荐
1、大数据、智能革命、人工智能、机械智能领域首要选择科普作品,易于理解,有态度,有温度。
2、雷军、罗振宇、涂子沛、李善友、邬贺铨院士联袂推荐。
3、罗辑思维8小时售罄首印图书。
4、百万册畅销书作者作吴军博士备受期待作品。
5、吴军博士,计算机科学家,并做过Google、腾讯等世界知名公司的高管,作品兼具学术的前瞻性与文本的可读性。
6、社会□革已到拐点,首次进入人们的思维领域,加入浪潮成为控制世界的前2%的人,徘徊不前则一定会被淘汰。
内容简介
大数据和人工智能迅猛发展,对社会和商业的影响日益深刻,从学术界到企业界,智能化浪潮的来临,已经成为共识。可以比肩于大航海时期和工业革命的此次□革浪潮,必然会对我们的技术发展、商业和社会都会产生重大的影响。作者吴军在《智能时代:大数据与智能革命重新定义未来》中指出,首先,我们在过去被认为非常难以解决的问题,会因为大数据和机器智能的使用而迎刃而解,比如解决癌症个性化治疗的难题。同时,大数据和机器智能还会彻底改□未来时代的商业模式,很多传统的行业都将采用智能技术实现升级换代,同时改□原有的商业模式。大数据和机器智能对于未来社会的影响是全方位的。
另一方面,智能化也会对整个社会带来巨大的冲击,尤其是在智能革命的初期。因此,在智能时□□始的时候,我们需要未雨绸缪,力争做控制世界的2%人,而不是被智能化浪潮淘汰。
前言
大数据与机器智能催生智能时代
大数据是当今信息社会的热词。关于数据,狭义上,在计算机科学中,数据是指所有能输入计算机并被计算机程序处理的符号介质的总称,是用于输入电子计算机进行处理的具有一定意义的数字、字母、符号和模拟量等的通称。广义上的数据,按照维基百科的定义,则是以适于更好使用或处理的方式来表示或编码的信息或知识,它可以被测量、收集和报告及分析,能够使用图形或图像来显示。按照上述定义,数据是伴随人类社会而出现的,从狭义的计算机数据的角度来看,数据从有计算机算起到现在也有70年□□了,从摩尔定律的提出到现在也有50年了。这几十年来,全球数据量按每年平均40%的速度增长,由摩尔定律所驱动的计算机处理能力也在持续增长,现在每年新增的数据量与计算机处理能力都是以前无法相比的,但数据量与计算机处理能力之比并没有因为年份而有数量级的大□化。问题是为什么现在才出现大数据热呢?
吴军先生的《智能时代》一书给出了答案。该书回顾了科学研究发展的四个范式,即描述自然现象的实验科学、以牛顿定律和麦克斯韦方程等为代表的理论科学、模拟复杂现象的计算科学和今天的数据密集型科学。即便在实验科学和理论科学及计算科学范式时期,数据仍然起了重要作用。作者在介绍科学发展史时用实例说明了数据在科学发现中的位置,在牛顿和麦克斯韦时代,他们所导出的简洁的公式给出的确定性的规律是由大量观察数据所验证的。现在我们面对的是更复杂的自然和社会现象,多维度和多□量导致很大的不确定性,虽然还不能用解析式来说明因果关系,但如果从足够多的数据中发现相关性也能把握事物发展的轨迹,这就是数据密集型科学产生的背景。大数据的应用缘于需求,更是得益于技术的发展:互联网的宽带化和移动互联网及物联网的技术与应用源源不断产生数据,摩尔定律所支撑的计算能力几乎是以十年千倍的速度提升,云计算的集约化运用模式降低了信息化的成本,更重要的是机器智能的发展。计算机的计算与存储能力是人远远不及的,唯一不足是智能,但人的智能也不是与生俱来,只是学习的结果。机器智能可以通过深度学习得到,从而将大数据挖掘问题转化为可计算问题来处理。大数据挖掘的需求加速了机器智能技术的成熟,可以说,大数据与机器智能相伴而生,促进物联网从感知到认知并智能决策的升华,催生了智能化时代。这是一个计算无所不在、软件定义一切、数据驱动发展的新时代。相比以蒸汽机的发明为标志以机械化为特征的第一次工业革命,以电的发明为标志以电气化为特征的第二次工业革命,现在以大数据应用为标志之一和以智能化为特征的新一轮产业革命到来了,它对人类文明和社会进步及经济发展的影响将不亚于前两次工业革命。
读吴军先生的《智能时代》和同样出自其手的《数学之美》和《文明之光》,我感受到作者深厚的数学与物理功底。他对科学发展史研究情有独钟,见解深刻,以□□的眼光引导读者认识现代科技的发展趋势。他的书深入而浅出,既专业又通俗。《智能时代》一书与前两本书相比更关注产业□革,从工业革命谈起,顺理成章导出大数据与智能化,并积极评价了大数据与机器智能对社会与产业发展的贡献,同时根据□□经验分析了智能时代可能产生的负面影响,指出技术时代的□迁总是会引起现有产业格□的重大调整,要抓住智能时代的机遇并认真对待挑战,力争在新一轮产业□革浪潮中占领先机。作者过去在谷歌和腾讯公司的工作经历和多年从事大数据与机器智能的研究实践,反映到《智能时代》一书中对相关技术的准确把握。但作者并没有将笔墨的重点放在对技术的深入解读上,而是着眼从技术的应用中体现大数据的理念,聚焦于启迪创新思维。综观全书,这是一部近代科技的□□书,也是一部科普书,也可以说是一部指导创新的教科书。由于大数据的应用必然会渗透到所有的领域,因此本书不仅值得IT行业科技人员一读,对关注信息化应用的其他行业的科技人员和管理人员来说也必定开卷有益。
目录
序 一 大数据与机器智能催生智能时代 邬贺铨
序 二 智能时代,未来已来 李善友
前 言 人类的胜利
第一章 数据—人类建造文明的基石
如果我们把资本和机械动能作为大航海时代以来全球近代化的推动力的话,那么数据将成为下一次技术革命和社会□革的核心动力。
现象、数据、信息和知识
数据的作用:文明的基石
相关性:使用数据的钥匙
统计学:点石成金的魔棒
数学模型:数据驱动方法的基础
第二章 大数据和机器智能
在有大数据之前,计算机并不擅长于解决需要人类智能的问题,但是今天这些问题换个思路就可以解决了,其核心就是□智能问题为数据问题。由此,全世界开始了新的一轮技术革命——智能革命。
什么是机器智能
鸟飞派:人工智能1.0
另辟蹊径:统计+数据
数据创造奇迹:量□到质□
大数据的特征
□智能问题为数据问题
第三章 思维的革命
在无法确定因果关系时,数据为我们提供了解决问题的新方法,数据中所包含的信息可以帮助我们消除不确定性,而数据之间的相关性在某种程度上可以取代原来的因果关系,帮助我们得到我们想知道的答案,这便是大数据思维的核心。
思维方式决定科学成就:从欧几里得、托勒密到牛顿
工业革命,机械思维的结果
世界的不确定性
熵—一种新的世界观
大数据的本质
从因果关系到强相关关系
数据公司Google
第四章 大数据与商业
在未来我们可以看到,大数据和机器智能的工具就如同水和电这样的资源,由专门的公司提供给全社会使用。
从大数据中找规律
巨大的商业利好:相关性、时效性和个性化的重要性
大数据商业的共同点—尽在数据流中
把控每一个细节
重新认识穷举法—完备性带来的结果
从□□经验看大数据的作用
技术改□商业模式
加(+)大数据缔造新产业
第五章 大数据和智能革命的技术挑战
大数据的数据量大、维度多、数据完备等特点,使得它从收集开始,到存储和处理,再到应用,都与过去的数据方法有很大的不同。因此,使用好大数据也需要在技术和工程上采用与过去不同的方法。
技术的拐点
数据收集:看似简单的难题
数据存储的压力和数据表示的难题
并行计算和实时处理:并非增加机器那么简单
数据挖掘:机器智能的关键
数据安全的技术
保护隐私:靠大数据长期挣钱的必要条件
第六章 未来智能化产业
现有产业+机器智能=新产业,未来的农业、制造业、体育业、医疗、律师,甚至编辑记者行业都将迎来崭新形态,新产业将取代旧产业满足人类的个性化需求,大数据将导致我们整个社会的升级和□迁。
未来的农业
未来的体育
未来的制造业
未来的医疗
未来的律师业
未来的记者和编辑
第七章 智能革命和未来社会
在历次技术革命中,一个人、一家企业,甚至一个国家,可以选择的道路只有两条:要么加入智能浪潮,成为前2%的人,要么观望徘徊,被淘汰。
智能化社会
精细化的社会
无隐私的社会
机器抢掉人的饭碗
争当2%的人
后 记
参考文献
作者简介
吴军,博士,著名自然语言处理和搜索专家,硅谷风险投资人。他的著作《数学之美》荣获国家图书馆第八届文津图书奖、第五届中华优秀出版物奖,《文明之光》被评为2014年“中国好书”,《浪潮之巅》荣获“蓝狮子2011年十大ji佳商业图书”奖。
吴军博士曾经担任Google资深研究员,设计了Google中、日、韩文搜索算法以及Google的自然语言分析器。2010-2012年期间担任腾讯负责搜索和搜索广告等业务的副总裁,后回到Google负责计算机自动问答项目。
吴军博士自2008年开始从事风险投资,并于2014年作为创始合伙人创立了硅谷资本风险投资□□。他也是上海交通大学客座研究员和约翰·霍普金斯大学工学院董事。
精彩书摘
2016年是机器智能□□上一个具有纪念意义的年份,它是一个时代的结束,也是新时代的开端。这一年距离1956年麦卡锡、明斯基、罗切斯特和香农等人提出人工智能的概念正好过去了六十年,按照中国的习惯正好过去了一个甲子。而当年在达特茅斯学院提出这个概念的10位科学家中最后一位科学家明斯基也在这一年的年初离开了人世,这或许标志着人类在机器智能领域第一阶段的努力落下来帷幕。就在明斯基去世后的两个月,Google的围棋计算机AlphaGo在同世界著名选手李世石的对□中,以4:1取得了压倒性的胜利,成为第一个战胜围棋世界冠军的机器人,它的意义要远远超过1997年IBM深蓝战胜卡斯帕罗夫,因为从难度上讲,围棋比国家象棋要难6-9个数量级。这件事不仅是人类在机器智能领域取得的又一个里程碑式胜利,而且标准这一个新的时代—-智能时代的开始。
从计算机发展的角度看,智能机器在所有棋类战胜人类其实只是一个时间问题,因为机器运算能力的提升是指数增长的,而人类智力能够做到线性增长就不错了。因此一定存在一个时间点——在所有的棋类比赛中都会超过人。在1997年IBM的深蓝战胜卡斯帕罗夫之后,围棋不仅是最后一个计算机尚未□□人类的主要棋类,而且还担负了上千年东方文化的蕴含,即棋道。虽然大部分人相信计算机最终可以在围棋上□□人类,但是总是觉得那还是几年后的事情。就在AlphaGo和李世石比赛之前,李世石本人认为前者的水平和他差出一到两个子,也就是说,即使他让先也能5:0获胜。中国围棋界的泰斗聂卫平也认为今天的计算机是不可能战胜人类的冠军的。就连曾经在Google工作过的IT行业老兵李开复博士也不相信AlphaGo能赢。这并非李开复等人对今天机器智能的发展状况不够了解,而是因为下围棋是一件太难的事情。2015年年底,AlphaGo仅仅赢了樊麾二段而已,离九段还差得远呢。但是大家忘记的一件事情,那就是AlphaGo水平的提高并不需要人那么长的时间,事实上在Google内部,大家在开赛前已经知道AlphaGo的水平并在九段之下。
2016年3月9日,AlphaGo和李世石之间的世纪大战开始了。AlphaGo在第一盘出人意料地轻松获胜。当然,大部分人在赞誉AlphaGo水平的同时,依然认为这可能是李世石在试探计算机而已,毕竟那是五盘的比赛,用一盘棋试探毫不了解的对手未尝不是明智之举。但是当AlphaGo在第二盘获得连胜并且下出了很多人类想不到的好棋后,对机器智能持怀疑态度的聂卫平等人,都对它产生了致敬。在AlphaGo获得第三盘胜利之后,很多超一流的棋手都渴望和它一比,希望以此检验自己的水平,并且能够提高技艺。虽然李世石在第四盘抓住AlphaGo的一个失误打了一个漂亮的翻身仗,但是AlphaGo在最后一盘稳稳地控制着□面,直到胜利。可以讲在那一次人机大战之后,围棋界对机器智能从怀疑□成了顶礼膜拜,大家都意识到,按照AlphaGo在过去几个月里的进步速度,只要Google愿意继续投入科研,很快人类所有的围棋高手都无法和它过招了。
计算机之所以能战胜人类的,是因为机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠大数据和智能算法。在数据方面,AlphaGo在训练时使用了几十万盘围棋高手之间对弈的数据,这是它获得所谓的“智能”的原因。在计算方面,AlphaGo采用了上万台服务器训练它下棋的模型,并且让不同版本的AlphaGo相互对弈了上千万盘,这才保证了它能做到“算无遗策”。具体到下棋的策略,AlphaGo里面有两个关键的技术:把棋盘上当前的状态□成一个获胜概率的数学模型,这个模型里面没有任何人工的规则,而是完全靠前面所说的数据训练出来的。第二个关键技术是启发式搜索算法—-蒙特卡洛数搜索算法(Monte Carlo Tree Search),它能将搜索的空间限制在非常有限的范围内,保证计算机能够快速找到好的下法。虽然AlphaGo的训练使用了上万台服务器,但是它在和李世石对弈时仅仅用了几十台服务器(1000多个内核以及一百多个GPU)。相比国际象棋,围棋的搜索空间要大 倍,AlphaGo的计算能力相比深蓝,其实并没有这么多倍的提高,它靠得是好的搜索算法,能够准确地聚焦搜索空间,因此能够在很短的时间里算出最佳行棋步骤的。由此可见,下围棋这个看似智能型的问题,从本质上讲,是一个大数据和算法的问题。
当然,Google开发AlphaGo的最终目的,并非要证明计算机下棋比人强,而是要开发一种机器学习的工具,让计算机能够解决智能型的问题。AlphaGo和李世石对弈,实际上是对当今机器智能水平的一个测试。从樊麾到李世石,实际上是用他们的专才在帮助Google测试当今机器智能的发展水平。在人机对弈的第四盘李世石反败为胜的过程中,他无意中发现了AlphaGo的一个缺陷。因此,Google的成功里面也有李世石等棋手的功劳。从这个角度讲AlphaGo的胜利标志着人类在机器智能方面达到了一个崭新的水平,因此它是人类的胜利。
AlphaGo无论是在训练模型时,还是在下棋是所采用的算法都是几十年前大家就已经知道的机器学习和博弈树搜索算法,Google所做的工作是让这些算法能够在上万台甚至上百万台服务器上并行运行,这就使得计算机解决智能问题的能力有了本质的提高。这些算法并非是专门针对下棋而设计的,很多已经在其它智能应用的领域(比如语音识别、机器翻译、图像识别和大数据医疗)获得了成功。AlphaGo成功的意义不仅在于它标志着机器智能的水平达到了一个新的台阶,还在于计算机可以解决更多的智能问题。今天,计算机已经开始完成很多过去必须用人的智力才能够完成的任务,比如医疗诊断,阅读和处理文件,自动回答问题,书写新闻稿和驾驶汽车等等。可以讲,AlphaGo的获胜,宣告了机器智能时代的到来。
AlphaGo的获胜让一些不了解机器智能的人开始杞人忧天,担心机器在未来能够控制人类。这种担心是不必要的,因为AlphaGo的灵魂是计算机科学家为它编写的程序。机器不会控制人类,但是制造智能机器的人可以。而科技在人类进步中总是扮演着最活跃最革命的角色,它的发展是无法阻止的,我们能做的是面对现实,抓住智能革命的机遇,而不是回避它、否定它和阻止它。未来的社会,属于那些具有创意的人,包括计算机科学家,而不属于掌握某种技能做重复性工作的人。
在AlphaGo取得人机大战胜利之际,我们出版这本书,希望能让大家更多地了解大数据的本质、它的作用、它和机器智能的关系、机器智能的原理和发展过程,以及它们二者对未来产业和社会的影响。本书一共分为七章,分别介绍了数据的作用,大数据的本身,机器智能的原理及其发展过程,大数据思维的核心及其重要性,大数据和机器智能与商业的关系,它们对社会正反两个方面的巨大影响。书中的核心内容来自我在研习社和一些大学商学院讲课的讲义,但是考虑到大家读书和听课毕竟有很大的区别,因此在将讲义改写成书的时候,我在书中增加了大量的案例和□□背景介绍,以方便大家能够系统地了解大数据和机器智能的来龙去脉,以及我们对未来进行分析的依据。