人工智能产业链的逻辑与前景
陆骏 、北大国发院
人工智能发展史
早期:20世纪40-70年代
人工智能最早由图灵提出,他在图灵测试中发出灵魂拷问:机器能不能被识别为一个人?图灵测试也成为衡量机器是否能表现出与人类无法区分的智能行为的标准。现在人工智能的算法基础其实在图灵测试之前就已经出现。有了算法基础,很多人对人工智能表现出很高的期待。随后,首个神经网络模型感知机(SNARC),国际象棋爱好者喜爱的对弈程序先后问世。
寒冬期:20世纪70-80年代
然而,上述这些产品距离人们对人工智能的期望相去甚远,很多人认为这些只是游戏,远不能达到辅助人或者帮助人的期望,总体看用处不大。人工智能算法复杂,当时计算机的算力有限,商业应用也不尽如人意。因此无论是在商业领域还是投资领域,没人再提神经网络这件事。
复兴期:20世纪80年代开始
上世纪80年代以后,随着计算机的发展和算力提升,小型计算机进入市场,机器学习进入实际使用,这一领域开始出现新的发展。20世纪80年代开始,多层神经网络及卷积神经网络理论建立。初代模型是单层的神经网络,存在一些局限,得益于算力的提升,算法有进步。
2006年,“深度学习”提出并开始应用于计算机视觉、自然语言处理、语音识别、机器人、自动驾驶、医疗诊断、对弈程序等领域。
从棋类角度可以明显的看到AI的进步。
1997年时产生了国象人工智能高手“深蓝”,它击败当时国象世界冠军卡斯帕罗的新闻可谓是家喻户晓。客观而言,深蓝还是基于一个权重比较高,相对简单的方式在学习,并不是神经网络式的学习,但已经达到击败国象世界冠军的水平。
2016年时,AlphaGo战胜了围棋世界冠军李世石。目前,和AI的相似度已成为评价棋手棋力的重要参考,最顶尖的围棋高手与AI的相似指数也只能达到90%。从这些指标可以看出近些年人工智能的飞速发展。
人工智能高相关产业的发展逻辑
人工智能的技术主要分为深度学习和大数据。海量的数据让深度学习的算法变得越来越成熟。开源大语言模型也在蓬勃发展。越来越多的人把自己研发的语言模型放到常见网站上,这已经成为一种趋势性的发展方向。
算力是大语言模型最重要的部分之一。算力提升的需求带动芯片需求暴涨。目前英伟达(NVIDA)占据AI行业中超90%的芯片市场份额,2017年的V100(121T)仍被大量使用,H100(约4000T)的需求快速增长。由此可见,这个行业的发展很多时候主要依赖于算力的提升。例如输入1亿的数据,以前需要算一天,现在100亿数据可能只需要1小时或者1分钟就能出结果。
人工智能的发展过程也伴随着一些问题。比如十年前比较出名的人脸识别软件,把一些非洲裔美国人识别成了猩猩。后来开发者发现,这主要是由于非洲裔美国人的人脸数据太少所致。
市场方面,科技巨头更加注重大语言模型的发展。在人工智能领域最能“砸钱”的是大型互联网公司。分行业看,除了基础研究,资金一般会流向附加值特别高的行业,比如制药行业。以前生产一种药品,从分子筛选到成药的过程大概需要30年。现在随着AI技术的发展,这一过程大概只需要5-10年就能完成,投入的成本约为原来的10%左右。(这是我个人得到的数据,可能没那么精准。)
另一个高附加值的行业是自动驾驶。现在几乎每家汽车公司都在做自动驾驶,不仅设立了专门的公司,也顺带养活了做精细地图的公司。大家或许见过在路上拍摄路况的工作人员,因为精细地图需要每条道路都有专业机器记录的数据。因此,自动驾驶的火爆也带火了生产这些机器设备的厂商。
通用需求方面,目前算力是一个主流的需求。我们当前使用的芯片并没有非常高端,因此半导体行业仍存在较大发展空间,还是能吸引大把投资。文字、语言识别和翻译工作的需求量也比较大,特别是在翻译领域,人工智能已经做得很不错,只有一些小语种还不太成熟。
目前,人工智能对各行业渗透较多。以前做一个项目,需要前期获得需求,中期不断调研,后期获得结果。中间调研的阶段通常很漫长。现在有了人工智能,只要知道自己手里有什么资源,想要什么资源,其他的一切可以交给算法和人工智能,它可以给出一个大家期望的,或者说是局部最优的解答。
很多岗位越来越离不开人工智能的辅助。比如以前的市场部工作人员,画一张市场的图或方案需要三天时间。在人工智能的帮助下,现在只需要10分钟就能搞定。在这样的情况下,这名工作人员除了市场部的工作,还有余力做一些其他方面的工作,这对于提升整体的工作效率大有裨益。
人工智能的发展趋势和瓶颈
在我看来,人工智能未来可能有三种发展趋势:
通用人工智能(AGI)。如果通用人工智能做到像大语言模型一样,代替人类思考,做所有的事,这可能是人类的终极目标。这一点能否实现,我认为还是个未知数。
可解释人工智能(XAI)。人工智能帮忙做的决定,能否让人信服这就是最好的决定?从算法角度看,人工智能通过神经网络式的思考方法得出的结果,永远只能是局部最优。人工智能是否可以给出一个最优答案,或者说是在人类可接受范围内的最优答案,目前看还没有哪个可解释人工智能做得到。
边缘人工智能(Edge AI)。边缘计算通常是算好大模型再部署到本地,这项工作涉及到数据安全性的很多方面。通常情况下,本地算力有限,比如国内通用算力可能只有10T。这样的条件下如何解决问题?把大模型缩小到本地算力能够离线处理的程度,然后再让人工智能帮助解决,我认为这是一个思考方向。然而就目前情况看,缩小大模型是一件相当有难度的事。
人工智能发展目前存在一些瓶颈:
第一个瓶颈是如何提升算力。当前主流的芯片是7纳米,3纳米芯片的技术也已经被突破,但1纳米是一个物理极限,大概率是不可能突破的。有一种观点认为,量子计算机在理论上或许能帮助我们把算力提高100倍、1000倍。如果这成为现实,或许会帮助我们得到新的解决方案。
第二个瓶颈是数据和数据质量。数据是海量的,但数据的质量参差不齐。比如在网上使用某关键词进行搜索,有的搜索引擎可以搜到很多结果,有的则搜到很少,然而数量较少的这部分数据不一定权重低、用处少。因此在通用大模型里,数据的数量和数据的质量是一个重要问题。
人工智能对就业市场的影响
美国关于自动化和人工智能对人工替代的一些研究,研究对象主要是男性。可以看出,一开始人工智能对男性就业没有带来影响,随着时间的推移,男性就业受的影响逐渐增大。我个人的理解是,人工智能发展的前期,无法被人工智能替代的主要是一些体力工作,所以男性就业受影响较小。到了人工智能发展后期,无法被替代的工作是与情感关系密切的工种,女性从事这一类工作比男性更有优势,因此男性就业,特别是年轻男性的就业受到很大影响。到2037年,年轻男性的工作机会可能会减少很多。这只是一项预测,真实性还有待检验。
具体而言,人工智能对就业市场可能有如下影响:
第一,很多细分行业的入行门槛会降低,行业经验的权重急剧下降。
比如,40年前做生意很简单,只要胆子大就能有收获。20年前做生意也不难,去工业展看一看,有什么细分行业的产品卖得贵,只要自己能做就能把这个行业吃下来。现在做生意能做什么?我认为还是细分行业。现在的生意人需要选择一类利润足够高的细分行业,通过AI获取行业需求,以及自己有能力输出什么。简单说,就是让AI计算来替代多年行业经验,把这些细节都搞清楚、算明白后,再进入这一行。原来的生意人可能还需要清楚行业里的每一个细节,每一个步骤的具体做法,现在这部分工作也可由AI完成。比如纺织行业的布料分类,原先的从业者需要区分很多种花纹、颜色、工艺都不相同的布料。在AI的帮助下,这项工作已经变得非常简单,只需要拍照交给AI识别,就能区别不同的布料。
第二,基础工作效率提高,行业平均薪资降低,一人多岗现象变得普遍。
在AI的帮助下,原先需要市场部、人事部加在一起才能完成的工作,现在可能只需要一个人就能完成。对企业而言,这些事务性的工作并非至关重要,所以交给AI工具来完成,企业也是乐见其成。
第三,降低了大部分工作人员的技能要求。
以前企业在招聘软件硬件工程师时,更青睐那些拥有三年或以上工作经验的求职者。现在的企业则最喜欢应届毕业生和拥有20年以上工作经验的人。应届生容易接受新事物,更接受使用AI工具来写代码,搭好基础架构,可能连C语言、C++代码都不需要会,也能胜任工作。
人工智能对未来的影响
第一,人工智能从技术上取代大部分人工成为可能。如果人工智能可以完全操控机器人,那么人工智能从技术上取代大部分人工将成为可能。这一点能否真的实现,一定程度上也取决于商业上的考量和投入产出比。比如现在3C行业“拧螺丝”这个工种,因为对技术要求不高,目前看被人工智能取代的可能性不大。未来是否会由人工智能来完成拧螺丝的工作?从技术上来说可行,能否真的实现则是个未知数。
第二,对高精度机械结构的需求更常见。人工智能拧螺丝,这项工作对机械的精度要求很高。如果由人工智能机器人从事这项工作,可能会增加设备的维护和回收成本。一条产线每年的维护费用可能是前期投入的10%-15%。即便是自动化产线,也需要随时维修检修,由此带来的相关费用也不会是小数目。
第三,随着人工智能的普及,芯片需求会增加。芯片产业或将迎来大发展。目前英伟达已经占据芯片的主导市场,所有的模型和算法都是基于英伟达芯片进行展开并优化。我国现在也研发出了4纳米的芯片,与英伟达的主流芯片相同。我们的芯片与英伟达架构不同,所有的模型和算法都需要根据新的架构重新适配。这件事能否得到商业上的认可,这一点仍未可知。
第四,人工智能的普及会使能源需求增加。除了芯片,算力的另一大需求是用电。未来电能的需求一定会增加,用电、储能的需求也会随之出现增长。
第五,如果人工智能得到普及,每家企业都会用上AI工具,那么AI工具哪家强?该如何筛选确定?使用AI工具的初衷是思考快人一步,倘若人人都用AI,又该如何凸显自己的优势?这些问题值得深思。
第六,大模型需要很多芯片,前期需要很大的投入。我个人认为,未来这个行业寡头化的趋势会比较明显。现在有三五家涉足这个领域,但未来可能只剩一到两家。这些大公司推出大模型工具后,也提供NO Code的AI平台,对使用者而言,继续使用同一家公司的计算平台是成本最低的选择。
第七,行业技术公司应用化的趋势也会更加明显。这些公司大都从事本地部署和本地服务业务,但最基础的大模型还是由大公司提供。到那时候,算法工程师已经不再吃香,能与客户沟通并精准把握客户需求的应用工程师,其职业前景会更加明朗。
从长远发展来看,人类相比于AI的优势是人类拥有情感、直觉、伦理和灵活性。
现在AI模型用的神经网络,给出的解决方案是局部最优方案。倘若人类通过获取足够多的信息,也能给出局部最优方案,AI的优势将体现在哪里?这个问题值得我们思考。
就目前情况看,AI很难替代与情感方面有关的工作。比如AI机器人服务员,它可能只会毫无感情地上菜。人类服务员则可能与顾客沟通,向顾客推荐招牌菜。这两种服务带来的体验完全不同,长久来看,也会使客户粘性降低。
从某种程度上看,我们输入更多维的数据,有可能得到更好的解决方案。然而从唯物主义的角度而言,解决方案的好与坏,其实是依靠我们自己来判断的。
伦理方面。网上的数据多元多样,其中充斥着很多错误观点。如果不进行数据筛选、数据质量的整理,我们得到的解决方案中可能就存在错误。这就和谷歌以前开发的人脸识别软件把非洲裔美国人识别成大猩猩是同样道理。最可怕的情况是,到最后即便出现了错误我们也不知道错在哪里。随着海量数据积累得越来越多,若真的出现伦理问题,人类又该怎么办?
灵活性方面。遇到问题问AI,但很多时候大数据提供的答案非常类似。我想这个世界需要多样性,大家不一定会喜欢高度类似的答案。如果让AI生成一幅关于向日葵的图画,它给出的如果跟梵高的《向日葵》类似,这可能并不是我们想要的答案。再比如虚拟偶像的交互游戏十年前就已出现,但到今天也没有发展壮大,这说明大家还是喜欢真人互动,最终还是要落实到满足真实的情感需求这个层面。
因此,我对AI的期望是能够帮助我们减少工作量,帮助我们完成大部分工作。至于满足更多的心理层面的需求,这个任务就交给人类自己来完成。