任泽平称智能化是新基建发展趋势( 三 )


2.2 基础科研:美国最强,中国快速追赶
中国人工智能领域论文数量增长较快,但论文质量与美国依然存在差距 。全球累计共发布人工智能论文超70万篇,中国、美国是论文发表大国,2018年中美两国分别发布论文2.5万篇和1.6万篇,全球合计占比46.5% 。从增长趋势来看,美国保持匀速增长,中国自2014年后增长较快,中国论文数量占全球总量比重从1998年的8.9%上升为2018年的28.2% 。从代表论文质量的FWCI指数(平均加权引用影响指数)来看,中国论文质量也在稳步提升,从1998年的0.43提升至2018年的1.39 。美国保持全球最高水平,长年保持在2左右,2018年FWCI指数达2.38 。
FWCI指数:FWCI标准化为1,当某国或机构的FWCI指数为1时,表明该国或机构的引用影响力在世界平均水平 。如果某国或机构的FWCI指数为1.2,表明该国或机构论文被引用次数超出世界平均水平20% 。如果某国或机构的FWCI指数为0.8,表明该国或机构论文被引用次数低于世界平均水平20% 。

任泽平称智能化是新基建发展趋势

文章插图

任泽平称智能化是新基建发展趋势

文章插图
从论文发表机构类型来看,包括中国、美国、欧盟27国等在内的各国和地区均以高校为核心科研力量,2018年三者高校论文产出占各自总产出的92.1%、84.6%、90.7% 。除高校外,中美两国的主力科研主体有所不同,2018年中国科研机构产出约为中国企业产出的3倍,而同期美国企业产出约为美国科研机构产出的1.6倍 。
任泽平称智能化是新基建发展趋势

文章插图

任泽平称智能化是新基建发展趋势

文章插图
2.3 数据量:人工智能时代的“原材料”,中国具有规模优势
电脑和智能手机的普及、互联网和移动互联网所累积的数据爆发,是促进人工智能技术和应用突破的重要原因之一 。人工智能需要做到“感知、思考、决策”,首先就是需要足够多、足够好的原始数据对计算机进行训练,犹如培育良驹,得喂足新鲜的牧草 。“足够多”代表数据的数量要大,电脑的发明让运算简化,并让信息以电子化形式保存,智能手机的普及让全球网民渗透大幅提高,两者令大量的数据被保存 。“足够好”代表数据的质量要佳,互联网的诞生极大地缩短信息交流的物理距离、提高传播速度,各类互联网类服务应用诞生,其产生的数据类型也更加多样,包括浏览网页喜好、外卖点单频率、行程记录等,多元丰富的数据才能应对各种训练人工智能的要求 。
数据增长和运用依赖于信息和物理的基础设施构建,中国将成为全球最大的数据中心 。得益于人口数量、互联网渗透率、智能手机渗透率、网速等,2018年中国拥有数据量7.6ZB,占全球数据总量的23.4% 。随着5G、物联网等发展,通讯设备接入数量和承载能力提高,终端消费者增多,中国的数据量将在2025年达48.6ZB,占全球数据总量的27.8%,成为全球最大的数据集中地,将极大的促进和丰富人工智能训练,相关模型结构和结果也更精准 。
任泽平称智能化是新基建发展趋势

文章插图

任泽平称智能化是新基建发展趋势

文章插图
2.4 技术:深度学习推动本次人工智能热潮
足够多、足够好的数据支撑人工智能“感知”阶段,而人工智能算法使计算机拥有思维,从而达到“理解、决策”,深度学习在这过程作出巨大贡献 。深度学习是一类模式分析方法的统称,计算机通过学习样本数据来掌握内在逻辑和规律,从而拥有分析能力,这项研究最早可以追溯到1958年弗兰克·罗森布拉特发明的感知机(Perceptron) 。利用感知机,可以进行图像区分训练,例如最常见的从水果堆中选出“苹果”或者“香蕉” 。然而当时缺少足量的数据,该项研究陷入瓶颈,并出现过度拟合(Overfitting)问题,例如学生希望通过练习相似的题目来掌握一种题型,但是训练量不够大、并没有理解题型背后的知识点,考试一旦发生些许变化便无法解出答案 。后来,科学家通过研究人脑,试图模仿人脑神经网络机制来进行图像、声音等分类工作,逐渐演化成如今的深度学习 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。