大数据智能是以人工智能手段对大数据进行深入分析,探析其隐含模式和规律的智能形态,实现从大数据到知识、进而决策的理论方法和支撑技术,大数据智能将建立可解释通用人工智能模型,实现“大数据+人工智能”的方法论。
规划中明确指出,在有望引领人工智能技术升级的基础理论方面,大数据智能要重点突破无监督学习、综合深度推理等难点问题,建立数据驱动、以自然语言理解为核心的认知计算模型;在建立新一代人工智能关键共性技术体系方面,大数据智能要构建知识计算引擎和提供知识创新服务,形成开放兼容、稳定成熟的知识加工、深度搜索和可视交互核心技术;在布局人工智能创新平台,强化对人工智能研发应用的基础支撑方面,要建立大数据人工智能开源软件基础平台、终端与云端协同的人工智能云服务平台、新型多元智能传感器件与集成平台、基于人工智能硬件的新产品设计平台、未来网络中的大数据智能化服务平台等。
一、从数据到知识、从知识到决策是当前大数据智能的计算范式。
如果说人工智能是经济发展的新引擎,正在重构生产、分配、交换、消费等经济活动各环节,那么大数据就是这个引擎的燃料。大数据与人工智能有机结合,则是发动这个引擎的金钥匙。传统人工智能基于专家手工构造的知识库来进行学习推理,如专家系统。由于难以构造较为全面的人类常识知识库,以及还存在不确定性知识,因此,依赖于知识库的人工智能方法在提升学习推理方法性能方面遇到了难以跨越的鸿沟。
与基于规则、逻辑和知识的推理学习方法不同,机器学习方法从大数据出发,去洞悉海量数据中隐藏的规律和模式,如从网购商品中自动挖掘用户消费偏好和从用户检索词条中洞悉文化概念的演化变迁等。
更进一步,随着互联网的普及、传感网的渗透、大数据的涌现、信息社区的崛起,数据和信息在人类社会、物理空间和信息空间(Cyber-Physical–Human,简称CPH)——之间的交叉融合与相互作用,人类社会与信息世界和物理世界所产生数据在个体/群体所呈现的前所未有广度和深度的交互行为中正在进一步深度耦合。CPH深度融合推动了文本、图像、位置和视频等海量数据涌现,使得隐藏在这些海量数据中的知识呈现不确定、复杂性和多样性。
大数据刻画了个人/群体的生活、工作和学习规律和模式,为了洞悉这些隐性知识,迫切需要建立从大数据到知识的一般性手段和方法,其具有从文本、图像和视频等大数据中永不停息学习规则、模式和知识的能力,助力决策者从大量非结构化数据中揭示非凡的洞察。同时,要具备提供知识云计算服务的能力,通过知识服务打破数据藩篱,推动多领域数据的融合碰撞,让数据畅通流动从而发挥巨大效益。
当前,大数据智能正从传统“以规则教”的学习推理方法,到数据驱动的知识挖掘方法,迈向数据驱动和知识引导相结合的新时代,推动人工智能从表象和特征深入到综合推理。
二、知识创新服务与决策支持是大数据智能释放“智能红利”的关键
将通过知识计算获得的知识,应用到实际的生产生活中,转换为相应的能力来解决我国社会经济发展中的资源、环境等社会问题、参与公共事务决策、发现社会发展规律,同时支撑新产业和新业态的跨界深度融合和创新服务,促进社会生产力的再次飞跃,是大数据智能释放出“智能红利”的关键。
大数据智能具有极其广泛的应用,如在医药卫生方面的药效分析与新药研制、病例分析与预测、基因检测和健康保险智能化管理等;在工业方面的新材料的模拟与预测、产品的智能化设计、智能物流以及宏观经济预测和调控智能化等;在科教方面的智能图书馆和知识服务系统、知识交叉创新等;在城市建设与管理方面的城市运行模拟与预测、环境智能分析与改善决策、智能交通、人口资源综合分析以及城市经济结构调整的智能辅助等等。