关键词:人工智能、AI、遥感应用、文本识别、空间大脑、遥感智能解译
从本篇开始,将进入第四个技术专题:AI技术系列。由于AI技术领域较为广泛,本专题将重点聚焦数慧遥感智能解译框架、AI+遥感应用案例分享以及语音识别、文本识别等相关AI技术及应用的分享。
随着人工智能技术的不断兴起,数慧也积极与华为等大厂以及武汉大学等高校开展产学研合作,也取得了初步成果。人工智能主要划分为两大类:弱人工智能(Artificial Narrow Intelligence,ANI)与强人工智能(Artificial General Super Intelligence,AGI);弱人工智能只能完成单一、特定的任务,而强人工智能可以在各方面与人类的技能相类似。
在自然资源行业,各地也相继围绕AI+空间技术建设各类“大脑”类平台应用,如:空间大脑、自然资源大脑等。整体框架如下:
其中,AI关键领域技术主要包括三大类:智能语音技术(语音识别、语音合成、声纹识别、语音评测等)、自然语言处理(文本分类、信息抽取、情感分析、机器翻译等)、计算机视觉(图像分类、目标检测、目标跟踪、图像分割等)。
遥感影像数据处理技术
目前遥感影像数据处理技术,主要两大方向:一是偏数据管理方面,也就是大数据方向;二是智能化解译方面,也就是偏人工智能方向。
▷遥感数据管理:
遥感数据,通常数据量比较大,数据种类超过20多种,数据集160多个,对数据的处理计算、存储要求都比较高,遥感大数据技术一般包括以遥感数据为主的多种数据的收集、处理、存储、分发等方面,主要解决获取数据困难、多种不同数据处理繁琐、存储算力要求比较高的问题,关键技术是自动化并行高效的数据处理计算技术,目前大多采用对图形算子进行封装,采用可视化图形配置构建、分布式多任务并行处理计算,提供类似Python等开发环境进行二次扩展开发。
▷遥感智能解译:
遥感数据受气象、地形等成像条件的影响,易造成数据缺失,给目标模型的解译精度、泛化能力带来很大的挑战。需要对包含任意数量波段的数据以及多时相数据进行影像配准、影像去雾、辐射校正、光谱降维等数据预处理,提供目标检测、场景分类、变化检测等智能解译任务模型。
数慧AI+遥感智能解译总体架构
结合自然资源行业应用需求,基于华为AI平台、开源深度学习技术、遥感影像数据处理等技术,数慧公司搭建了一套面向自然资源行业应用的AI+遥感智能解译框架,总体架构如下图所示:
-数慧AI+遥感智能解译总体架构-
在总体架构中,华为AI平台主要提供基础算力、基础模型及基础算法等能力。深度学习框架提供模拟人脑进行分析学习的神经网络,并提供模仿人脑的机制来解释数据,认识数据的能力;同时提供可视化配置管理工具,方便对影像数据处理、模型训练调试、应用效果展示等;另外支持REST服务、Python/C++接口,方便扩展定制和现有系统的集成应用;同时,平台支持空间数据和非空间数据的训练学习,并在最新学习模型的基础上,对模型进行不断调整优化,直至满足应用需求。
业务应用层中主要是利用数慧AI+遥感智能解译框架,结合行业应用场景,赋能业务应用,如:地理实体提取、变化监测、语义识别等。