本报讯(记者武晓莉)索尼公司日前宣布其“神经网络库”(Neural Network Libraries)现以开放源代码的形式供公众使用,该库可作为开发人工智能深度学习程序的框架。软件工程师和设计师现在能充分利用这些免费的核心库,用于研发深度学习程序并将其融入到产品或服务中。转为开放源代码也是为了让研发队伍能在现有核心库程序的基础上更进一步。
深度学习是指一种使用模拟人脑的神经网络的机器学习形式。通过转向基于深度学习的机器学习,过去几年,图像和语音识别技术飞速发展,甚至在某些领域已超越人类。与传统形式的机器学习相比,尤其值得关注的是深度学习的多功能性,除了图像和语音识别之外,还应用于包括机器翻译、信号处理和机器人等各种领域。
神经网络设计工作对深度学习程序的开发至关重要。程序员可构建最适合手头任务的神经网络,例如图像或语音识别,并通过一系列的试验优化网络性能后,将其加载到产品或服务中。索尼核心库(操作模块组)中包含的软件有效地促进了上述所有的开发过程,并融合了以下用于深度学习研发的必要元素。
多用途执行环境
索尼核心库中的软件主要用C++11编写,它是一种在各种环境(包括图形处理器GPU在内的操作系统和硬件)中运行的编程语言,可在Linux,Windows以及其它众多平台上运行。
高效的研发环境
除了C++核心库,索尼还提供一层Python接口功能。Python是用于深度学习开发的主流编程语言,可实现轻松的原型开发和高效开发。因为它支持直观的、具有较少代码行的神经网络设计,所以能让开发人员专注于创建神经网络,同时发展能更高效、更省时和更节约成本使用深度学习的技术。
多功能性
它们既灵活又富有表现力,可跟上不断创新的深度学习领域的最新进展,同时也可应付神经网络的动态性。
高速运行
索尼的核心库与英伟达的GPU兼容,能以可达到的最快速度进行神经网络学习并执行,为深度学习所支持的技术研发创造条件,迭代时间更短。
易于修改
此外,在深入学习的前沿领域,视需要开发和添加新功能会十分简单。例如,添加优化器模组以及作为神经网络构成元素的功能模块就很简单。
简单的硬件移植
核心库的构建考虑了向新硬件移植的问题,所以能够实现向智能手机和物联网设备等硬件的简单转移。
据悉,索尼的研发平台和系统研发团队一直将这些核心库作为涉及深度学习的产品和服务开发的基础。这些包括AR Effect,一个智能增强现实应用程序,用于XperiaTM智能手机系列的拍照功能;以及Lifelog,一个使用动作识别技术的活动追踪小程序;还有Price Estimation Engine(价格估算引擎),在买卖房地产时能提供高度准确的合约价格估算。
这项政策是索尼人工智能环境优化倡议的一部分。我们需要更多的商品和服务使用人工智能提供更高的便利水平,索尼也正在使其核心库变为开放源代码,希望更多的开发人员和研究人员能够本着为社会做贡献的目的,在其已有程序的基础上更进一步。