手势识别是一个理解和解释手、臂姿态的运动,是一个复杂的科学与工程交汇的技术领域。可以让使用者在不穿戴任何辅助设备的前提下,以简单、自然、便捷的方式与电子设备交互,目前主要应用于人机交互研发、人机界面设计领域,因其在人机交互应用中不断展现出的潜力,近年来逐步受到人们的关注。
不难发现,手势识别加微动技术将是未来人机交互的发展趋势。微动采用多角度成像深度技术,其原理是将不同角度的固定摄像头得到的图像或视频流进行比对,根据摄像头的角度偏差和图像之间的差值,计算出目标物体到摄像头中心的距离。对此,作为在机器视觉、模式识别、嵌入式系统领域有深层次积累锋时互动科技,在手势识别技术的研究和应用方向上有独到的造诣。
锋时互动科技联合创始人张硕表示,现在常见的人机交互是语音识别,其实还有手势识别这个技术,它归类于一个体感技术,主要依靠于后续精度的大量提高,像宝马7系和今年下半年的奥迪V8,在交互方面都采用了手势识别。手势跟语音一样,只是一种交互的方式,并表示希望打通语音和体感两种交互方式的隔阂,因为体感可能受到光线的影响,语音可能会有噪音,包括车内环境的影响,当两种技术相结合,能不能产生出新的交互方式,更贴近自然的方式,这是未来追寻的目标。
三个层面 看清微动手势识别
锋时互动旗下的微动系列手势识别产品及解决方案,采用基于视觉的手势识别技术,不需要使用者穿戴任何辅助设备。通过内置在产品当中的两个定制光路摄像头采集手部图像信息,通过算法可以判断出手部的不同姿态信息和不同手指的三维位置信息及其运动轨迹,再将之对应到相应的控制命令之上。主要有两大特色:
其一,硬件层面。拥有独立的图形图像处理芯片,核心算法不依赖于系统的硬件实现;
其二,软件层面。拥有中间件架构,用以连接硬件设备和软件应用程序,为在各种硬件平台上开发的手势识别应用提供标准的数据接口。
因此,微动可支持多种硬件平台和操作系统,具有很强的灵活性和可扩展性。
为了满足特殊行业客户的需求,微动手势识别解决方案中也包含定制化服务,让手势交互渗透到更多的领域当中。微动手势识别解决方案包含三个层面:传感器模组、中间件、应用。
传感器模组:是摄像头传感器与图形图像处理器的统称,用以采集手部图像数据并进行高并发图形图像算法处理;
中间件:负责屏蔽不同系统之间的差异,当前中间件可运行在Windows\Win CE\Android\Qnx\Linux\其他类型嵌入式系统之上,并在中间件中加入高级动作指令算法,完成动作指令拾取、运动轨迹检测等功能;
应用:VR游戏、车载电子、医疗等业务程序逻辑。
传感器模组通过采集手部图像数据进行高并发图形图像处理后,将数据信息以帧为单位传递给中间件,在中间件层面,用户可根据需求选择不同的硬件实现和不同类型的操作系统。根据实际手势需求,忽略与系统能共不相干的手势,通过中间件可实现对于应用逻辑的数据驱动和事件驱动两种程序设计方法。当应用得到中间件发出的事件后,应立即在界面UI上,给予使用者相应的反馈并执行相应的业务逻辑。三个层面之间的逻辑关系如下图所示:
解决方案的效果是需要被实际的应用来衡量,目的是为了让用户简单、高效的将自然的手势识别交互应用到其现有的虚拟现实游戏、车载电子或消费级电子产品当中。
强化产品 增强车载交互体验
首先,将微动手势识别解决方案包含在用户的车载信息系统当中,考虑到车载电子采用安卓Android系统,所以选择Android版本中间件连接手势识别传感器模组和客户应用,包含微动手势识别解决方案后的用户系统体系结构。如下图所示:
其次,设计师将微动手势识别解决方案中现有的手势库中的动作指令与用户应用功能进行匹配。
最后,通过与软件工程师沟通,中间件采用事件回调的方式触发应用的功能。即当使用者做出与动作设计相匹配的动作指令时,中间件调用现有的功能程序逻辑,完成操作。
微动手势识别解决方案拥有完善的动作指令级、中间件可跨平台并提供高级别的API接口,让用户的软件工程师轻松、迅速地完成现有应用功能与手势交互的对接。整体研发过程中,手势识别解决方案的体系结构虽完全包含在系统体系当中,但又是非紧密耦合的,保持着相对的独立性。
除了满足移动位置的基本需求外,人们开始追求更舒适的驾驶感受和更多的娱乐体验,诸如车内空调、导航、车载电话、音乐系统。微动推出的手势控制技术,可以让驾驶员坐在车中,只需通过简单的手、臂动作,就能完成对车内信息的调节和控制。
在手势识别领域中,手部特征数据可通过数据手套或摄像头采集,采集的数据通过算法处理后,转化为应用软件或硬件设备的输入信息。微动手势识别解决方案的目标是帮助用户快速、高效地开发出基于视觉采集的手势识别应用,提供标准的手势识别传感器模组以及手势动作设计、界面UI设计、委托开发等服务,降低应用研发周期和成本,让用户更专注于自身业务流程的研发。