问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

研究人员为视障人士设计的声控人工智能背包

创作时间:
作者:
@小白创作中心

研究人员为视障人士设计的声控人工智能背包

引用
1
来源
1.
https://m.xianjichina.com/special/detail_478080.html

对于视障人士来说,在日常生活中,尤其是在公共场所,导航可能是一个持续而深刻的挑战。这使得我们许多人认为理所当然的普通任务也变得非常困难。据世界卫生组织(WHO)估计,全球有2.85亿视障人士,这种困难是一个需要解决的主要问题。

值得庆幸的是,乔治亚大学的研究员Jagadish Mahendran和他的团队设计了一款创新的新型背包,可以帮助视障人士更好地感知周围环境。

Mahendran的灵感来自于与一位视障朋友的会面,并讨论了他们面临的挑战。他开发了一个系统,可以检测交通灯、十字路口、移动物体、变化的海拔等障碍物。

这套导航系统由一个装着轻量级电脑装置和GPS的背包、一个装有4K摄像头的背心外套和一个腰包组成,腰包里藏着一块能够为系统供电8小时的小电池。

为了构建该系统,Mahendran--一位人工智能设计师--使用了OpenCV的深度人工智能套件(OAK-D),该套件由英特尔提供技术支持。

Mahendran表示:"当我和一位视障朋友见面时,我感到很讽刺,虽然我一直在教机器人看东西,但有很多人看不见,需要帮助。这促使我建立了视觉辅助系统。"

Mahendran和他的团队的系统赢得了2020年OpenCV空间人工智能竞赛,并在intel发布的案例研究中详细介绍。

有深度的导航系统

Mahendran的系统并不是第一个旨在帮助视障人士导航的设备。其他的选择确实存在,包括GPS和语音激活的智能手机应用程序,配备摄像头的手杖,甚至是导盲犬。然而,所有这些系统对视障人士的帮助都相当有限,尤其是摄像系统缺乏深度感知。

Mahendran的背包导航系统配备了一个支持蓝牙的听筒,允许佩戴者进行语音命令和查询。当系统对这种语音输入做出反应时,它会将用户周围的环境和障碍物的信息反馈给听筒。

深度是系统当然不缺乏的一点。运行在英特尔Movidius VPU和英特尔®分布式OpenVINO™工具包上的尖端人工智能形成了一个先进的神经网络,并处理来自背心安装的Luxonis OAK-D空间人工智能相机的信息流。这使得它能够提供先进的计算机视觉、实时深度图和色彩信息。

该系统能够为视障人士提供以下帮助:

  • 允许用户在城市人行道上更安全地行走。
  • 给予佩戴者更好地避开障碍物的信息,如垃圾桶、低垂的树枝和其他行人。
  • 提供有关交通和街道标志的位置信息。
  • 允许用户在人行横道上安全地停车和过马路。
  • 警告佩戴者海拔高度的变化,例如从路边上到下的台阶。
  • 指示系统执行动作,如描述当前场景。

Mahendran进一步解释说:"当用户在环境中移动时,系统会以声音传达常见障碍物的信息,包括标志、树枝和行人。它还会对即将到来的十字路口、路边、楼梯和入口处发出警告。"

研究人员甚至更进一步,描述了一个典型的用户在佩戴他的系统时,在正常的日常旅程中会有什么体验。例如,如果用户走在人行道上,正在接近垃圾桶,系统可以发出 "左边"、"右边 "或 "中间 "的口头警告,说明垃圾桶的相对位置。当用户接近一个拐角时,系统会通过说 "停止标志 "或 "启用人行横道",或两者兼而有之来描述前方的情况。

团队的下一步计划

一个名为Mira的团队已经成立,这是一群来自不同背景的志愿者,包括视障人士。这个项目正在成长,其使命是免费提供一个基于人工智能的开源视觉辅助系统。目前,该团队正在为其初始阶段的测试筹集资金。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号