“你是我的眼”,微软计算机视觉 APP 帮助盲人用手机看世界
本篇文章998字,读完约2分钟
据雷锋说。微软发布了一款基于计算机视觉技术的手机应用“视觉人工智能”,它可以描述视力障碍者周围的世界。
安装该应用后,如果用户将手机摄像头对准某人,它会告诉你这个人是谁以及他的心情(表情)。将手机摄像头对准一个物体,看到人工智能就会知道它是什么。这是通过运行在手机本地的人工智能算法实现的。
看人工智能人脸识别的例子:“一个28岁戴眼镜的女人看起来很开心。”
在去年三月的构建会议上,微软展示了这个应用的原型。今天,它终于发布了。美国的Ios用户可以免费下载。至于看到ai何时登陆安卓并进入中国市场,雷(公开号:雷)还没有收到任何消息。
核心功能作为一款面向残疾人的生活辅助软件,微软设计了视觉人工智能来满足一系列不同的生活场景。例如,如上所述,做面部识别,猜测对方的年龄和情绪。它还可以通过扫描二维码来识别家用物品、阅读和识别文件以及识别美钞。识别钞票的功能是非常实用的功能。所有的美钞大小和颜色都一样。对于一些残疾人来说,区分不同面值的钞票可能非常困难,像“看人工智能”这样的应用可以解决这个问题。
查看人工智能文件识别示例
视觉人工智能的目标识别能力是基于神经网络实现的,其基本原理与自主车辆和无人飞行器没有什么不同。其基本功能在本地实现。这有两个优点:
当网络不稳定时,它仍然可以使用;
反馈速度更快。
然而,看到人工智能的实验功能,如描述整个周围环境和识别手写字符,需要连接到云。
Saqib shaikh,人性化设计的技术领导者,向媒体透露了一个非常有趣的细节:
可视人工智能可以指导用户如何上下左右移动手机摄像头来清楚地看到目标物体。这是一个非常人性化的功能,特别是考虑到有视觉缺陷的残疾用户,他们很难将手机摄像头“指向”一个物体本身。显然,对于人工智能来说,虽然光学物体识别技术是基础,但如果没有这种人性化的功能设计,其实用价值就变得非常模糊。
saqib shaikh
根据saqib shaikh自己的经验(他是盲人),他经常使用视觉人工智能来识别符号和菜单。至于看到人工智能和其他类似应用的区别,他说最大的区别是神经网络的运行速度:
“我们设法在本地运行人脸识别,几微秒内就能听到结果。速度就是一切,我们努力挤出本地所能达到的极限。”
雷锋编的《旅途的边缘》
相关文章:
你是我的眼睛:微软帮助盲人用声音欣赏艺术作品
雷锋文章版权所有。严禁擅自转载。详情请参考转载说明。
标题:“你是我的眼”,微软计算机视觉 APP 帮助盲人用手机看世界
地址:http://www.6st8.com/zbxw/5063.html
免责声明:联合早报中文网从世界各个维度报道世界经济新闻,时政新闻,突发新闻等,本篇的部分内容来自于网络,不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2018@163.com,联合早报中文网的小编将予以删除。