开着汽车,双眼盯着路面,却还能同时使用手机,这是谷歌的盲人科学家正在为你做的事。
Ranman认为,“在我的日常生活和工作当中,绝大多数人已不再意识到我是个盲人”。
一位叫做T·V·Raman的盲人科学家正在着手解决这个问题。他的智能触屏手机能让耳朵来帮他“看”手机:当Raman的手指在手机上划过,手机会用语音提示“地图”、“浏览器”或“电话本”等选项;用手机上网时,手机会读出当前网页的内容;打开地图,随着手指在地图上移动,地图会清晰地报出街道的名称,并告诉Raman这个街道是在他的什么方向,距离多远。当Raman走过一些街道,地图会“告诉”他刚才经过的是哪儿。
“我的思路不是假如人看不见怎么办,而是假如人们没法看屏幕时该怎么办。”Raman说。他现在是Google的工程师,他在手机上研发的这项技术叫做Text To Speech(文本转换到语音,简称 TTS);他所在的研发小组叫做解放双眼小组(Eyes Free Team),这个小组设定的场景是,总有一些时候,人们是没法看手机的,例如开车时。
Raman所有的研发都围绕如何让智能设备弥补视力缺陷。他14岁时因青光眼而丧失视力,后来依靠志愿者帮他朗读教材读完了大学。1989年,他来到美国攻读博士并成为了一名科学家。
“以前信息依赖于物质介质,而现在信息以比特的形式存在,并且可以转换成不同形式表达出来。”Raman说。
他最开始所期望的是,这些比特能直接变成声音,好让计算机替代那些为他读书的志愿者。因此他最初的一项开发是一款能够帮他读出各种复杂内容的读屏软件。
这一开发的难度在于,人们总是在用大小写、粗体斜体、标点、段落来表达不同的含义,Raman需要让计算机理解这些含义,并通过语音的方式表现出来。你知道如何读吗?就是这个意思。文本转换成语音要比我们这些视力健全的人所能想象的更为复杂。
Raman在他的博士论文中解决了这个问题,并把他发明的这款软件以他的第一只导盲犬AsTeR来命名—这是他在网络世界的导盲犬,当然,AsTeR也可以是Audio System For Technical Readings(技术类阅读的读屏系统)的缩写。
Raman目前在Google做的研发和AsTeR有很深的渊源。不同的是,现在Raman希望电脑和手机能将程序用语音表达出来。困难是相似的—如何让计算机识别出哪些需要读出来。比方说一封邮件中,需要读出的是正文部分,而不是无关紧要的导航链接。
现在,Raman开发的TTS功能已内置在Android系统中,并向开发者开放API(Application Programming Interface,应用程序编程接口)。第三方开发者可以贡献语音包,例如广东话或普通话;也可利用这一功能进行许多有趣的应用。
当第三方开发者加入进来,这一功能所能运用的场景超出Raman和他同事的想象。除了有聋哑人靠此功能来向服务员大声“说出”他要买个汉堡之外,还有游戏公司在开发的名为“Mad-libs”的手机游戏中加入夸张读出文本的功能,以达到一种更为滑稽可笑的效果。
“我想让很多的设备都有说、听和感知的能力。”Raman说,他觉得手机上的摄像头、GPS和重力感应系统能完成这一切。在未来,他的手机除了告诉他怎么走之外,还能帮他看路标,而这正是他的导盲犬帮他做的事情。
[1] [2] 下一页 |