谷歌宣布周四宣布,它正在为安卓和Chrome推出全新的AI和无障碍功能。最引人注目的是,安卓的屏幕阅读器TalkBack现在允许用户询问Gemini关于图像和屏幕内容的详细信息。
去年,谷歌将Gemini的功能引入TalkBack为盲人或视力障碍者提供AI生成的图像描述,即使图像没有Alt文本。现在,用户可以就图像提出问题并获得答案。
例如,如果朋友给你发了一张他们新吉他的照片,你可以获得它的描述,并询问品牌和颜色。此外,你现在可以获得整个手机屏幕的描述并提问。因此,如果你在应用中购物,你可以询问Gemini关于你感兴趣物品的材质或是否有折扣。
谷歌今天还宣布,它正在更新Expressive Captions,安卓的实时字幕功能,使用AI捕捉人们说话的内容及其表达方式。
谷歌表示,它意识到人们表达自己的方式之一是通过拖长词语的声音,这就是为什么它在Expressive Captions上开发了一个新的持续时间功能。现在,你会知道体育解说员是在喊“太棒了的射门”还是有人不仅仅在说“不”,而是“不要”。你还会开始看到新的声音标签,比如有人在吹口哨或清嗓子。
该更新正在美国、英国、加拿大和澳大利亚的安卓15及以上设备上推出。
谷歌还简化了在Chrome上访问PDF的过程。此前,你无法在桌面Chrome浏览器中使用屏幕阅读器与扫描的PDF互动。现在,Chrome会自动识别这些类型的PDF,允许你像其他页面一样突出显示、复制和搜索文本,并使用屏幕阅读器阅读它们。这得益于光学字符识别(OCR)的引入,谷歌表示。
此外,安卓上的Chrome页面缩放现在允许你在不影响网页布局的情况下增加看到的文本大小。你可以自定义放大比例,然后选择将偏好应用于你访问的所有页面,或仅某些页面。你可以通过点击Chrome右上角的三点菜单访问此功能。