谷歌为安卓和Chrome推出全新AI和无障碍功能

2025年05月16日由佚名发表 672 0

谷歌宣布周四宣布，它正在为安卓和Chrome推出全新的AI和无障碍功能。最引人注目的是，安卓的屏幕阅读器TalkBack现在允许用户询问Gemini关于图像和屏幕内容的详细信息。

去年，谷歌将Gemini的功能引入TalkBack为盲人或视力障碍者提供AI生成的图像描述，即使图像没有Alt文本。现在，用户可以就图像提出问题并获得答案。

例如，如果朋友给你发了一张他们新吉他的照片，你可以获得它的描述，并询问品牌和颜色。此外，你现在可以获得整个手机屏幕的描述并提问。因此，如果你在应用中购物，你可以询问Gemini关于你感兴趣物品的材质或是否有折扣。

谷歌今天还宣布，它正在更新Expressive Captions，安卓的实时字幕功能，使用AI捕捉人们说话的内容及其表达方式。

谷歌表示，它意识到人们表达自己的方式之一是通过拖长词语的声音，这就是为什么它在Expressive Captions上开发了一个新的持续时间功能。现在，你会知道体育解说员是在喊“太棒了的射门”还是有人不仅仅在说“不”，而是“不要”。你还会开始看到新的声音标签，比如有人在吹口哨或清嗓子。

该更新正在美国、英国、加拿大和澳大利亚的安卓15及以上设备上推出。

谷歌还简化了在Chrome上访问PDF的过程。此前，你无法在桌面Chrome浏览器中使用屏幕阅读器与扫描的PDF互动。现在，Chrome会自动识别这些类型的PDF，允许你像其他页面一样突出显示、复制和搜索文本，并使用屏幕阅读器阅读它们。这得益于光学字符识别（OCR）的引入，谷歌表示。

此外，安卓上的Chrome页面缩放现在允许你在不影响网页布局的情况下增加看到的文本大小。你可以自定义放大比例，然后选择将偏好应用于你访问的所有页面，或仅某些页面。你可以通过点击Chrome右上角的三点菜单访问此功能。

文章来源：https://techcrunch.com/2025/05/15/google-rolls-out-new-ai-and-accessibility-features-to-android-and-chrome/

标签：

谷歌

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇 OpenAI在ChatGPT中推出GPT-4.1模型，提升编码速度和指令跟随智能

下一篇 Sam Altman希望ChatGPT的目标能记住“你的一生”

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

Meta Muse Spark 1.1：百万上下文瞄准多智能体

Grok 4.5登场：编码与长程智能体再升级

openwebtext glue shunk031/JGLUE piqa wikitext sciq EleutherAI/lambada_openai facebook/flores

AI热点

行业学习机器学习人工智能公司板人工智能未来机器人视觉识别

AI工具

更多工具 »

火山写作

字节跳动旗下团队推出的免费AI英语写作助手

Stable Diffusion

StabilityAI推出的文本到图像生成AI

GitHub Copilot

GitHub AI编程工具

Adobe Firefly

Adobe最新推出的AI图片生成工具

文心一格

AI艺术和创意辅助平台

OpenAI首款推理芯片亮相，年底开始部署

本周热门

热门企业

热门职位

Maluuba

20000~40000/月

Unity技术经理

Cisco

25000~30000/月深圳市

高级数据分析工程师

PilotAILabs

30000~60000/年深圳市

OpenAI GPT-Live：实时语音模型再升级