谷歌推出新AI功能,提升Android和Chrome无障碍体验
时间:2025-05-22 13:55
小编:小世评选
近日,谷歌在其官方博客与多家媒体渠道宣布,将为其Android操作系统以及Chrome浏览器推出一系列创新的人工智能和无障碍功能。这些更新旨在优化用户体验,尤其是为有特殊需求的用户群体提供更为便利的服务与操作。此举不仅体现了谷歌在推动科技普及与无障碍设计方面的努力,同时也为不同能力的用户创造了一种更为友好的数字环境。
在Android操作系统中,屏幕阅读器TalkBack再次迎来了重大升级。随着将Gemini人工智能技术整合进TalkBack,谷歌为视力障碍用户带来了更强大的功能。借助AI生成的描述,即使在没有Alt文本的情况下,盲人用户也能够了解图片的内容。此最新更新更进一步,允许用户对图片进行更具体的询问。例如,如果用户收到朋友发送的一张新吉他照片,他们现在可以直接询问吉他的品牌、颜色等细节信息。这为那些可能较少接触视觉内容的用户提供了一条通向信息获取的新途径。
TalkBack的功能扩展至整个手机屏幕,意味着用户在进行应用程序购物时,也能通过Gemini获取更为详尽的信息。例如,用户可以询问某商品的材质、是否有折扣等信息,这样的便利大大提升了购物体验。这项更新充分考虑了用户在购物时的各类需求,帮助他们更加独立、便捷地进行网上购物。
同时,安卓的实时字幕功能Expressive Captions也得到了显著改进。该功能利用先进的人工智能技术,不仅能准确捕捉说话内容,还能区分不同的说话方式。这一改进是基于谷歌意识到,在日常交流中,人们的语调、语速与情感表达会有所不同。例如,人们在激动时的言语表达与平时简短的对话之间的差异,Expressive Captions通过新增的时长功能能够帮助用户更好地理解对话的上下文。这一功能还会在用户吹口哨或清嗓子等场景中,提供音效标签,确保用户在沟通时对对话环境有更全面的感知。此功能将在美国、英国、加拿大和澳大利亚推出,适用于运行Android 15及更高版本的设备。
在Chrome浏览器方面,谷歌同样进行了一系列便利性提升。新的更新简化了用户与PDF文档的交互体验。在过去,用户在桌面版本的Chrome浏览器中无法使用屏幕阅读器处理扫描的PDF文档,而通过引入光学字符识别(OCR)技术,Chrome现在可以自动识别这类文档,用户可以像浏览普通网页一样,对文本进行高亮显示、复制和搜索。屏幕阅读器也可以朗读这些内容,这极大地提高了用户处理扫描PDF文档的能力,充分考虑了需要无障碍访问的用户群体的需求。
安卓版Chrome浏览器的页面缩放功能得到了进一步的优化。用户现在可以自主放大文本,而不必担心影响网页的整体布局。更重要的是,他们可以自定义缩放的程度,并在所有页面或特定页面上应用这一设置。这对不同视力需求的用户可以极大地增强他们的网页浏览体验,将用户个性化的需求融入网页设计中。
谷歌这次大规模的更新不仅展示了其在AI和无障碍技术方面的前沿创新,更体现了公司对社会各层面需求的深刻理解与积极响应。通过这些新功能,谷歌旨在让每一位用户都能在数字世界中获得更为平等与便捷的体验。这样的努力不仅推动了科技的进步,也为各类人群特别是残障人士创造了更友善的生态环境。未来,我们期待谷歌能够继续在这条创新之路上走得更远,帮助更多的用户享受科技带来的便利。