现在,似乎每一款现代软件都配备了人工智能,为客户提供质量、实用性和安全性都值得怀疑的功能。Mozilla 及其 Firefox 浏览器也未能拒绝人工智能的广泛应用,该公司希望通过人工智能实现更好的可访问性。
在最近 Mozilla Hacks 上的一篇文章中,Tarek ZIade 解释了Firefox浏览器将如何利用人工智能来提高可访问性,即为依赖屏幕阅读器等辅助技术的用户提供人工智能生成的图片说明。
图片说明或”alt 文本”为读者提供了必要的背景信息,但遗憾的是,许多作者忽略了 alt 文本,导致近一半的图片缺少适当的描述。随着最新人工智能技术的发展,现在可以运行本地机器学习模型来自动生成标题,而无需向服务器发送潜在的敏感信息。
Firefox 130 将在”nightly频道”中为 PDF 编辑器提供一项新功能,使用基于 Transformer 的小型开源机器学习模型生成 alt 文本。Mozilla 声称,这些模型在描述图片方面表现出色,而且无需耗费大量资源。因此,Firefox 用户即使在性能较弱的设备上也能获得图像描述(首先在 PDF 中)。
博文称,小型模型可以生成包含 2 亿多个参数的 alt 文本,同时占用不到 200MB 的磁盘空间,并能在几秒钟内提供输出。与最新的 GPT-4o 等现代 LLM 的”巨无霸”相比,它们的细节和准确性都要逊色一些,但开发人员并不想用过多的信息来淹没用户。
因此,Firefox 将重点放在制作类似这样的一句话描述上:
一群人在办公室庆祝生日,前景是一个点燃的生日蛋糕,背景是一位面带微笑的女士。
使用本地模型有几个好处。除了提高隐私性(图像不会被处理到任何地方),用户还能获得更好的资源效率、更高的透明度、更少的二氧化碳排放(训练大型模型会产生大量碳排放),以及定期增强的频繁更新。
最新评论
点个赞
旧版Opera忠粉建议先核平谷歌。
看看尾巴
额
gdf
看看尾巴
很高兴,浏览迷又回来了持续稳定输出了。
Window端的来助阵