盲人也能「看见」街景？Google 新 AI 系统让虚拟探索无障碍，科技向善迈出关键一步

AI 资讯
25 年 11 月 1 日
编辑

小强

近日，其发布了一款名为 StreetReaderAI 的创新原型系统，旨在让盲人及低视力用户也能无障碍地「游览」Google 街景——不再是被动接收信息，而是通过自然语言与虚拟环境实时互动，真正实现自主探索城市空间的自由。

多模态 AI 驱动，打造可对话的街景体验

StreetReaderAI 并非简单的语音播报工具，而是一个深度融合计算机视觉、地理信息系统（GIS）与大语言模型的多模态 AI 系统。它能实时解析街景图像内容，并结合精确的地理位置数据，生成结构化、情境化的语音描述。当用户「置身」于某条街道时，系统会主动说明周边环境:「您正面向一座红砖建筑，左侧是咖啡馆，右侧是公交站，前方 50 米处为十字路口。」

更关键的是，该系统支持智能对话交互。用户无需记忆复杂指令，只需像与人交谈一样提问:「前面那栋楼是什么?」「附近有银行吗?」「这条路通向哪里?」AI 便会基于当前视角和地图数据，给出准确、连贯的回答，让虚拟探索变得直观而自然。

无障碍操作，赋予用户真正的控制权

为确保操作对视障用户友好，StreetReaderAI 设计了极简的交互方式。用户可通过语音命令或标准键盘按键自由控制视角旋转、前进后退、切换街景点位，整个过程无需依赖屏幕或触控界面。这种「语音+键盘」的双模输入，兼顾了不同用户的使用习惯，真正实现了「所问即所见，所控即所行」。

科技向善: 从工具到权利的转变

长期以来，数字地图和街景服务虽极大便利了大众出行，却因高度依赖视觉界面，将视障群体排除在外。StreetReaderAI 的出现，标志着无障碍技术正从「辅助功能」升级为「平等体验」——它不只是提供信息，而是赋予用户主动探索、理解并决策的能力。

尽管目前该系统仍处于原型阶段，尚未集成至 GoogleMaps 正式产品线，但其技术路径已展现出明确的落地潜力。AIbase 分析认为，随着多模态大模型与空间计算技术的成熟，未来此类无障碍 AI 将不仅限于街景，还可拓展至室内导航、公共交通指引甚至远程导览等场景，真正构建一个「人人可感知、可参与」的数字世界。

科技的意义，不仅在于突破极限，更在于弥合鸿沟。StreetReaderAI 或许只是第一步，但它照亮的方向，值得整个行业追随。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

盲人也能「看见」街景？Google 新 AI 系统让虚拟探索无障碍，科技向善迈出关键一步

OpenAI 或将于明年上市，估值可达万亿！

Chrome Canary 新增 Gemini AI 功能:Nano Banana 与深度搜索正式登场

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

​OpenAI 或将于明年上市，估值可达万亿！

Chrome Canary 新增 Gemini AI 功能:Nano Banana 与深度搜索正式登场

字节跳动开源 Seed-X:70 亿参数小模型支持 28 种语言翻译，性能媲美顶级大模型

秘塔搜索 API 正式上线，低至 3 分钱的高效搜索服务

商汤科技 「悟能」 具身智能平台亮相 WAIC 2025

豆蔻妇科大模型成行业首例，创业公司+钉钉打造专业级 AI

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

OpenAI 或将于明年上市，估值可达万亿！

商汤科技「悟能」具身智能平台亮相 WAIC 2025