※この記事はアフィリエイト広告を含みます
AI让纽约的历史重现!《OldNYC》借助GPT-4o将1万张老照片映射到地图上!
📰 新闻概述
- 纽约历史照片浏览平台《OldNYC》进行了重大AI升级。新增1万张照片,现可浏览总计4万9千张照片。
- 通过OpenAI的GPT-4o,实施了从照片文本描述中提取坐标的“地理编码”,大幅提高了定位精度。
- 从Google Maps迁移到OpenStreetMap/MapLibre,降低成本并实现了符合1930年代景观的地图样式控制。
💡 重要要点
- GPT的高级定位能力: GPT-4o解读“已不存在的学校名称”或“模糊的交叉路口描述”。因此,约6000张在传统方法下难以定位的照片得以准确放置。
- OCR的显著提升: 原本“乱码”的老式打字机文字,通过GPT-4o-mini的新OCR系统被成功解读。文本化的图像数量从25000增加到32000。
- 摆脱Google Maps: 鉴于Google的收费体系调整,迁移至基于OpenStreetMap的方案。可自由定制,能够将1930年代没有的高速公路从地图中去除。
🦈 鲨鱼观察(策展人视角)
将“从古照片的描述中识别位置”这一人类都觉得麻烦的工作完全交给GPT-4o,达到87%的精度,实在是太酷了!特别是通过上下文识别已不存在的老交叉路口和学校名称,并与OpenStreetMap进行匹配,这种方法不仅具体而且令人振奋,充分挖掘了遗留数据的价值!看到GPT-4o-mini轻松将之前OCR系统下的“无法理解的字符”完美转换为文本,不禁让我感叹2015年与2024年(文章撰写时)的技术差距!
🚀 接下来会怎样?
未来期待AI能够直接分析图像,自动识别图中人物、建筑以及室内外场景的功能。此外,其他档案收藏的照片也有可能通过这一AI管道进行整合!
💬 鲨鱼的独特见解
过去与未来通过AI相连!仿佛瞬间回到了当时的纽约!🦈🔥
📚 术语解说
-
地理编码: 将地址或地名的文本信息转化为地图上的经纬度数值数据的技术。
-
OCR(光学字符识别): 读取纸质文件或图像中的文字,并将其转换为数字文本数据的技术。
-
OpenStreetMap (OSM): 一个允许任何人自由参与、编辑和使用的开放数据地图项目。