从年到年,“发现中国”知识地图制作分享平台已经走过了5个年头。目前我们已经拥有2.5万注册用户,日均访问用户约人,在历史爱好者群体和一些学者中具有一定知名度。在去年十月,我们运营团队启动了一项名为“中国古旧地图开放协作整理计划”的项目。这项计划旨在通过志愿者开放协作的模式,将国外各大图书馆、博物馆收藏的;采用公有或者非商业版权,已经数字化并开放下载的;涉及我国的建国前的中外古旧地图进行搜集、整理和翻译。以此形成统一的索引目录,让任何人都能免费使用。项目最终完成后,所有结构化数据将开放下载。根据规划,完成这一项目大概需要2年以上的时间。经过30余位志愿者约半年的陆续工作,我们于年3月正式对外公开发布0.1版本,收录了美国国会图书馆的一千余幅地图。
为什么我们叫“发现中国”呢?就我个人最初的想法,就是希望人们能够透过地图,直观的看到中国从古到今的社会变迁和文化传承。我们的域名是“ageeye.cn”,“eye”代表着发现和探索,“age”指时代和历史,“cn”则表示着中国。因为我相信,在经济上取得伟大成就之后,中国的文化复兴将是下一次的漫漫征程。因此我们团队希望和亿万人一起,砥砺前行,完成属于自己的一份义务。
不过要实现这一目标,实际上是极其困难的。在创办之初,既无名气,也无资源的发现中国,只能寄希望于靠普通爱好者制作分享地图的方式去实现这一目标。分享地图需要一个免费简易的制图工具,所以开发一个适合人文地理用户使用的地图编辑器,是最初几年的主要工作。应该说,平台提供工具、用户分享内容是一种很常见的互联网模式,但它的弊端也很明显,就是内容质量的不可控。特别是爱好者群体非常小众;对严谨性和完整性要求又极高;需要经年累月来完成;却没有什么可阅读性的地图而言,这一点可谓致命。
经过三年的发展,我们用户中学习人文社科专业的学生逐渐多了起来,这让我们意识到,向更加专业的方向发展或许是一条正确的道路。为此我们在年上线了一个“中国古旧地图”专栏,旨在发布一些来自国外图书馆开放下载的高清古旧地图资源,并通过组织运营团队志愿者,来完成一些相对可靠完整的内容。当时我们的运营团队畅想过一个庞大的计划,除了要发布几百上千的高清古旧地图外,还要推出更多的专栏,比如中国历史地图、中国古城地图等等。
理想很丰满,现实很骨感。在付诸于实践后,这些计划很快因为经验、人员、时间、技术、经费等诸多原因无果而终。就其失败的经验来看,我们认为,通过组织志愿者的方式协作内容并非不可行,但首先必须有明确的理念和强有力的组织规划,让整个项目完全可控;其次必须有完成协作的技术支撑,毕竟在地图上制作地理数据需要专门的工具。
为此,我们吸取之前失败的教训,决定在年重启这一计划,希望通过志愿者在线协作的方式,推出一系列相对可靠完整的,轻量级的人文社科领域地理基础数据库。这一次,我们的理念从地图上升到了地理数据;从文本信息发展到了数据结构化;从内部制作变成了开放协作。
我们首先要解决的问题就是数据结构化和可视化等技术问题。在以前,发现中国上用户分享的内容,大多是一些非常简单的示意图和数据混乱的专题图,来源不知,作者身份不明,数据也以经纬度数据为主。然而,人文地理类的数据真正可以量化成经纬度坐标的,其实只是少数,有时甚至是极少数。多数数据可能是作者、作品、年龄、朝代、收藏单位等信息,同时还可能涉及人物关系等复杂的知识图谱,还可能包含大量文字、图片、音视频等多媒体信息。
传统上的做法,一般是使用通用工具,比如Excel、Access、ArcGIS等进行结构化,完成后要么直接通过文件分享,要么再进行二次开发后提供在线浏览。不过可惜的是,这些软件几乎没有一个是针对人文社科需求而开发的。其次就是开发一套针对这个项目需求的信息系统,可以支持在线管理和在线发布。定制开发虽然功能强大,但对于人文项目及其有限的经费而言,其投入大、周期长、不可控,运营维护和持续升级都很困难。在我看来,这也是限制我国数字人文发展的重要因素之一,同时也造成了极大的资源浪费。而对于我们这样基于互联网的志愿者协作项目而言,在线发布、在线使用是必然的,所以选择开发一套专门的系统这条路子也是必然,不过好在作为技术人员,开发对于我们而言,倒并不是特别困难的事情。
我们的定位是轻量级的数据库,毕竟志愿者团队不是专门的科研团队,没法做太深入的东西,我们的用户群体也以爱好者和学生居多,查询是普遍需求。另一方面,我们未来还要推出其它结构化协作计划,所以专门针对古旧地图去开发一套系统就很不划算。因此,我们把目标定位为一个适合人文社科类项目的通用协作平台,并把这个新的平台命名为“地图书”。在这次的取名中,我把“地图书”当作是“左图右史”更加通俗的名称,域名则为“ditushu.