10月28日上午,美国匹兹堡大学信息管理学院院长Ronald Larsen教授、何大庆教授应邀访问我院并商谈交流合作等事宜。副院长黄如花教授,院外事办主任周力虹老师出席了本次洽谈会。双方探讨了教师互访、学生交流、合作研究等各方面合作的意向,就一些基本问题达成了共识。
洽谈结束后,Larsen教授为我院师生做了一场题为“Ischool教育与新一代数据处理家”的学术报告,由黄如花教授主持,现场座无虚席。
Larsen教授以芝加哥城市变迁为映照,用其父亲处理数字信号方式的演变为导引,讲解了数据时代研究范式的变革:最初是观察,然后是理论,接着是计算和模拟,现在是理解海量数据和信息。长期以来,我们将学术活动分为四个阶段,即灵感(inspiration)、构思(formulation)、分析(analysis)和成文(documentation)。而在大数据时代,学术活动将要出现第五个阶段——加强学术资产的重用性(preparation of research assets for reuse)。大数据将驱动一整套新的学术研究,学者可以利用共享数据进行深入研究,例如利用哈勃望远镜对太空的观测数据、科考船的航海数据等。人类在数据共享上已经取得了初步成果,Linkopendata就是一个很好的实例。
图书馆在大数据时代将获得新的机遇。科学家们往往关注本身学科的内容,而没有兴趣和精力去管理数据,这正是图书情报学家的使命。未来图书馆员会走出去和科学家们共同工作,在馆外继续实现数据的获取、组织和开发利用。这里需要区分的几个关键概念是curation,archiving和preservation。curation(处理)是对数据进行选择、保存、管理的综合处理,可立刻提供使用;archiving(存档)是将数据保存以便日后利用;preservation(保存)是把数据进行长期的存贮以便日后查证。此外,repeatability(可重复性)和reproducibility(可重现性)也有差异,前者是指在相同条件和环境下能够得到同样的结果,后者是指在不同环境下满足相同条件能得到相同结果。
招聘网站的数据表明,人才市场对数据管理家的需求正逐年攀升。有潜力成为优秀数据管理家的将是三类人:首先是信息职业者,然后是领域专家,最后是半路转型者。而ISchool在培养数据管理家上,肩负着重要使命。
Larsen教授和蔼可亲,逻辑清晰,还很幽默,引得在座阵阵掌声。在提问环节,有同学问到大数据技术在图书情报领域的应用,Larsen教授认为大数据时代图书情报从业者要找好自己的定位,图书馆的数据量从来都不小,关键是要在组织数据和提供服务的方式上不断创新。当被问及数据处理家和情报学家的差异时,Larsen教授指出数据管理家都是情报学家,但是情报学家的研究内容更加广泛,包括信息检索、跨语言交流等。