扫清数字学术研究的障碍

数字人文起源自20世纪40年代末的人文计算,在很多方面都是正在成长的学科领域,同时为研究者和图书馆带来了激动人心的机遇,但仍有很多难题需要克服。

当开展分析时,发现、清理和组织数据以及对历史文本的自然语言处理(NLP)常常是一项令人望而却步的任务,特别是想要生成有意义的分析结果时。Gale数字学术实验室扫除了这些障碍,让工作流程直观顺畅,研究者能够将更多的时间用于找到之前未被发现的数据、检验理论、分析结果和获取新的见解。

 

将创新带入数字人文

对于研究者而言,数字人文研究是以全新方式探讨内容的驱动力,分析观点、输出发现,它彻底改变了学者们合作的方式,让新的研究方式成为可能。协作是改变的重要推动力量,不同背景和技术水平的人们聚集在一起,解决将新工具应用于内容时常常遇到的障碍,获取内容并为分析做好准备。

 

提升每一位用户的人文计算能力

作为内容管理专家和高水平的技术人员,图书馆员是这一过程中当仁不让的协调者。全世界的图书馆都正在把握这样的机会,通过将计算分析工具与高质量内容相结合,帮助教师和学生发现突破性的研究方法并获得新的成果。随着人文学科资源经费的不断缩减,数字人文项目往往能比传统研究项目获得更多的支持,这让图书馆处于有利地位,积极参与到这一过程的各个步骤中。

 

研究历史文本的新视角

Gale与图书馆携手,致力于帮助大学院校启动、改进和加速他们的数字学术研究项目。Gale数字学术实验室(Gale Digital Scholar Lab)的开发过程始终有来自全世界各地大学院校和学术机构的测试者的参与,旨在转变学者和学生们访问和分析Gale原始档案(Gale Primary Sources)内容的方式,为当今数字人文领域研究者面临的一些常见难题提供解决方案。通过将数字化原始文献内容无以伦比的深度和广度与最常用的数字人文工具相整合,Gale数字学术实验室为探索历史提供了新的视角,助力研究者得出改变世界的结论与成果。 通过先进的人文计算工具,实现了更高效、更有效的历史文本自然语言处理(NLP),数字人文的足迹将能够延伸到全球更多的课堂中。

实验室平台如何工作

创建内容集

Gale数字学术实验室允许用户创建自定义内容集,每个内容集最多包含10,000篇文档。用户可以在图书馆现有的Gale原始档案馆藏中检索,顺畅地选择文档并加入到他们的自定义内容集中。

 

分析内容集

用户可以利用Gale数字学术实验室内置的文本分析和可视化工具分析和探讨数据。数字人文分析方法包括:命名实体识别(Named Entity Recognition)、主题建模(Topic Modelling)、词性标注(Parts of Speech)等。

管理和分享

用户的内容集保存在Gale数字学术实验室中,便于他们为长期项目管理他们的研究。用户可以发表他们的研究结果,完全保留所有的知识产权,也可随意分享他们的分析结果。

实验室平台新增功能

  • 多项新增功能帮助用户拓展和展示研究成果 — 2024年3月28日

    Gale数字学术实验室发布几项拓展研究成果的新功能:
     

    Gale研究展板(Gale Research Showcase)

    Gale研究展板是一套开放资料库,用于展示学生们利用Gale数字学术实验室和Gale原始档案开展的数字学术研究项目,其中发表的项目论文经过同行评审和修改。

      A screenshot of a computer  Description automatically generated  
     

    研究项目(Projects)

    “研究项目”是一项重要的新增功能,也是为了支持课堂中的人文教学。它允许用户从他们的“笔记本”中或实验室的其他地方选取草稿资料,按一定的思路编撰在一起,与新撰写的内容一起形成一份正式的报告。这份报告可以直接在实验室中提交到“展板”,或下载另做别用,例如提交作业或创建一篇研究论文。与“笔记本”等实验室中现有的功能相协同,“研究项目”让研究者无需离开这个平台就可以完成整个研究流程。

    “研究项目”功能可以通过页面上方工具条上的“我的研究”选项找到。

     A screenshot of a computer  Description automatically generated 
     

    “我的研究”(My Research)面板

    作为新增功能“研究项目”的一部分,“我的内容集”(My Content Sets)和“笔记本”(Notebook)功能都转移到新的“我的研究”面板中,将所有的用户个人材料聚集到一个页面中。这让研究者能够轻松组织和找到研究用资料,同时能够在创建一个研究项目的各个步骤之间轻松切换。