Gale数字学术实验室由众多机构和组织的测试人员参与开发,基于云文本和数据挖掘环境,通过将数字原始资料的深度和广度与最流行的数字文献工具,包括开源工具相结合,通过先进的人文计算工具,使历史文本的自然语言处理 (NLP) 变得可访问、更高效且更具影响力。该工具提供创建、分析、管理和分享内容集全流程工作。
创建内容集:Gale数字学术实验室允许创建自定义内容集,每个内容集最多包含10,000篇文档。用户可以在图书馆现有的Gale原始档案馆藏中检索,选择文档并加入到自定义内容集中。
管理内容集:可以利用Gale数字学术实验室内置的文本分析和可视化工具分析和探讨数据。数字人文分析方法包括:命名实体识别(Named Entity Recognition)、主题建模(Topic Modelling)、词性标注(Parts of Speech)等。
管理和分享:用户的内容集保存在Gale数字学术实验室中,便于长期管理研究,也可分享分析结果。