图书馆大模型创新应用需求与场景研究
0引言
大模型技术的蓬勃兴起,打破了机器认知与创造的边界,使得人工智能发展进入“后图灵时代”,并将人类带到了通用人工智能(AGI)的门口。大模型技术热潮主要由大语言模型(LargeLanguageModel,LLM)引领,它突破了自然语言处理(NLP)领域以小模型为主导的传统发展范式,带来了人工智能科学思维的重要跃升。大语言模型是一类超大型深度学习模型,其参数量从数十亿到超千亿不等,通过预训练海量自然语言数据构建而成。大语言模型巨量的数据训练架构赋予了其“涌现”的泛化特征,并使其具备了多任务的通用求解能力。大模型在语言上的成就也扩展到了其他模态,用同样方法对海量图片、音频、视频等多媒体信息结合语言数据进行预训练和指令微调,可构建多模态大模型。因此,大语言模型和多模态大模型两者通常被统称为“大模型”。
在国家的政策引导与鼓励下,各行业大模型在垂直领域应用实践与案例不断涌现,图书馆界也迎来了重要的转型契机。大模型技术对图书馆有什么影响?图书馆如何将大模型技术融入到运营与服务中?图书馆哪些典型的领域和场景可以发挥大模型的价值,从而带来智慧图书馆的升级?本文旨在探索大模型在智慧图书馆中的应用潜力,通过对图书馆大模型应用的路径、方式的思考,识别可行的领域、场景和需求,以期为图书馆的智慧化转型提供参考。
1大模型对图书馆行业的影响
1.1行业价值
大模型核心技术优势源于其卓越的泛化能力、复杂任务推理能力和技术融合能力,这些优势正成为引领各行业智能化升级的强大引擎。强大的泛化能力使得大模型能够结合垂直行业和业务场景的需求,进行应用适配,满足多样化的应用需求。大模型的复杂任务推理能力,支撑其在与工具、用户及外部环境的互动中完成高级指令。这为构建大量应用程序提供了机会,从而使大模型有机会成为下一代计算平台/操作系统,有效支撑智能终端、系统、平台等产品应用落地。大模型还能通过技术融合实现性能上的显著提升。它可以与知识图谱、搜索引擎等工具集成,或与小模型进行优势互补,实现协同效应,增强功能丰富性和性能优越性。
目前,国内外大模型已在办公、教育、医疗、金融、文娱、交通等领域落地应用。从行业渗透率来看,金融业的渗透率最高,办公领域的渗透率也比较可观,而能源和建筑行业的渗透率较低。在新的技术背景下,以大模型为代表的生成式AI促成了新的生产力系统机制,成为各行各业推动科技进步和产业变革的重要力量,为各行各业带来了革新的可能,并快速改造着信息与知识服务行业。
从图书馆领域看,大模型技术的发展推动了图书馆服务场景的智慧化,知识管理的智能化与业务流程的自动化,对图书馆的变革影响可能带来五方面的价值。
首先是革新图书馆知识交互方式。新一轮的AI变革,推动未来人机交互应用从图形化界面向对话式交互界面转变。随着大模型的应用落地,图书馆服务可以提供更智能、更高效、更个性化的交互方式,提供基于自然语言的、多模态的、更直观的参考咨询、文献检索与知识服务。
第二是改变图书馆知识集成方式。大模型技术通过跨语言处理、知识链接和语义搜索,显著提升了图书馆知识集成的效率和深度,构建起一个多维度、互联互通的知识网络,从而促进知识的发现和创新。
第三是优化图书馆资源加工流程。大模型技术通过文本图片语音识别、自动元数据生成、自动标注与分类、自动摘要总结、知识图谱构建等,提高了图书资源加工效率,降低人力成本。这将使图书馆资源的标准化加工流程从手动模式向半自动或自动模式转变,进一步提高图书馆资源加工的效率和质量。
第四是激发图书馆本地特色资源价值。利用生成式AI技术,对图书馆的古籍资源、地方特色资源等历史文化特色馆藏资源进行开发、挖掘、利用,充分发挥语料价值,增强资源的表现力和吸引力,有效活化典籍知识,弘扬中华经典文化、区域特色文化,激发这些资源的文化影响力。
第五是提升图书馆管理决策能力。大模型应用可以更好地对图书馆的各项业务数据进行指标监控与分析挖掘,提供科学合理的决策支持,为图书馆业务优化、资源配置提供分析建议,从而提升图书馆的智慧化管理水平和效果,辅助图书馆管理决策更加科学、合理和有效。
1.2影响方式
在探讨大模型对图书馆领域影响的方式时,《智慧图书馆大模型创新与应用白皮书》提出了“+大模型”与“大模型+”两种应用架构。这两种模式预示着图书馆的转型方向,可以通过对传统应用的AI重塑和开发新的AI原生应用,来将图书馆现有的流程与AI技术相结合,实现服务效率和质量的双重提升(图1)。
首先是对传统应用的AI重塑。图书馆通过优化现有工作流程,将传统的应用通过集成AI技术进行重塑,提高了服务质量和流程效率。例如员工知识库的智慧升级、AI辅助的采编流程、数字资源的加工与开发等,通过优化现有工作流程,提升了馆员的工作效率。此应用方向体现了以图书馆业务场景为核心,通过接入大模型的智能化能力实现服务和效率的双重提升,即“+大模型”的应用范式。
另一种方式是开发AI原生应用。AI原生应用是指那些将以大模型为代表的AI技术作为核心功能和价值支撑的应用。这一类应用直接根植于生成式AI技术最核心的能力,如提供个性化服务和内容创新创造。典型的原生应用例如智能聊天机器人、AI写作助手、多模态创作工具等,为图书馆的内容服务带来创新动力;比较具有行业典型性的AI原生应用如AI研究助手、个性化学术教练等,为用户提供定制化的信息和学术支持。随着AI技术的不断发展,越来越多的原生应用将被开发应用,智慧图书馆中的大模型应用则逐渐由“+大模型”向“大模型+”范式转变。
当然,原生应用中还包括一类当前未知、暂未触及的AI应用。这类应用的颠覆性创新前景广阔,如基于智能体的流程自动化、具身智能应用、高智能AI员工等概念,可能打破现有的智能应用范畴,引入图书馆进入一个全新的发展阶段。
1.3影响领域
大模型被广泛考虑作为多种任务的通用工具,这归功于大模型的核心能力。大模型的核心能力包括语言理解、信息匹配、内容生成、知识承载等基础能力,以及拥有上下文学习、思维链推理、指令跟随等涌现能力。基于这些能力,大模型能够执行文本生成、语义理解、信息抽取、任务推理、机器翻译、文本分类、总结摘要、模态转换、数据分析、知识图谱构建等各类任务。大模型的这些功能使得大模型在智能问答、信息检索、个性化推荐和内容生成等场景展现出显著的自动化和智能化优势,从而极大地提升了信息处理的效率和输出的质量,推动了人工智能技术的广泛应用和持续创新。IFLA的《图书馆对人工智能的战略响应》报告认为,新一代AI技术对图书馆系统、用户、馆藏、特藏、元数据、设施、推广、培训、策划团队等方面都有重要影响。
表1分析了大模型典型任务功能对图书馆的作用影响。通过大模型能力的运用,图书馆可以提高服务效率、增强用户体验,并推动图书馆服务的新和发展。归纳来看,大模型影响的图书馆领域包含了参考咨询、资源发现、学术服务、数字人文、阅读推广、图书馆系统、采编、知识加工、管理决策等几个典型领域。这些领域融入大模型的能力,可以满足智慧图书馆中不同类型的需求,包括功能类和性能类的需求,也可以满足体验类和专业类的不同需求,提升图书馆服务的效果与能力。
2图书馆中的大模型应用
2.1应用进展与特征
当前以大模型为代表的生成式AI的技术仍在迭代与发展中,该技术在各行业中的应用阶段仍处于“探索孵化期”、“实验加速期”或“采纳成长期”,尚未有行业到达“落地成熟期”。在图书馆领域,大模型技术的应用正处于“探索孵化期”,逐渐从理论走向实践,具有其独特的发展特征。
(1)服务端的快速响应。图书馆服务端的大模型技术应用正以迅猛的势头推进,尤其在提升用户体验和学术服务方面取得了显著进展。市场上已涌现出“智能数字馆员”、“学术助手”和“AI助教”等创新产品。它们通过增强用户互动和提供个性化服务,极大地提升了服务的质量和效率。然而,目前深度整合图书馆自有数据资源的AI服务产品尚不多见,多数图书馆仍处于直接采用通用产品或进行简单集成的初级阶段。
(2)后端流程的智能化进展较慢。与服务端相比,后端业务生产流程的大模型技术应用落地进程较慢。尽管如此,业界正积极探索如何利用大模型技术提高后端操作的自动化和智能化水平,以期提升采编、资源加工等关键环节的效率。德国、美国、中国等地的图书馆已开始实验性地将大模型技术应用于自动编目与元数据生成等任务,展现了这一技术在图书馆后端流程中的潜力。
2.2应用路径
根据领域(场景)的特定需求,以及图书馆自身的数据与技术现状,图书馆可选择合适的应用路径将AI技术整合到实际服务业务中。本文提出六种整合和应用生成式AI技术的路径(图2),这六种方式在实现难度、资源需求、技术复杂性上由易到难。
在推进人工智能应用时,建议图书馆遵循宏观策略指导,选择与资源和技术能力相称的路径。对于路径1,在推广人工智能素养方面发挥领导作用,是当前最符合现有图书馆实践的策略之一。对于路径2-5,图书馆需实施负责任的AI应用。技术基础薄弱或追求快速部署的图书馆,可先从集成第三方AI服务着手,逐步积累经验。而技术实力雄厚的图书馆,则可考虑自主研发或合作开发AI产品。对于路径6,要求图书馆具备一定的资源积累和技术能力。例如瑞典国家图书馆利用庞大的档案语料训练了多个瑞典语模型并提供开源服务;中国国家图书馆携手文心一言助力华人探根寻脉,以推动文化资源和知识服务智能化。
2.3落地应用策略
随着AI应用的深入,图书馆将逐步建立适应新技术要求的技术架构,扩展其信息化基础设施,以满足底层、模型、平台和应用等各个层次的技术需求。尤其需要建立一个能够接入、管理和开发各种模型的平台工具,包括云端和本地模型。在实际服务中,图书馆应综合运用多种AI工具组件,灵活运用提示词、检索生成增强、智能体和模型微调等策略,以提升大模型的稳定性和一致性,从而解决专业能力不足、幻觉现象和推理不一致等问题。在项目具体落地过程中,建议图书馆考虑以下策略:
考虑馆藏与数据价值。对图书馆数据与资源进行分析,以识别和评估潜在的数据源,特别是对于古籍和特藏,明确可以优先应用AI技术的数据。高度重视数据治理,包括数据清洗、集成和质量保证,确保数据的准确性和可靠性。推广数据共享、开放性和互操作性。
进行概念验证与服务转化。实施小规模的概念验证项目,特别是在技术挑战领域(例如图像分类),以测试生成式AI技术在图书馆服务中的可行性。成功的概念验证项目应转化为可持续的服务,以实现技术的长期价值。
持续监控与质量保证。建立监控机制,根据反馈持续改进AI服务,确保服务质量。考虑使用数据为中心的评估方法,通过科学地评估和测试,确保AI系统的稳定性和可靠性。以迭代、循环的方式,长期优化、监控应用。建立质量标准基线,搜集用户反馈。
3智慧图书馆中的大模型应用需求
在数字化转型的浪潮中,图书馆业已积淀了坚实的数据资产和平台基础。当前,智慧图书馆已经从概念阶段发展到实际应用阶段。国家图书馆等机构启动了一系列的智慧图书馆项目,加速整个行业的转型,包括硬件和软件的更新,以及业务流程和服务模式的重塑。放眼未来,人工智能技术仍在持续演进,图书馆应积极思考挖掘大模型技术在智慧图书馆中的应用潜力,提出前瞻性的需求期望,并通过与技术厂商交流引导、合作实践,努力把握未来发展的主动权。图3归纳了智慧图书馆中可实验、实施或展望的大模型应用。
3.1智慧服务中的大模型应用
大模型技术作为人工智能的前沿代表,正成为图书馆智慧服务创新的重要驱动力。图书馆行业期望借助这一技术,不仅对传统服务进行智能化升级,更要孵化全新的服务模式,引领智慧服务的革新浪潮。
读者服务的智能升级:通过自然语言处理技术提供智能问答服务、个性化推荐等,带来读者服务中的咨询问答、检索发现、资源推荐的智能升级。引入智慧增强功能,优化检索过程,借助自然语言处理和多轮对话系统,使读者能够以更直观、更高效的方式来发现馆藏的纸质和数字资源。结合多个知识库,使读者可以自助进行图书馆咨询问答,满足常规业务咨询的需要。利用大模型优化原先的资源关联推荐算法,优化个人主动推荐功能与算法等。
AI驱动的图书馆创新服务:图书馆结合可以前沿技术进行开拓创新。如引入虚拟人、数字人,提供AI馆员服务;结合阅读推广服务,开发AIGC创新型阅读体验,包括基于特色馆藏的AIChatbot,融入AI的场景游戏,读者多模态创作体验,AI增强的元宇宙沉浸式互动等。图书馆还可结合其丰富的历史档案、历史文献,提供深入的数据与知识服务产品。这包括为用户打造智慧的历史人文阅读分析平台和可视化交互平台,以及开发专门领域的模型训练语料库和知识库产品。通过跨界合作和资源整合,图书馆能够提供基于AI的人文知识服务、深度解析服务以及艺术及文学作品溯源服务。具体应用包括如古籍AI解读、AI碑帖识别、历史人物识别、人文AI创作体验服务等,从而为用户带来前所未有的探索和学习体验。
3.2智慧业务中的大模型应用
随着AI技术的持续发展,智慧图书馆的业务流程中,馆员自动化需求越来越显著。未来智慧图书馆中的业务将越来越多地体现人机共存和人机互补的理念,这将成为图书馆智慧业务中大模型应用的重要趋势。
自动化与智能化图书馆业务流程:利用大模型技术,图书馆可以自动化执行采编、资源加工、知识组织等核心业务流程。这不仅涵盖各类文献的自动分类和编目,还可以扩展到智能内容审核、智能资源盘点、智能格式转换与保存、个性化推荐系统等,从而大幅提升图书馆的运营效率和服务质量。
历史文献的数字化与深度利用:大模型技术可以支持图书馆对历史资料和文献进行高效的数字化处理,包括保存、修复、识别、评估、分类、开发等。通过结合各类技术,图书馆通过优化数字人文工具,能够深入挖掘历史文献的价值,为学术研究和文化传承提供丰富的原始资料和深度分析。
专业研究中的智能化辅助:大模型技术能够为情报研究人员、专业研究馆员、古籍历史学家提供强大的研究支持,包括但不限于智能检索、趋势分析、学术网络构建等。此外,大模型还可以辅助构建知识图谱,将分散的信息点连接成系统化的知识体系,为专业研究提供更为丰富和深入的学术环境。
3.3智慧管理中的大模型应用
大模型应用于图书馆智慧管理,目前相对较切实的需求是为员工提供智慧化的工具和平台支持,以及提升管理决策的科学性水平。可从以下四个方面进行实践应用。
数据分析的数智助手:用大模型加强图书馆在数据处理与分析方面的能力,提升图书馆智能决策水平。数智助手支持数据分析、数据处理、格式转换、格式迁移、自动报表、智能问答等功能,满足图书馆在数据驱动决策的需求。它能够提炼数据概要,辅助策略制定,优化服务与资源管理,成为图书馆决策的得力助手。
图书馆服务平台(LSP)副驾驶:LSP副驾驶旨在通过智能化辅助工具优化整个业务流程的管理,可具备以下关键功能:负责整合馆员当前使用的多个信息系统后台,确保所有主要服务接口能够统一接入,便于客户端使用,并实现业务流程的自动化组合操作;可问答查询全面展示各系统各资源的使用情况,能调用数智助手,自动生成并可视化展示统计分析报告,支持历史数据的深入分析和趋势比较等。
集成式的应用与助手工具平台:图书馆可以部署包括写作助手、多模态助手、业务培训助手等在内的AI创新工具,这些工具将辅助图书馆的办公与运营,显著提高工作效率。集成式工具平台将推动图书馆服务与管理向更智能、更高效的方向发展。
3.4智慧空间中的大模型应用
智慧图书馆中的智慧空间,是图书馆服务与技术融合的具体体现,它融合了实体和虚拟环境,包含场馆、座位、建筑、设施设备、活动等主要因素,共同构建一个多维互动的知识共享生态。大模型技术的融入,为这一生态系统带来了创新的活力,当前可尝试领域的包括:
实体空间的智能化革新:将大模型技术集成至服务机器人,通过语音识别和对话管理系统,提供信息咨询、导览、导航和辅助服务。开发专为视障人士设计的智能服务系统(或机器人服务),使视障用户能够通过语音与图书馆系统交互,检索和获取信息,获得贴心的服务。还可利用自然语言理解处理用户预约请求,预测用户需求,基于图书馆空间服务进行智能预约等。
虚拟空间的智能增强:图书馆正借助生成式AI技术,拓展其在虚拟空间的服务边界。通过虚拟助手和元宇宙交互,提供沉浸式体验。这包括利用生成式AI在虚拟空间中与用户进行自然语言互动,根据用户偏好推荐资源,并运用情境感知技术实时优化服务。同时,通过图像与语音生成功能,确保包容性体验,吸引更广泛的用户群体参与虚拟图书馆活动。
4图书馆典型领域大模型应用场景构建
基于大模型的特点和优势,图书馆业务的多个方面有望实现智慧化转型。本文挑选参考咨询、资源发现、阅读推广、学术服务、采编辅助、资源加工、数字人文、管理决策八个典型领域,进行场景构想与前瞻性分析(图4),以激发图书馆领域在大模型技术的开发应用和产品设计方面的积极探索。
(1)智慧咨询服务
(2)智慧资源发现
(3)智慧阅读推广
(4)智慧知识服务
(5)智能采编
(6)数字资源智能加工
(7)数字人文智慧研究与服务
(8)智慧馆员助手
图书馆智慧化程度的高低,可通过馆员助手的智能化能力得到直观反映。馆员助手也称馆员Copilot,是图书馆AI技术重要的应用场景,它能够成为AI时代馆员业务工作的得力助手,整合了知识库、图书馆平台助手、数智助手、学术助手等业务类工具助手,以及写作助手、多模态助手、业务培训等各类大模型创新工具应用,以辅助馆员工作效率提升。其中,图书馆平台助手是为馆员打造的基于图书馆服务平台(LSP)的副驾驶工具,通过自动化和智能化场景调度后台管理流程,能提高操作效率、增强决策能力。该系统具备文字和语音输入功能,允许馆员通过平板电脑或桌面电脑快速提出业务需求,并获取相应的应用入口和信息导引。LSP副驾驶实现了图书馆平台功能的整合,将馆员日常工作所依赖的多个信息系统后台统一接入,确保了核心服务接口的一致性。通过客户端,馆员能够便捷地访问和使用这些服务接口,从而高效地执行业务流程和组合操作。此外,馆员助手应支持个性化服务,能够根据馆员的具体需求,提供定制化的信息检索、资源推荐、创作开发和业务自动化流程。
5结语与展望
当前,人工智能技术正处于快速演变之中,图书馆在紧跟技术前沿的同时,首要任务是识别潜在的创新路径,明确需求,展望构建面向未来的发展蓝图。本文的目的就是通过揭示大模型在智慧图书馆中的应用潜力与可能性,为图书馆在探索大模型技术创新应用时提供参考,以助力图书馆更好地把握人工智能发展所带来的机遇。图书馆可以利用大模型这一技术利器,赋能传统服务,推动创新发展,在业务流程中注入高效智能,从而更好地完成传承文明和推动知识创造与传播的使命。
AI技术应用的前路还很长。在应用大模型技术转型的过程中,图书馆将面临数据、可信评价、评估标准等一系列挑战。图书馆需要积累高质量的数字化资源,实施精细化的数据管理和全面的数据治理,为未来AI技术的有效应用打下坚实的基础。同时,图书馆还要建立性能基准和评估标准,衡量大模型的有效性与准确性,并建立长期监测与反馈机制,以不断调整和改进大模型的应用。图书馆应维护核心价值,采用策略性路径,利用大模型技术促进知识普及及创新服务。为了更好的实现技术落地,图书馆应开展跨机构联盟合作,建设支持性的技术生态系统,帮助图书馆构建强大的技术后盾。
(参考文献略)
《2024年IFLA趋势报告》节选:人工智能和其他技术正在重塑社会