华南理工大学经验分享用例图自动生成方法有哪些?

首先,我们需要了解人工绘制用例图的步骤:

步骤一:确定系统边界

步骤二:确定参与者

步骤三:确定每个参与者所对应的用例

步骤四:确定用例之间的关系

如何根据以上步骤自动生成用例图呢?目前,大部分方法基于需求文档分析自动生成用例图。基于需求文档的用例图自动生成方法的研究,主要是通过自然语言处理(NatureLanguageProcess,NLP)的方式,利用分词、词性标注、语义分析等方法,结合句式、规则匹配等方法,从自然语言中提取用例图元素及其关系。

我们可以总结出以下六种基于需求文档分析的用例图自动生成方法:

方法一:基于句式规定和提取规则的图元素提取方法

句式规定是撰写需求文本的规定。需求文本编写者必须按照规定的句式表达需求。例如,编写者想表达“管理员可以查询学生成绩”,若句式规定为<用户>可以使用系统进行<操作>,则必须将该需求写成:“管理员可以使用系统进行学生成绩查询”。之后,该方法再按照用例图元素提取规则,采用正则匹配的方式来切割需求语句并提取用例图元素。这种方法[1]解决了因使用自然语言来表达需求而造成需求描述歧义、不完整、不准确进而导致需求文档分析结果不准确的问题。但是由于句式规定死板,这种方法只能分析根据规定书写的需求文档,从而解决用例图自动生成问题。一旦更换书写风格或者书写规则,该方法就无法提取图元素。

方法二:基于事件表或商业词汇表的图元素提取方法

该方法将业务词汇和商务规则元素映射到用例图元素,能够从业务词汇表生成UML用例图。图2为事件表-用例图的映射示例。但是,该方法能否被成功使用取决于需求文档中是否包含完整的事件表。

图2事件表-用例图的映射示例

方法三:基于自然语言处理的图元素提取方法

基于自然语言处理的图元素提取方法是目前使用最广泛的方法,其主要思路是根据用户故事或其他自然语言描述的需求文本,半自动或自动提取图元素。例如,SUGAR工具通过解析自然语言需求来识别用例、参与者、类等图元素,并且能够结合RationalRose工具在Java中生成所有静态UML模型。除此之外,SUGAR工具还可以通过自然语言处理的方法分析需求文本,并建立一个以语义网络为代表的集成语篇模型来处理文本,然后使用这个语义网络自动构造一个UML图。

方法四:基于用户故事的图元素提取方法

基于用户故事的图元素提取方法是根据自然语言所描述的用户故事自动生成概念模型的方法。这种方法要求需求文档中必须包含用户故事。

方法五:基于启发式的图元素提取方法

基于启发式的图元素提取方法主要是通过引入新的启发式算法来辅助实体-关系(ER)[2]的建模过程,并将其应用于自然语言的自动处理及向实体-关系(ER)模型的转换。ER-Converter是目前已经实现的工具。

方法六:基于领域本体[3]的图元素提取方法

基于领域本体的图元素提取方法利用自然语言处理和领域本体技术从文本需求中提取UML图。例如,较为常用的RAPID工具能够帮助需求分析师分析文本需求,通过自然语言处理工具消除模棱两可的需求并且识别不完整需求,主要思路是通过句法重建将复杂句子分割成简单句子,从而提取出所有可能信息。

以上方法各有局限性,基于句式规则的方法依赖大量规则,可移植性差;基于事件表或商业词汇表的方法和基于用户故事的方法要求文档中必须含有事件表、词汇表或用户故事,适用范围小;基于启发式的方法依赖已经实现的规则,普适性较差。总的来说,规则可以提高用例图自动生成的准确性,但是过多的规则会导致方法普适性降低。如果希望自己的研究更具普适性,就要避免过多的规则,减少对撰写过程的要求。同学们可以根据自己的需求选择合适的方法哦!

参考文献:

[1]欧阳柳波,郭海林.基于领域需求结构化描述的自动分析建模方法[J].计算机工程与应用,2016,20:52-57.

[2]OmarN,HannaJRP,McKevittP.Heuristic-basedentity-relationshipmodellingthroughnaturallanguageprocessing[C]//Proc.ofthe15thArtificialIntelligenceandCognitiveScienceConference(AICS-04).ArtificialIntelligenceAssociationofIreland,2004:302-313.

[3]ChenJ,GuJ.ADOL:anovelframeworkforautomaticdomainontologylearning[J].TheJournalofSupercomputing,2021,77(1):152-169.

THE END
1.AI在自然语言处理中的突破:从理论到应用腾讯云开发者社区自然语言处理的核心技术 1. 词嵌入(Word Embedding) 词嵌入技术通过将词语映射到一个高维向量空间中,使得计算机能够理解词语之间的关系。常见的词嵌入模型包括Word2Vec、GloVe和FastText。这些模型通过大量文本数据的训练,能够捕捉词语的语义信息。 ###2. 变压器模型(Transformer) https://cloud.tencent.com/developer/article/2479408
2.自然语言处理中的知识图谱自然语言处理(NLP)是计算机科学和人工智能领域的一个分支,旨在让计算机理解、生成和处理人类语言。知识图谱(Knowledge Graph,KG)是一种以实体(entity)和关系(relation)为基础的图形数据库,可以帮助计算机理解和推理人类语言。在过去的几年里,知识图谱在自然语言处理领域取得了显著的进展,成为了NLP的一个重要组成部分。 https://blog.csdn.net/universsky2015/article/details/135788023
3.应用:自然语言生成与对话系统51CTO博客知识图谱(Knowledge Graph, KG)是一种用于表示实体(entity)和实体之间的关系(relation)的数据结构。知识图谱的核心是将实体和关系建模成图的节点(node)和边(edge),实体表示为节点,关系表示为边。知识图谱可以帮助计算机理解自然语言,从而实现自然语言处理(Natural Language Processing, NLP)的目标。 https://blog.51cto.com/universsky/9048284
4.AI自然语言处理NLP原理与Python实战:知识图谱的构建自然语言处理(Natural Language Processing,NLP)是人工智能(Artificial Intelligence,AI)领域的一个重要分支,旨在让计算机理解、生成和处理人类语言。知识图谱(Knowledge Graph,KG)是一种结构化的数据库,用于存储实体(如人、地点、组织等)及其关系的信息。知识图谱的构建是自然语言处理的一个重要应用,可以帮助计算机理解人类https://zhuanlan.zhihu.com/p/670006229
5.Python自然语言处理实战图1-5还显示了当我们使用Google的Translation API服务时,翻译文本的JSON响应。 1.2.5 自然语言推理 自然语言推理(natural language inference,NLI)任务对前提和假设之间的关系进行分类。在推理过程中,任务将前提和假设作为输入,并基于给定的前提输出假设是否为真的判断。 https://www.ituring.com.cn/book/tupubarticle/33684
6.文本序列的常用构图方法与代表案例剖析信息抽取图的目的是抽取结构信息来表示自然句子中的高级信息。 在实现上: 首先,通过Openie等工具识别出句子中的实体、实体之间的共指关系三元组(如上图中名字 "Pual"、名词 "He "和 "一位著名的计算机科学家 指的是同一个对象),以及主谓宾三元组(如图中的paul,grew up in seatle),一同作为关系三元组数据(https://www.shangyexinzhi.com/article/4455904.html
7.干货分享RDF和LPG知识图谱上的表示学习在本文中,我们将重温三元组在知识图谱构建中的结构范式,同时也将学到新概念—超图、超关系知识图谱以及超关系知识图谱的发展历程、超关系知识图谱编码、解码的全过程等等。原文(见阅读原文)翻译如下: 知识图谱(KGs)是现代自然语言处理和人工智能应用的基石——近期的成果包括问答、实体和关系链接、语言建模、信息提取,https://www.jianshu.com/p/5366ec5bc4a2
8.政策智能分析详解,达观RPANLP知识图谱技术多嘲落地应用通过机器人流程自动化(RPA)、自然语言处理(NLP)、共光学字符识别(OCR)、知识图谱、智能搜索、智能推荐、文档智能审阅等自动化与人工智能技术的结合,未来,达观数据也将继续助力企业快速实现智能化升级。https://blog.itpub.net/69997703/viewspace-2778372/
9.科学网—[转载]时态知识图谱补全的方法及其进展杜剑峰(1976-),男,博士,广东外语外贸大学教授,中国中文信息学会语言与知识计算专业委员会委员,主要研究方向为知识表示与推理、数据挖掘和自然语言处理。在AAAI、WWW、ISWC、CIKM和KAIS等学术会议上发表数十篇文章,获得多项国家自然科学基金项目资助。担任JournalofWebSemantics编委,长期担任CCKS、CSWS、IJCAI、AAAI、ISWC、https://blog.sciencenet.cn/blog-3472670-1296534.html
10.产品经理的知识图谱入门实操人人都是产品经理从无结构的文本中抽取知识,首先需要识别文本中的实体,这个过程称之为做命名实体识别(Named Entity Recognition,NER),命名实体识别属于自然语言处理中的一项基础任务,同时也是关系抽取、事件抽取、机器翻译、问答系统等多个NLP任务的基础工作,其目标是从文本中抽取出具有特定意义的实体,一般包括实体类、实践类、数字类三个https://www.woshipm.com/pmd/2638735.html
11.全国一体化政务大数据体系建设指南图2国家平台与地方和部门平台关系图 国务院办公厅统筹全国一体化政务大数据体系的建设和管理,整合形成国家政务大数据平台,建立完善政务大数据管理机制、标准规范、安全保障体系。国务院有关部门要明确本部门政务数据主管机构,统筹管理本部门本行业政务数据,推动垂直管理业务系统与国家政务大数据平台互联互通。已建设政务数据平台https://www.hc.gov.cn/bmjd/jz/gdz/zwxx_100731/dt_100733/202210/t20221031_11249976.html
12.Python自然语言处理之词干,词形与最大匹配算法代码详解python这篇文章主要介绍了Python自然语言处理之词干,词形与MaxMatch算法代码详解,涉及词干提取,词形还原,简单总结了二者的区别和联系,最后还分享了最大匹配算法的相关示例,具有一定参考价值,需要的朋友可以了解下。 本文主要对词干提取及词形还原以及最大匹配算法进行了介绍和代码示例,Python实现,下面我们一起看看具体内容。 https://www.jb51.net/article/128333.htm
13.?达摩院文档级关系抽取新数据集和五元组抽取新任务自然语言处理 关系抽取 EMNLP 信息抽取 知识图谱邴立东 2022-12-02关系抽取(RE)是 NLP 的核心任务之一,是构建知识库、事件抽取等下游应用的关键技术。多年来受到研究者的持续关注。 本文将介绍达摩院语言实验室多语言 NLP 算法团队的两篇 EMNLP 2022 主会论文。第一篇论文针对文档级关系抽取任务中普遍存在的假负https://techbeat.net/article-info?id=4379