【关键词】用户分布,功能分布,数据分布,耦合度,领域知识,自动构造
随着Client/Server结构应用系统复杂和扩大,其数据、功能和用户的分布问题变得日益突出。合理有效地设计MIS系统模型是MIS系统能否有效发挥效率的关键。通常处理这些问题都是软件开发人员根据其以往的开发经验,设计的好坏受人为因素影响很大,且方案因人而异。本文提出了基于耦合度的分布过程解决方案,并在此基础上实现了一个分布的自动生成工具。
一、 分布问题
当我们根据系统的需求信息来设计基于三层Client/Server模型的MIS系统的时候,一个很重要的工作就是需要确定MIS系统由多少个客户端、应用程序服务器和数据库服务器组成,用户、功能和数据是如何分布在客户端、应用程序服务器和数据库服务器上的。
对于一个MIS系统来说,我们都可以将它抽象分解为用户集 U={u1,u2,..,ul}、功能集F={f1,f2,..,fm}和数据集T={t1,t2,..,tn}。用户通过调用功能集中的一些功能模块,来存取数据集中的数据表。我们可以用图1说明它们之间的关系:
本文所要讨论的分布问题包括用户分布(User Distribution)、功能分布(Function Distribution)和数据分布(Data Distribution)。用户分布指的是根据系统的需求,决定如何在客户端各个平台上分配用户,即每个客户端允许哪些用户使用。功能分布也称处理(process)分布、事务(business)分布、逻辑(logic)分布,指的是如何在应用程序服务器各个平台上分配功能,即决定哪些功能适合在哪些平台上完成。数据分布的粒度大小可以是数据库、数据表、行、列等,我们这里讨论的数据分布逻辑单元是数据表(以下简称数据),数据分布指的是如何在数据库服务器各个平台上分配数据,即如何在服务器上组织这些数据。
二、耦合度的计算
在分布式MIS系统中,之所以有不同的客户端、应用程序服务器和数据库服务器,是因为用户之间、功能之间和数据之间也存在着一种类似的不同“吸引力”。我们将这种“吸引力”取名为耦合度(Coupling Degree)。我们将两个用户分在同一个客户端的可能性称之为用户耦合度,两个功能分在同一个应用程序服务器的可能性称之为功能耦合度,两个数据分在同一个数据库服务器的可能性称之为数据表耦合度。这里讨论耦合度,是因为耦合度是分布式MIS系统网络节点划分的依据。耦合度是不同种因素的函数。
耦合度=f(因素1,因素2,…,因素n)
用户耦合度 用户之间所属关系、距离和特殊要求等因素都可能影响用户耦合度大小。企业的部门和职务之间的所属关系构成一棵部门职务关系树或森林,叶结点为用户。直接同属一个部门的两个用户肯定比间接同属一个部门的两个用户分在同一个客户端的可能性要大。我们将两个用户到它们最近共同祖先的最大距离定义为两个用户之间的疏远度,当两个用户分属于两棵关系树时,它们的疏远度为¥ 。如图2所示的部门职务关系树中,用户u1(职务1)和u4(职务3)之间的疏远度为2,用户u1和u3(部门6)之间的疏远度为3 。疏远度越大其耦合度越小,我们给不同的疏远度以不同的权值,这样就可以折算为耦合度值。
两个用户相距400米以内肯定比两个用户相距1公里以上分在同一个客户端可能性要大。两个用户相距越近,其耦合度越大,用户相距远近给予不同的权值,以折算为耦合度值。针对企业的一些特殊要求,我们用程度词来说明两个用户分在同一个客户端的可能性,常见的程度词如必须、尽可能、不可能、不能等等,我们给不同的程度词以不同的权值,以折算为耦合度值。
功能耦合度 很明显,调用功能1的所有用户和调用功能2的所有用户之间的关系越紧密,这两个功能分在同一应用程序服务器的可能性就越大。这种用户调用功能的关系对功能耦合度影响较大,但其它因素也影响功能耦合度大小。
数据耦合度 功能存取数据的关系对数据耦合度影响较大。其它影响数据耦合度大小的因素包括数据库系统的特殊要求、MIS系统要求等。
三、 分布过程
用户、功能和数据分布主要是确立Client/Server系统结构。我们这里主要讨论基于耦合度的用户、功能和数据划分过程,用户、功能和数据耦合度是我们进行网络节点划分的依据。用户、功能、数据分布需要解决两个问题:1)MIS系统由多少个网络节点组成。2)用户、功能、数据是如何在这些网络节点上分配的。这两个问题的解决又是统一的,即如何进行网络节点的划分。下面我们以用户分布为例,来说明分布过程的具体步骤。
设企业的用户集合U={u1,u2,…um},Lu为客户端分组划分的用户耦合度下限。我们的目标是找出一个最小个数客户端集合C={C1, C2, C3,…, Ck},客户端C1, C2, C3,…, Cki U,满足(1) C1,+C2+ C3+…+Ck =U。(2)任意Ci∈ C,Cj∈C,i≠j 有Ci∩Cj=φ。(3)若RF(ui,uj)>=Lu,则用户ui,uj 就在同一客户端。
具体步骤如下:
第一步,计算用户之间耦合度。这里RFd (ui,uj) 、RFc (ui,uj) 、RFs (ui,uj)分别表示用户ui和uj之间由于距离、所属关系、特殊要求等因素影响的耦合度。
RF(ui,uj)= RFd (ui,uj) +RFc (ui,uj) +RFs (ui,uj)+…
第二步,求用户二元关系Ru。
Ru={<ui, uj > | " ui, uj ? U 且 RF(ui, uj)3 Lu }
第三步,求Ru的等价关系Ru挕?
Ru? t(Ru)
第四步,客户端划分C。
C=U/ Ru?/P>
分布是一个权衡的过程,不存在唯一正确的方案。必须兼顾目标与限制,综合考虑所有方面的因素。
四、分布的自动生成工具
我们设计和实现了一个MIS系统辅助开发环境NDTool(Node Distributed Tool),这是一个基于耦合度和领域知识的用户、功能和数据分布的自动生成工具。该系统设计过程贯穿了我们所提出的思想和方法。
ECSL(Enterprise Concept Structure description Language)是一个企业概念结构描述语言,主要用于获取最终用户所提供的企业的需求信息。采用中文的类自然语言形式,面向最终用户。
DKDL(Domain KnowledgeDescription Language)是一个领域知识描述语言,主要用于获取领域专家在MIS系统开发上所积累的经验,并将所得到的领域知识存放于领域知识库中。该语言面向领域软件专家。
领域知识库用于存放领域知识。由DKDL获取的领域专家的开发经验,经过分析、组织,所得到的结果保存在领域知识库中。我们提供一组领域知识库的操作接口,用于领域知识库的存取和维护工作。
MADL(MIS System Architecture Description Language)是一个分布式MIS系统体系结构描述语言,主要用于描述MIS系统中的用户、数据和功能的分布情况。它是NDTool系统最后生成的结果。该语言面向软件开发人员。
NDTool系统的工作流程。首先,将领域软件专家所掌握的领域知识,描述成DKDL文本,经过DKDL编译器的编译,并调用领域知识库的接口将所分析的结果存入领域知识库中。当需要开发MIS系统时,企业最终用户将他的需求信息用ECSL语言描述出来。通过ECSL编译器进行编译,参考领域知识库的有关领域知识,计算用户、功能和数据耦合度,再根据耦合度进行网络节点的划分,最后将结果用MADL语言描述出来。提供给开发人员进行数据模型和模块设计。
五、 结束语
本文围绕基于耦合度的Client/Server结构应用程序的分布过程及其自动生成工具的实现进行了讨论。分布问题具有一个不确定性的特点,同时分布将耗费开发者大量的精力。如何合理地设计分布构造方法以及设计分布的自动生成工具是Client/Server系统开发过程中一个重要问题。
参考文献:
[1] 陆汝钤,金芝,万荣林,夏幼明 基于领域知识的需求信息获取软件学报,Vol.7,No. 3,1996
[2] 赵洪彪,周立柱 Client/Server结构系统中的处理分布计算机科学,Vol. 24,No.5,1997
[3] 张左梁 C/S应用系统设计的新概念和新技术计算机科学,Vol.24,No.1,1997