• 休闲生活
  • 教育教学
  • 经济贸易
  • 政法军事
  • 人文社科
  • 农林牧渔
  • 信息科技
  • 建筑房产
  • 环境安全
  • 当前位置: 达达文档网 > 达达文库 > 人文社科 > 正文

    基于Web的法律咨询系统的设计与实现

    时间:2020-10-19 07:52:05 来源:达达文档网 本文已影响 达达文档网手机站

    摘要:针对法律案例多样化,且法律条文中通常都含有大量专业性很强的法律专用语,使得法律按照条文来分析自身面临了很大难题,本文研究了基于Web的法律信息服务平台的设计与实现,将冗杂无序的网上法律信息进行统一搜集和分类,并提供了大量案例供用户阅读,为用户提供更多有价值的法律信息。系统主要功能有:商务实务查询,相关信息查询,用户权限管理,案例及其类别管理,法律法规及其类别管理,简易论坛,案例搜索,法律法规查询,相似案例查找等。本系统的核心功能是相似案例查找和关键字搜索功能,需要利用Lucene进行切词处理。相似案例查找功能逆向运用了KNN算法的思想,在切词处理后,形成空间向量,利用空间向量计算来分析两案例的相似度,从而实现了相似案例查找。为了实现关键字搜索功能,利用Lucene实现了对数据库中的案例的全文动态索引处理,从而提高了搜索速度和搜索精度。

    关键词:法律咨询;MVC三层结构;KNN算法;Lucene分析器

    中图分类号:TP302.1文献标识码:A文章编号:1007-9599 (2011) 04-0000-02

    Web-based Legal Consulting System Design and Implementation

    Huo Renchong1,Du Bin2,Wang Hui3

    (1.Teaching Affairs Office,Shijiazhuang Institute of Railway,Shijiazhuang050041,China;2.Beijing Railway Bureau,Electricity Department of Shijiazhuang,Shijiazhuang050043,China;3.Computer Department,Shijiazhuang Railway Institute,Shijiazhuang050043,China)

    Abstract:Aiming at the law case diversification and contains a lot of specialized legal language in the law,a Web-based legal information service platform for the design and implementation,will complex disorderly conduct on-line legal information collection and classification of unity and provide a large number of cases for users to read,to provide users with more valuable legal information.System main features are:business practice for relevant information,user rights management,and the type of case management,laws and regulations and category management,and simple forum,case search,for laws and regulations,and other similar cases to find.The core functions of the system is similar to cases of search and keyword search function,use Lucene to cut the word processing.Find similar cases reverse the KNN algorithm using,after all word processing,translate into a vector space.Then,use the space vector computing to implement the similarity of the two cases,thus achieving finding a similar case.In order to achieve the keyword search function,use Lucene achieved in the database case handling by the dynamic index,so as to enhance the search speed and accuracy of search.

    Keywords:Legal consultation;MVC three-layer structure;KNN algorithm;Lucene analyzer

    一、引言

    自中国加入世界贸易组织(WTO)后,中国巨大的发展潜力吸引了大批外商来大陆投资。为了在大陆投资,外商需要了解许多关于中国法律法规的信息。使外商以及国内合作投资者通过访问一个基于网络的一站式服务的法律相关网站,来方便快捷地获得必需的信息,是非常明智的选择[1]。另一方面,对于非法律专业的人士,在遇到法律问题的时候进行有效法律咨询的难度较大,利用网络上现有的搜索引擎也很难搜索到满意的答案和相似的案例,并且在信息筛选上会浪费大量的时间;再者,在大陆投资、建厂的程序通常需要投资者花费大量的时间和精力去阅读和搜集相关信息。

    然而,目前还没有专门应用于法律领域的决策支持系统。也就是说,在法律领域,决策支持系统的应用还处于未成熟阶段。而基于开放的网络的法律相关专业领域的共享平台,并可以让访问者相互交流经验和经历的法律决策支持系统更是前所未有的。

    本文对以上问题分析得出为了帮助使用者提高信息收集的效率,迫切需要建立一个适合于中国法律的基于网络的法律支持系统,提供法律咨询服务功能,包括对于中国法规和案件的全面搜索和信息检索、个体案件的类似案件及结论、企业建立的法律程序流程和企业注册应具备的条件等、法律合同和协议的样本,等等。本文设计并实现了基于MVC的法律咨询系统,在这个系统中,人们还可以分享他们的经验和经历,相互交流、提问,为遇到法律问题的人士和法律相关工作的专业人士提供一个交流的平台。

    二、系统设计

    (一)系统的体系结构。本系统在Eclipse集成开发环境下,基于JavaBeans技术和Sturts、Hibernate、DWR、Ext 框架实现了软件系统的三层架构[3],如下图1所示。其中,表示层为客户端提供对应用程序的访问,主要是接受用户的请求、显示返回的页面;同时采用了先进的AJAX技术实现了Web状态下的异步通信,利用了开源的Ext界面包,丰富了页面的展现形式,使页面具有了各种菜单,弹出窗口等丰富效果。利用DWR与Ext相结合,DWR与系统的表示层接口进行通信,传递请求和响应。DWR将得到的响应资料赋值给Ext进行显示。业务层用于处理业务逻辑、访问数据层,一方面,处理表示层收集过来的数据并传递给数据持久层持久化;另一方面,完成对数据的相应的业务处理;控制程序运行的全局变量。因而,业务层可进一步划分为业务逻辑层和数据持久层两个子层,数据持久层采用了Hibernate中间件,实现了ORM映像,即实现了对象与关系数据库之间的映像,从而在使用面向对象的编程语言Java中依然可以用对象的方式来存储对象信息;业务逻辑层主要完成对数据的相应的业务处理,包括查询,修改,删除,插入数据库。控制程序运行的全局变量;提供数据库操作储存过程的数据访问对象(DAO)。数据层是数据库或者数据源起到数据存储作用。

    (二)系统功能设计。本系统主要包括三个子系统:查询子系统、相关活动系统和后台管理子系统。其总体的功能模块框架如下图2所示:

    1.法律法规查询。用户可以通过关键字和信息类别两者或两者之一进行法律法规查询。还可以查询最新出台的法规。

    用户可以通过关键字和案例类别两者或两者之一进行案例查询。案例数据不仅包括案情,涉及人物,还包括案件结果和案件分析等具有很高参考价值的高价值信息。

    此功能为本系统的亮点功能之一。用户可以输入的新的案件,并选择涉及法律类型,之后系统通过搜索,比较计算,输出与用户输入案件较为相似的案例。若相似案例数目大于10,则根据案件胜诉和败诉情况做出用户输入案件的预期胜诉率。为用户提供决策支持。

    包括外商投资方式查询、外商投资程序查询和合同样本查询三个子功能。外商投资方式可查看列出的不同性质的公司的性质解释、特点和投资方式;外商投资程序列出了投资所要经过的具体流程;合同样本列出了各种不同种类的合同,并按所属领域进行归类排放,用户可根据需要查看具体某一种类的合同的样本。

    2.相关活动。包括国内法律部门查询、国内知名律师事务所查询和相关网站查询三个子功能。国内法律部门查询列出了国内各个省、直辖市、自治区的法院等法律部门供用户查询;国内知名律师事务所列出了国内知名的律师事务所的情况简介和网址供用户查看;相关网站列出了律师咨询网站等类型相近的法律网站供用户查看。

    此功能为一个简单的BBS论坛。可实现发帖、回复帖子、帖子浏览等论坛核心功能。用户登录后发帖或者回帖则显示用户名,用户若在未登录的情况下发帖或者回帖则在作者一项显示“***”,实现匿名发帖回帖功能。

    3.后台管理。包括案例管理、案例类别管理、用户管理、法律法规管理、法规类别管理几个子功能。分别用来实现对案例、案例类别、用户、法律法规、法规类别几个对象的更改、删除和增加。用户管理还包括权限更改。用户分为普通用户和管理员两种。管理员可以进入此模块,对网站进行管理。可以更改其他用户的权限。

    (三)系统数据流程设计。本系统的数据实现流程可分为以下5个步骤,1.首先由用户在此Web系统上注册,形成用户档案存储到服务器的数据库中;2.以后当用户再登录时就会调用用户档案,同时显示出用户浏览过的案例以及向用户推荐的案例;3.登录用户可以对案例进行搜索,也可以进行相似案例搜索;4.登录用户可以对法律法规进行查询,最终反馈给用户有法律法规数据和法律法规类别数据;5.登录用户可以通过本Web系统查询一些友情信息,比如国内的法律部门、法律的相关网站、各城市的律师事务所等,同时用户在本系统中进行交流,发表帖子和回复帖子。系统的流程如下图所示:

    三、系统技术应用

    本系统在进行相似案例查找时用到基于Lucene和KNN思想的算法,下面介绍下相关技术以及用到的算法。

    (一)算法描述。相似案例查找功能是本系统中最核心的功能之一。其实现算法可描述如下:

    1.要求用户输入案件,并对用户所输入的案件进行切词处理;

    2.去掉案情中存在的无意义的停用词;

    3.根据词语的词频给剩下的各个词语赋权重值;

    4.将词语和词语对应的权重存储在一个二维向量中;

    5.根据用户所选取的案件类别,对数据库中的案例进行搜索;

    6.将搜索所得的案例的案情也进行切词、去停用词处理;

    7.将每个案件筛选后所剩词语和词语对应的权重存储为一个二维向量;

    8.取其中由权重组成的一维向量,将根据用户输入案件所形成的向量与数据库中案例所形成的向量进行相似度比较,相似度比较由空间向量夹角计算的方法实现;

    9.当夹角的cos值大于0.65时,将案例输出;

    10.若相似案例大于10个,则通过相似案例计算出用户上传案件的胜诉率。

    通过以上步骤,最终可找出与用户所输入的案件相似的数据中已有的案例。并可以分析用户所输入的案例的胜诉率。

    (二)KNN算法的逆向使用。KNN算法是一种非参数的分类算法,又叫k最临近方法。该算法的基本思路是:在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的k篇文本,根据这k篇文本所属的类别判定新文本所属的类别[4,5]。

    本系统借鉴了KNN算法和分类思想,在系统中将此算法做逆向应用。即先给定新文本的类别,后在类别集中找出与新文本距离较近的几篇文本输出。

    当用户输入一篇新文档,并确定文档的分类后,系统将新输入的文档进行分词,去掉停用词,然后提取特征项,计算权重,再利用空间向量的知识将各个词的权重表示为一个空间向量,同时通过用户所选类别搜索出数据库中该类别的所有案例,也通过相同的方法表示数据库里相同类别中的现有案例,再利用向量夹角计算其相似度。若相似度达到一定程度,则判断该案例是用户所输入的案例的相似案例。

    (三)相似度比较法。本系统采用的是基于向量空间模型的相似度比较法,采用向量空间模型,用特征词条(T1,T2,…Tn)及其权值Wi代表目标信息,在进行信息匹配时,使用这些特征项评价新输入的案例文本与数据库中案例样本的相关程度[6]。

    假设用户给定的文档向量为di数据库中的某文档向量为dj,则两者的相似程度可用两向量的夹角余弦来度量,夹角越小说明相似度越高。相似度的计算公式如下:

    (5-1)

    通过上述的向量空间模型,文本数据就转换成了计算机可以处理的结构化数据,两个文档之间的相似性问题转变成了两个向量之间的相似性问题。使计算机判断两文本是否相似成为可能。

    (四)词语权重的计算方法。词语权重计算方法为词频统计权重法,如公式(5-2)所示:

    (5-2)

    公式(5-2)中的wik为<文档i>中<词语k>的权重;tfik是<词语k>在<文档i>中出现的频率;log(N/nk+0.01)是<词语k>在多义词所有义项词语中分布情况的量化,其中N为文档集合中的文档数目,nk为出现过<词语k>的文档数目;公式(5-2)的分母是对各分量进行标准化。

    公式(5-2)的提出是基于这样一种假设;对区别文档最有意义的词语应该是那些在文档中出现频率足够高,但在整个文档集合的其他文档中出现频率足够少的词语。可以看出,向量空间模型的量化基础是词语的出现频率和出现文档频率。

    (五)基于Lucene的切词方法。众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。把中文的汉字序列切分成有意义的词,就是中文分词,也称为切词。切词并计算好词语的权重后,将词语和对应的权重存储进一个二维数组中。因此该算法最后的返回值为一个二维数组。

    四、结束语

    本文全面阐述了一个基于Web的法律咨询系统的应用背景和开发过程、以及如何利用开源组件来实现快速开发,并对Lucene切词器的体系结构,如何实现快速、准确分词进行了研究,同时还在相似案例查找部分实现了一个基于空间向量计算的相似度比较算法,实现了良好的相似案例查找效果。除此之外,在关键字搜索功能实现上,实现了利用Luecen对数据进行全文索引,利用索引进行搜索的快速关键字搜索功能。

    参考文献:

    [1]Kwok Kwun Fung.Web-based Legal Advisory System[M].2001

    [2]中国法律信息平台门户系统信息[DB/CD].http://china.npicp.com/touzi/detail/1-11093.html

    [3]刘冰,卢秀山,赵红波,石奉华.基于.NET的煤矿安全监测系统的设计与实现[J].计算机应用,2007,27(6):392-394

    [4]郭躬德,黄杰,陈黎飞.基于KNN模型的增量学习算法[J].模式识别与人工智能,2010,5

    [5]来羽.基于分类算法的可视化技术研究[J].煤炭技术,2010,10

    [6]汪忠国,吴敏.基于向量空间模型的题库相似度检查算法[J].计算机系统应用,2010,3

    相关热词搜索: 法律咨询 设计 系统 Web

    • 生活居家
    • 情感人生
    • 社会财经
    • 文化
    • 职场
    • 教育
    • 电脑上网