最新税务政策法规查询方法、计算机设备和存储介质与流程

将乐信息网 http://www.jianglexinxi.cn 2020-10-18 18:23 出处:网络
这里介绍的最新税务政策法规查询方法、计算机设备和存储介质与流程,小编精心为广大网友推荐内容

这里介绍的最新税务政策法规查询方法、计算机设备和存储介质与流程,小编精心为广大网友推荐内容


本申请涉及数据处理技术领域,尤其涉及一种税务政策法规查询方法、计算机设备和存储介质。



背景技术:

近些年来,随着计算计算技术的广泛应用于发展,标准的数据存储形态已由纸质转变为电子文本,由此对文本的查询也从人工查询转变为电子数据的检索。具体的电子数据的检索分为结构化和非结构化数字两种;结构化数据具有固定格式和有限的长度,例如数据库、元数据等;非结构化数据无固定长度和固定格式。

税务政策法规数据属于结构化数据,目前对于此类的结构化数据采用数据库全表扫描的方式或者采用视图的方式进行检索查询;采用此种方式进行税务政策法规查询存在效率低、以及对数据库服务器消耗大的问题,给用户进行税务政策法规查询带了诸多不便。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种税务政策法规查询方法、计算机设备和存储介质。

一种税务政策法规查询方法,所述方法包括以下步骤:

采集政策法规数据;

对所述政策法规数据进行分词处理后投入预设的若干个域中,以建立索引库,其中,所述索引库的索引信息与所述预设的若干个域中的预设检索域一一对应;

获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息;

根据所述索引信息向用户进行展示。

在其中一个实施例中,所述方法还包括:

获取用户输入的联查指令,其中,所述联查指令为至少一个所述关键词对应的索引信息的选择指令;

根据所述联查指令和所述预设的若干个域中的预设联查域对与被选择的索引信息对应的政策法规数据进行全文展示,其中所述预设联查域包括所述政策法规数据的完整id。

在其中一个实施例中,所述采集政策法规数据的步骤包括:

登录gs系统,通过所述gs系统的政策法规模块中获取所述政策法规数据。

在其中一个实施例中,所述采集政策法规数据的步骤包括:

运用爬虫技术从税局网站抓取政策法规数据,并将所述政策法规数据存入所述gs系统,并更新政策法规模块的数据。

在其中一个实施例中,所述对所述政策法规数据进行分词处理后投入预设的若干个域中,以建立索引库的步骤包括:

采用分词算法对所述政策法规数据进行分词处理得到分词信息;

对所述分词信息进行筛选,并将筛选后的分词信息切分成内容、标题、标签和税种作为所述预设检索域。

在其中一个实施例中,所述分词算法包括一元分词算法、二元分词算法或盘古分词算中的至少一种。

在其中一个实施例中,其特征在于,所述获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息步骤包括:

利用通配符查询、跳跃查询和模糊查询中的至少一种从所述预设检索域中查找包含所述关键词的全部数据;

将所述包含关键词的全部数据作为所述关键词的索引信息。

在其中一个实施例中,所述获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息的步骤还包括:

对所述用户输入的关键词进行分解处理,以得到汉字和非汉字;

将所述汉字进和所述非汉字分别与所述预设检索域进行匹配,以得包含所述汉字的查询结果和所述非汉字部分的查询结果。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以上所述方法的步骤。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上所述方法的步骤。

上述税务政策法规查询方法和计算机设备,通过采集的政策法规数据生成索引库,并利用索引库匹配查询用输入的关键词对应的索引信息,从而将索引信息展示给用户,此方法无需直接对数据库进行检索,避免了对数据库服务器的消耗,大大提升了查询效率,具有较佳的易用性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。

图1为一个实施例中一种税务政策法规查询方法的流程示意图;

图2为另一个实施例中建立索引和联查的整体流程示意图;

图3为又一个实施例中计建立索引库步骤的流程示意图;

图4为一个实施例中获取索引信息的流程示意图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。

需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。

在一个实施例中,请参照图1所示,提供了一种税务政策法规查询方法,具体的该方法包括以下步骤:

s200,采集政策法规数据。

s400,对政策法规数据进行分词处理后投入预设的若干个域中,以建立索引库;其中,索引库的索引信息与预设的若干个域中的预设检索域一一对应。

s600,获取用户输入的关键词,并将关键词与预设检索域进行匹配,得到关键词对应的索引信息。

s800,根据索引信息向用户进行展示。在实施过程中用户还可以根据需求将索引信息中关键词采用颜色显示。例如采用content=content.replace(originaltext,"<spanstyle=\"color:red\">"+originaltext+"</span>");以将关键词显示成红色。

上述税务政策法规查询方法通过采集的政策法规数据生成索引库,并利用索引库匹配查询用输入的关键词对应的索引信息,从而将索引信息展示给用户,此方法无需直接对数据库进行检索,避免了对数据库服务器的消耗,大大提升了查询效率,具有较佳的易用性。

在又一个实施例中,请参照图2所示,在前述实施例的基础上本发明方法还包括:获取用户输入的联查指令,其中,联查指令为至少一个关键词对应的索引信息的选择指令。

根据联查指令和预设的若干个域中的预设联查域对与被选择的索引信息对应的政策法规数据进行全文展示;其中预设联查域包括政策法规数据的完整id。

需要特别说明的是,前一个实施例能够将查询到的信息简明扼要的通过前台展示给用户,而本实施例在用户输入的联查指令时方便用户从已查询到的索引信息中进行更详细的查询,例如将索引信息超链接到原始采集的政策法规数据,从而方便用户任意查询和联查相关信息。

在另一个实施例中,前述步骤采集政策法规数据包括以下两种方式:

第一种是登录gs系统,在税务管理的税务政策法规模块维护字号、发文单位和所需标签,通过在政策法规和政策法规解读功能中增加相应的政策法规和解读,例如通过手工录入的方式。另一种是运用爬虫接收从税局网站抓取政策法规数据,批量存入gs系统,从而得到政策法规数据。

上述税务政策法规查询方法通过不同的方式获取政策法规数据,不仅便于适应更新的政策法规数据,而且适合不同情形下用户的数据采集,提升了本方法的易用性。

在又一个实施例中,请参照图3所示,前述步骤s400具体包括:

s420,采用分词算法对政策法规数据进行分词处理得到分词信息。

举例来说,分词算法具体包括一元分词算法、二元分词算法或盘古分词算中的至少一种。假设政策法规数据为“国税总局关于增值税改革的若干意见”;采用一元分词算法得到的分词信息如下“国、税、总、局、关、于、增、值、税、改、革、的、若、干、意、见”;采用二元分词算法得到的分词信息如下:“国税、税总、总局、局关、关于、于增、增值、值税、税改、改革、革的、的若、若干、干意、意见”。

s440,对分词信息进行筛选,并将筛选后的分词信息切分成内容、标题、标签和税种作为预设检索域。

具体的,若分词信息中存在语气词、英文连接词等不包含关键信息的词将会在筛选时去掉,进而使得索引库中的每一个索引信息缩小,保证查询效率、提高关键信息查询的命中率。

实施过程中可以采用如下程序代码:

在实施过程中,分词、域确定好后,需要将数据存储到指定的位置,该存储位置即可以是物理路径,也可以是内存。用户新增或者编辑数据的时候,触发保存操作,会生成或更改对应的索引信息,删除相应文件时,也会删除相应索引;此外,支持用户一键建立索引,即清空历史索引,将目前所有数据一键重新建立索引,具有较好的灵活性。

在另一个实施例中,请参照图4所示,前述步骤s600具体包括:

s620,利用通配符查询、跳跃查询和模糊查询中的至少一种从预设检索域中查找包含关键词的全部数据。

例如采用通配符查询包含关键字的所有索引的程序代码如下:

querycontentquery=newwildcardquery(newterm("content","*"+text+"*"));

querytitlequery=newwildcardquery(newterm("title","*"+text+"*"));

querylabelquery=newwildcardquery(newterm("label","*"+text+"*"));

querytaxcategoryquery=newwildcardquery(newterm("taxcategory","*"+text+"*"));

以及采用跳跃查询以支持跨字查询的程序代码如下:

上述实施例中假设用户输入的关键词为“国税”根据用户的需求设置合适的步长包含“国家税务总局”词语的情形也将被查询到,最后将配符查询和跳跃查询的语句,统一添加到模糊查询中,由此便可以一次查询出符合上述所有条件的索引数据。

s640,将包含关键词的全部数据作为用户输入的关键词的索引信息。

在实施过程中由于后续展示过程中为了方便用户查看,可以将关字前后15个字符左右的内容(具体显示的长度可以由用户根据需求设置),从而实现简明概要的展示信息,并且具有较好的可读性。

在又一个实施例中,前述步骤s600还包括:

对用户输入的关键词进行分解处理,以得到汉字和非汉字;在实施过程中可以采用如下代码:

将汉字进和非汉字分别与索引库进行匹配,以得包含汉字的查询结果和非汉字部分的查询结果,并将查询结果作为关键词对应的索引信息。

应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

根据本发明的另一方面,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现以上所述的税务政策法规查询方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

根据本发明的又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以上所述的税务政策法规查询方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。


技术特征:

1.一种税务政策法规查询方法,其特征在于,所述方法包括以下步骤:

采集政策法规数据;

对所述政策法规数据进行分词处理后投入预设的若干个域中,以建立索引库,其中,所述索引库的索引信息与所述预设的若干个域中的预设检索域一一对应;

获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息;

根据所述索引信息向用户进行展示。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

获取用户输入的联查指令,其中,所述联查指令为至少一个所述关键词对应的索引信息的选择指令;

根据所述联查指令和所述预设的若干个域中的预设联查域对与被选择的索引信息对应的政策法规数据进行全文展示,其中所述预设联查域包括所述政策法规数据的完整id。

3.根据权利要求1或2所述的方法,其特征在于,所述采集政策法规数据的步骤包括:

登录gs系统,通过所述gs系统的政策法规模块中获取所述政策法规数据。

4.根据权利要求3所述的方法,其特征在于,所述采集政策法规数据的步骤包括:

运用爬虫技术从税局网站抓取政策法规数据,并将所述政策法规数据存入所述gs系统,并更新政策法规模块的数据。

5.根据权利要求1或2所述的方法,其特征在于,所述对所述政策法规数据进行分词处理后投入预设的若干个域中,以建立索引库的步骤包括:

采用分词算法对所述政策法规数据进行分词处理得到分词信息;

对所述分词信息进行筛选,并将筛选后的分词信息切分成内容、标题、标签和税种作为所述预设检索域。

6.根据权利要求5所述的方法,其特征在于,所述分词算法包括一元分词算法、二元分词算法或盘古分词算中的至少一种。

7.根据权利要求1或2所述的方法,其特征在于,所述获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息步骤包括:

利用通配符查询、跳跃查询和模糊查询中的至少一种从所述预设检索域中查找包含所述关键词的全部数据;

将所述包含关键词的全部数据作为所述关键词的索引信息。

8.根据权利要求7所述的方法,其特征在于,所述获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息的步骤还包括:

对用户输入的关键词进行分解处理,以得到汉字和非汉字;

将所述汉字进和所述非汉字分别与所述预设检索域进行匹配,以得包含所述汉字的查询结果和所述非汉字部分的查询结果。

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。

技术总结
本申请涉及一种税务政策法规查询方法、计算机设备和存储介质。所述方法包括:采集政策法规数据;对所述政策法规数据进行分词处理后投入预设的若干个域中,以建立索引库;其中,所述索引库的索引信息与所述预设的若干个域中的预设检索域一一对应;获取用户输入的关键词,并将所述关键词与所述预设检索域进行匹配,得到所述关键词对应的索引信息;根据所述索引信息向用户进行展示。采用本方法通过采集的政策法规数据生成索引库,并利用索引库匹配查询用输入的关键词对应的索引信息,从而将索引信息展示给用户,此方法无需直接对数据库进行检索,避免了对数据库服务器的消耗,大大提升了查询效率,具有较佳的易用性。

技术研发人员:徐敬梁
受保护的技术使用者:山东浪潮通软信息科技有限公司
技术研发日:2020.02.29
技术公布日:2020.06.26

最新税务政策法规查询方法、计算机设备和存储介质与流程的相关内容如下:

本文标题:最新税务政策法规查询方法、计算机设备和存储介质与流程
http://www.jianglexinxi.cn/yanergaozhi/523006.html

0

精彩评论

暂无评论...
验证码 换一张
取 消