基于互联网数据的税收风险管理方案

税收风险管理方案
一、背景
1、信息技术发展背景
近几年,信息技术快速发展,特别是近两年,云计算、大数据技术的蓬勃发展,核心技术从概念到理论,从实验环境到成功落地,反过来又推动了技术的进一步发展。随着网络带宽的不断拓展以及移动互联网的快速发展,信息应用系统迅速的从电脑终端,拓展到平板、以及手机终端,信息技术叠加移动互联网的快速发展,推动了各行各业的信息化发展,对政府部门的信息化和现代化提出了更高的要求。特别是国务院印发了《关于积极推进“互联网为+”行动的指导意见》,开启了我国通往“互联网+”时代的大门,对政府部门的信息化提出了更高的要求。
长期以来,税务系统积极利用现代信息技术改造、提升税收管理服务等核心内容,取得了显著成绩。在上世纪90年代起,税收征管信息化就逐渐起步,从金税一期、二期、三期的不断推进,着力把税收工作放在“网”上运行,用先进的信息系统支撑复杂的税收业务系统。国家税务总局局长王军一针见血的指出,没有税收信息化,就没有税收现代化,提出了在2020年基本实现税收现代化的奋斗目标。在税务系统信息化过程中,要“善假于物”,利用“互联网”技术,形成“互联网+税务”规划和行动方案,在办税服务上,开发电子税务局,实现纳税人足不出户办税;在税收征管上,加强新技术的运用,建立数据分析大数据平台。
2、互联网+
在国家“互联网+”战略提出后,各部门、行业相继推出了“互联网+医疗”、“互联网+物流”等等,各行各业都在积极探索在新常态下的转型升级,越来越多的数据通过互联网发送、传播、存放,反映企业基本信息、经营信息、投资信息等,互联网上的信息越来越多,占比越来越广,类型也越来越丰富。由于互联网数据涵盖企业库存管理、采购销售、财务核算等,所以数据真实可靠,通过与税务机关内部的纳税人申报数据比对,直接就可反映企业申报的真实性和准确性,方法简单,应对有效。当然在互联网上,还存在很多其他类型的数据,并不能用传统的二位关系表来存放,以往对该类型的数据,只能舍弃,但从实践经验来看,此类信息能很好的印正企业的实际经营情况,如签订的合同、人员的招聘等等。在市场经济快速发展的推动下,企业的经营方式越来越复杂,相对而言,税务部门管理方式还是延续传统的方式,通过数据的简单比对,根据个人经验,设计指标体系来揭示企业可能存在的风险,面临疑点信息不够有效、分析过程不够全面等不不足。
在税务总局的规划指导下,各地税务系统积极开展“互联网+税务“行动计划,江苏省苏州市国税局以“智慧苏州”为抓手,打造网上纳税服务体系;深圳市国税局坚持“痛点思维”,加快建设“互联网+电子税务局”等等。从各地实践来看,在纳税服务领域,运用互联网思维,比较好探索尝试,就是把实体办税厅办理的业务移植到网上,通过互联网办理,可以用电脑、平板、手机等多终端办理,方便纳税人办税。同时通过各服务平台信息的推送、税企互动交流,纳税人通过多种渠道,可以获取相关信息,为纳税人提供服务。
3、税收风险管理分析
是在税收管理方面,很少提到用互联网+思维方式,尤其是在税收风险管理方面,分析其原因主要存在以下几个问题:
1、风险分析以纳税人申报数据和税务部门内部数据为准,很少拓展到其他数据来源;
2、风险分析以结构化数据为主,很少涉及非结构化数据;
3、由于缺乏平台的支持,数据的分析以简单比对为主,较少涉及数据模型的建立和数据挖掘算法的实现。
基于以上分析,在“互联网+”时代,急需要打造一个平台,通过通用采集和非定点采集程序,自动获取企业在互联网上的各类信息,包括电商数据、招投标数据、行业网站数据、土地市场网、团购网、上市公司信息、招聘信息、经营合同、信用评级等,并通过接口获取政府部门第三方信息,以及税务部门内部数据,通过整合筛选后,形成反映企业全貌的信息,为税务部门管理,包括风险分析和风险应对提供帮助。
二、 大数据应用平台介绍
2.1 建设目标
大数据应用平台的建设目标为建立一体化涉税数据应用的平台,完成数据的采集、整合、分析等功能,为税务部门管理提供支撑。
平台的主要特点包括:
1、自动化
数据的采集、筛选、整合、分析,都由平台按照预先的设定自动完成;
2、一体化
平台包含数据加工以及分析应对功能;
3、智能化
基于Hadoop大数据架构的平台,利用数据挖掘算法,实现数据的增值利用;
4、便捷化
使用人员只要轻点鼠标,即能获取相关信息,得到所要结果。
大数据应用平台实现海量互联网数据采集,数据类型更广,不仅局限于结构化数据,还包括半结构化和非结构化数据,对半结构化数据,通过语义分析,结构化后入库,对非结构化数据,可以通过应用模型,实现自动分类。实现数据的整合,利用数据挖掘算法,从海量互联网信息中挖掘有价值的数据,通过数据的清洗、加工、转换,并按照单户纳税人进行归集,形成针对纳税人的全景展示。
互联网数据的采集方法分两种:
一种是通用信息采集,通过设定采集路径、网址,把相关数据从互联网上采集过来,并通过语义分析,结构化后保存到数据库中;
一种是非定向采集,通过纳税人名称等关键字的设定,获取排名靠前的信息,把网页信息保存下来,并相关关键字建立分词索引,为网页的检索提高效率。实现数据的全景展示,不仅能显示表单、文档,还要能查看图片、收听音频、播放视频等多种类型的文件。
平台提供接口,通过接口调用,可以从其他应用系统中接收数据。
2.2功能定位
(1)数据采集
%e6%95%b0%e6%8d%ae%e9%87%87%e9%9b%86%e6%a1%86%e6%9e%b6%e5%9b%be
通用信息采集,通过项目设置菜单,定期采集相关数据,并通过语义分析,把采集后的数据结构化后,保存到数据库中。通用信息采集内容,可由使用人员自行维护,根据需要增加、减少采集内容,目前主要包括上交所和深交所公告信息、证券投资基金信息、招标网中标信息、淘宝店铺信息、淘宝拍卖信息、天猫店铺成交信息、土地拍卖信息等。非定点采集,主要获取单户企业在互联网上有价值的信息,通过搜索引擎,获取企业相关信息,如地址、电话等基本信息,投资、签订合同等经营信息等。非定点采集,需要解决两个问题,一是要能获取到信息,二是通过算法设计,对获取的信息进行筛选,过滤没有价值的信息,得到有价值的数据。
(2)数据整合加工
对采集的互联网信息,经过整理加工后,对结构化数据直接入库,非结构化数据,进行分类后存放大大数据平台。基于底层Hadoop大数据架构的数据平台,具有整合各类数据的能力,总的来说,分为互联网信息、第三方数据、税务部门内部数据以及企业内部数据等,数据可以是结构化的,也可以是非结构化的。在整合各类数据的基础,数据平台支持分析人员使用数据,对数据进行分析建模,查找风险企业,同时,运用大数据技术,通过数据挖掘算法的实现,进行关联性分析等,让数据发声,最大限度提高分析效率、提高风险对象的命中率。
(3)数据的展示
数据平台要方便检索、展示多种类型数据,包括图片、音频、视频等非结构化数据和传统的结构化数据,而且不需要安装客户端程序,只需要用浏览器就能实现文件的浏览、数据的分析,对数据平台中数据,提供按户归集、全景展示功能。方便对单户企业进行分析,数据范围包括互联网信息、第三方数据、税务部门内部数据以及企业内部数据,反映企业基本信息、经营信息、投资信息、申报信息、纳税信息等等,形成内容完整、重点突出的纳税人画像。

2.3使用对象
需要进一步细化
本平台使用对象为税务部门管理人员,包括风险分析人员和风险应对人员。
(1)风险分析人员,通过平台的互联网信息采集功能,以及后续的数据整合、加工、分析功能,使用平台的数据比对、模型建立等工具,从宏观比较,到中观趋势,再到微观观察,通用行业类比,从海量纳税人中有针对性的查找风险企业,并能提供疑点报告,为风险应对人员提供支持。

(2)风险应对人员接收到企业应对任务后,通过数据平台提供的疑点报告,以及强大的单户分析功能,可以对该户企业进行全方位体检,简单明了的掌握企业信息,分析存在的疑点,指出存在的风险,方便快捷的完成案头分析工作,并可以把应对过程中发现的线索、收集的数据、整理的材料,上传到数据平台,反映整个应对过程、应对结果,企业风险排除情况,丰富企业信息。

三、功能菜单
1、系统设置
用于项目运行所需要的一些系统设置,包括项目配置、权限管理等。
(1)项目设置
进行定点采集项目的配置,通过配置,自行增加可以结构化互联网信息的采集。如下图所示:

(2)项目子项设置,用于设置每个项目中相关子项的设置。如大小非项目中,有关股东信息、发行信息等,设置链接、采集周期、是否全量采集等。如下图所示:

(3)采集字段设置:
用于把信息结构化后,存放到数据库表中,为数据的利用做准备。如下图所示:

2、任务管理
用于采集任务的管理,包括采集时间、周期的设定等。并记录采集持续的时间,采集的数据大小、是否发生错误等日志信息。

3、数据匹配
把通过互联网采集的数据,与机内纳税人匹配,为数据的分析利用做准备。包括自动匹配、手工匹配、建立匹配规则等。

把互联网采集的数据,通过纳税人名称、税号、工商登记证号等关键字与税务部门登记信息进行比对,对能匹配到的信息,自动匹配并建立匹配规则。对不能精确匹配的,提供模糊匹建立配功能,由操作员自行选择匹配对象,建立匹配规则并保存匹配规则,以后数据就按照建立的匹配规则自动匹配,不再需要人工干预了。

4、数据管理
通过数据管理功能,把互联网采集数据、政府部门涉税数据、税务部门内部数据以及其他数据按户归集。通过数据交换,可以把互联网采集数据与税务部门内部数据进行整、比对,同时预留接口,方便接入政府部门涉税数据以及其他各类数据。

5、数据分析
通过数据管理功能,平台整合了四大类数据,包括互联网采集数据、政府部门涉税数据、税务部门内部数据以及其他数据,不仅限于结构化数据,还包括非结构化数据。在此基础上,风险分析人员可以通过数据的整合,风险指标的自行设置,内外数据的比对,查找风险企业。风险应对人员通过一户式功能,可以查询该应对企业的所有涉税信息,包括结构化数据以及各类非结构化数据,并可以直接浏览,不需要安装插件。
一是实行简单比对,如电商数据与内部申报数据的比对
二是精选现有的指标,形成体系,

下一篇:

相关新闻