公务员期刊网 论文中心 正文

标签画像技术在驱动税务管理中应用

标签画像技术在驱动税务管理中应用

摘要:税务部门是国家组织财政收入的门户,与社会公众的联系最为密切,在提升纳税人对政府治理效能认可度方面的“杠杆效应”最为显著。国家税务总局在全国税务工作会议上提出,要锤炼税收治理六大能力,充分发挥现代科技对税收治理的推进作用,实现科学、技术、管理向税收治理效能的高效转化。本文以纳税人需求为导向,以标签画像技术为驱动力,以实现税务管理与服务创新为目标,通过构建适应于不同业务情境的纳税人画像,为税务部门创造性地开展税收管理与服务工作提供方案策略。

关键词:纳税人画像;标签画像技术;税务管理与服务创新

当我们在浏览网页或者上网购物时,网站会自动弹出各种推荐信息,这些信息或多或少都与我们最近一段时间的兴趣或需求相关,网站就像我们肚子里的蛔虫,清楚地知道我们各自的需要,让我们忍不住想点进去看看———这便是利用数据抓取技术,在对用户数据进行深度分析之后实施的精准营销投放。这一技术已在电商平台得到充分运用,根据消费者的搜索频率和在网页的停留时间计算其偏好,进而提供“猜你喜欢”服务,这种“投其所好”式的营销策略,为平台创造了更多的交易机会。这一盈利模式的实现便得益于标签画像技术。

一、标签画像技术概论

用户画像(userpersona)最早由交互设计之父AlanCooper在其1999年出版的专著《TheInmatesareRunningtheAsylum》中提出,并指出Persona是真实用户的虚拟代表,是建立在一系列真实数据(Marketingdata,Usabilitydata)之上的目标用户模型。用户画像产生于用户信息,用户信息由静态信息和动态信息两部分组成。在纳税人画像构建过程中,像法人纳税人识别号、行业、地域、经济类型及自然人纳税人姓名、身份证号等涉及用户属性特征的数据,相对稳定;但像法人纳税人每期纳税申报数据、业务范围及采购、生产、物流等信息会随着生产经营行为不断累加,用户在系统中的每次行为都会使现有的用户画像丧失时效性。用户行为的多样性和易变性决定了用户画像的时效性很强,这就要求我们设计合理有效的动态更新机制,从而精准地刻画用户。同时,用户画像的动态性使其不可避免地具有时空局限性。在时间上,某一时刻的用户画像对该时刻的知识发现最为有效,距离时间越远,画像精准度越低,参考价值也越差。在空间上,不同的应用领域有着不同的侧重点。如果说营销领域的用户画像侧重于刻画用户的消费习惯,税务管理与服务领域的用户画像则重在发掘纳税人涉税业务的需求。因此需要针对不同的应用场景来设计画像,没有哪个用户画像一经构建就可以适用于所有的分析领域。

二、用户画像数据来源

1.用户属性数据。法人纳税人用户属性数据主要来源于“金税三期”税务登记信息。税务登记是税务机关依据税法规定,对纳税人的生产、经营活动进行登记管理的一项法定制度,也是纳税人依法履行纳税义务的法定手续。税务登记是整个税收征收管理的起点,包括开业登记,变更登记,停业、复业登记,注销登记,外出经营报验登记,纳税人税种登记,扣缴税款登记等,涉及法人纳税人生命周期的全过程。自然人纳税人用户属性数据首先来源于国家税务总局推出的个人所得税申报系统,该系统自2019年起正式运行,涵盖用户基础信息(包括姓名、性别、出生日期、纳税人识别号、学历、民族)、任职受雇信息、家庭成员信息、户籍所在地、经常居住地等信息,这是最全面和最权威的自然人纳税人信息,是自然人纳税人涉税数据分析的主要来源。另外,还有一部分未下载并注册个人所得税App的自然人,这部分自然人信息可以通过人口普查信息获得。借助第七次全国人口普查,可以获得人口数量、结构、分布和居住环境信息,全面获得居住在境内的自然人的姓名、性别、年龄、民族、受教育程度、行业、职业等信息。

2.用户行为数据。法人纳税人行为数据首先来源于纳税申报信息。申报信息是围绕不同税种所采集到的申报信息,如企业所得税申报表及附表、增值税申报表及附表等。其次,来源于发票信息。发票信息是企业发生交易的凭证,反映企业的上下游关系以及企业的交易行为,其所记载的税务活动颗粒度较细,是未经加工的原始数据,信息密度大,是税务大数据分析的金矿。最后,可以围绕企业生产经营的采购、生产、物流等环节获取最原始、最底层的信息。该部分数据的获取难度较大、价值密度较低,围绕数据的特征描述以及分析的对象不好界定;但数据轨迹是客观的,信息不易被篡改、真实性高。以上涉税活动是企业形成税务关系的基础,是税收大数据分析的支撑。除此之外,还可以通过网络爬虫技术获取法人纳税人办税人员、法定代表人、会计主管等在第三方平台的信息检索,了解其信息需求和利益关注点,为后续设计标签画像提供数据支持。自然人纳税人涉税业务较少,最主要的便是个人所得税的申报与扣缴,其行为数据来源渠道也较为单一,主要来源于个人所得税App系统,再就是利用网络爬虫技术获取自然人纳税人在第三方信息平台上的搜索信息,如在百度等搜索引擎上的查询信息,以了解纳税人的税务信息需求,为后续提供“量身定制”的税收宣传与服务奠定基础。

三、用户画像的构建

用户画像的构建离不开标签,用户属性及行为的标签化是画像建模的核心。对于“人”来说,可以通过对标签信息的加工,加上自身的知识积累,获得标签所要表达的完整语义,生成用户画像。如对于“男、吴京、战狼、爱国主义、动作片”这些标签,我们会很容易获得标签所要表达的语义信息。但对于计算机而言,这些标签只是一个个字符串,本身并不能折射出任何含义,计算机并不知道标签“战狼”是一部电影的名字,也不知道“吴京”是一个男演员的名字,更不知道“吴京”是电影“战狼”的男主角。如何让计算机“理解”这些标签,使计算机表现得具有“智慧”,帮助我们实现税务管理与服务的创新,这就需要借助数据处理的相关技术。本课题研究主要用到了基于本体的用户画像构建方法,从知识工程的角度出发,通过本体对用户画像中的标签进行表示、验证、推理和解释,利用本体中定义的结构化信息和关系信息来刻画用户。用户标签是构成用户画像的核心因素,是将用户在平台内所产生的行为数据以及属性数据,分析提炼后生成的代表用户某一类特征的符号。简言之,就是对收集到的用户属性数据和行为数据,根据不同的业务场景和研究需要,抽取其某一方面的共同特征,并给这些特征起一个精简并富有代表性的名字,便是标签。类似于文献检索过程中的关键词,它能帮助我们快速地检索并抽取出用户的某些特征。在分析过程中,我们只知道用户标签是远远不够的,我们还要知道标签之间的关联关系。大数据分析关注的是标签之间的关联关系,而非因果关系,需要从海量的数据中找到数据与数据之间的共同特征(标签),并积极建立标签之间的联系,这便构成了标签体系。

四、标签画像技术在驱动法人纳税人业务创新中的应用

1.让信用创造价值,沟通银企资金流。资金流是企业生存和发展的基础,如果把企业比作人,资金流则好比是血液。融资难是当前中小企业发展过程中的主要障碍,解决好融资问题是中小企业发展的关键。由于企业和银行之间的信息不对称,某些中小企业会在申请贷款时出具虚假信息,甚至造假财务报表,不向资金提供者披露企业的真实经营现状。金融机构为降低坏账损失率,在给中小企业提供资金支持时会附加更为苛刻的条件,直接导致一些优质的中小企业得不到资金支持,在其产业生命周期中,未能等到成熟期的到来,便倒在了成长期的路上。中小企业在缓解就业压力、促进社会稳定、优化经济结构等方面发挥着重要作用,从这众多的中小企业中筛选出具有成长潜力的优质企业,并予以大力扶持鼓励其发展,已成为一项刻不容缓的战略任务。我国的社会信用体系正在建设过程中,尚不健全和完善,使得信息获取成本升高,进一步加剧了银企间信息的不对称。税务部门掌握着大量的纳税人信息,金税三期已经实现了交易活动的全流程追踪,纳税人涉税信息的真实性与可靠性较高。因此,税务部门可以在资金提供者与资金需求者之间扮演“信息中介者”的角色,运用纳税人纳税信用等级遴选守法经营的优质企业,帮助资金需求者提供信用证明,让信用创造价值,同时可以在一定程度上为资金提供者筛选出优质客户,减少了银行的坏账损失,保证了银行资金的安全,实现银企间资金的健康流动。

2.沟通供产销,创造商机促成交易。产业循环是将资本、技术、劳动力等生产要素转化为产品,通过上下游企业间的资金支持、物流保障等,把生产领域创造的使用价值转化成现实的使用价值。产业内和产业间的投入产出关系链条,构成了国民经济活动的主要“动脉”。在统筹推进肺炎疫情防控和经济社会发展工作部署会议上指出:“产业链环环相扣,一个环节阻滞,上下游企业都无法运转。”要不失时机地畅通产业循环、市场循环、经济社会循环。发票上详细地记录了交易双方的名称、纳税人识别号、地址、电话、开户行及账号、提供产品和服务的名称、规格型号、数量、单价及金额等信息,税务部门可以通过金税三期平台获取这些数据,追踪交易活动的来龙去脉。正是基于此,疫情期间广东税务局率先开发了具备“寻找货源、谁找过我、我的需求、产品”功能的“广东省产业链智联平台”,这为我们深入挖掘发票数据的经济价值开辟了新的路径。税务部门可以根据掌握的法人纳税人发票信息,构建以产品和服务为主标签,以产品和服务的规格型号、产地、产能等为次标签的纳税人群体画像,充分考虑纳税人的信用资质,为纳税信用为A级(根据需要可以扩展至B级、M级)的纳税人构建个体画像,并将其优先推荐给以该纳税人提供的产品或服务为原料的下游生产商或分销商,让纳税信用创造价值,税务部门免费为纳税遵从度高的法人纳税人“做广告”,创造更多的交易机会,在为法人纳税人提供服务的同时,扩大了税基,活跃了市场经济。

3.深入推进“减税降费”,优化营商环境。继2019年第28个税收宣传月以“落实减税降费,促进经济高质量发展”为主题后,2020年第29个税收宣传月以“减税费优服务,助复产促发展”为主题,可见,减税降费是当前及未来一段时间助推经济高质量发展的重要政策工具。无论是创新驱动、创业鼓励,还是经济结构调整,税收的调控和引导都将发挥重要作用。随着减税降费持续深入,政策制定环节应充分考虑产业结构、行业特征,既要实行普惠性政策,降低宏观经济整体税负,提振市场主体信心,发挥积极财政政策的逆周期调节作用;又要根据不同产业(行业)的具体情况,该减税的减税,该降费的降费,设计差异化的税费优惠政策,实现“大水漫灌”与“滴水灌溉”的有机结合。税务部门可以借助税收大数据,结合法人纳税人所处行业、固定资产投资规模、科技创新投入规模及生产经营特点等这些异质性因素,来评价企业的税费负担,会使评价结果更为接近实际情况,同时也会使影响税收负担的因素清晰地显现出来。发挥税收大数据以税资政作用,不断强化数据分析应用,挖掘数据价值,展示数据应用成果,增强数据治税和数据服务能力。

五、标签画像技术在驱动自然人纳税人业务创新中的应用

1.税收宣传与服务的定制与优化。当下税务门户网站的信息宣传与服务多是以税务行政管理需求为导向的,我们每个人登录税务网站看到的信息是一致的,纳税人需要根据自身需求从海量的税务信息中筛选出我们想要的资料,这是一项相当耗费时间和精力,同时技术含量又不高的工作。在大数据时代,税务部门完全可以结合纳税人的属性特征,抓取纳税人是从哪个平台和网页跳转到本网站,前期点击了哪些页面、浏览了哪些条目,集中停留在哪些信息上这些行为特征,来获取纳税人的需求偏好,刻画出纳税人画像,提供类似于购物平台“猜你喜欢”服务,推出独具特色的“猜你需要”服务,将传统的“一对多”变成更具针对性的“一对一”,让税务网站的信息投放更为精准,为纳税人提供“量身定制”的服务。标签画像技术不仅可以有针对性地优化税务网站的运营,助力税务部门线上业务的开展,还可以通过纳税人线上涉税信息搜索量,判断本服务区域纳税人关注的热点信息,并以此来确定线下税收宣传与服务的方向和重点,优化税务资源配置,实现税务治理效能的提升。基于理性经济人“投入-产出”的考虑,在画像生成环节,税务部门对于纳税人画像的刻画应以群体画像为主,辅之以部分典型纳税人的个体画像。对于法人纳税人可以根据行业、类型、地域、主营业务等标签来生成画像,这主要是基于纳税人对税收优惠政策需求的考虑;对于自然人纳税人可以根据行业、职业、收入来源等生成画像,这主要是基于自然人纳税人涉税业务较少,最主要的便是个人所得税业务的处理。当然,这只是初步的设想,随着业务的深入开展,纳税人画像会逐渐优化和丰满起来。在信息推送时,相应地也会以共性内容为主,同时凸显个性内容,为纳税人提供具有针对性的差别化服务,满足不同纳税人的利益诉求。

2.架起招工与就业的桥梁。现阶段法人纳税人招工难、用工荒与自然人纳税人失业率高、就业难的问题同时存在,究其根本是人力资源供需的错配。随着金税三期在全国范围内的统一运行,税务部门掌握了大量的纳税人数据,完全有条件沟通两类纳税人的需求,实现人力资源供需的良性匹配。具体而言,金税三期依托统一的技术基础平台,征管过程覆盖了所有税种、所有主要工作环节,信息共享范围覆盖各级国、地税机关,并与有关部门联网,税务部门可以全方位地了解法人纳税人的生产经营信息;2019年由国家税务总局主要开发的个人所得税App全面运行,个人所得税App详细记录了纳税人的姓名、性别、出生日期、纳税人识别号(即身份证号码)、民族、学历、户籍所在地、经常居住地、电子邮箱等信息。同时,随着第七次全国人口普查的全面开展,可以得到最新、最权威的人口信息,涉及姓名、性别、年龄、民族,受教育程度、行业、职业、社会保障等信息,可以通过大数据技术实现自然人纳税人信息与人口普查信息的交叉比对与匹配,这样税务部门就可以刻画出较为全面的自然人纳税人画像,为后续工作岗位的推荐奠定基础。法人纳税人可以将用工需求,包括用工数量、岗位职责及对学历、技能、年龄、工作经验、地域等方面的要求传递给税务部门,税务部门首先根据其掌握的法人纳税人数据,对提报申请的法人纳税人进行资质审核。若通过资质审核,税务部门需要根据法人纳税人对岗位任职条件的优先级,将用工需求与前期刻画的自然人纳税人画像进行供需匹配,按照匹配度由高到低,通过个人所得税App推送给有就业需求的自然人纳税人,这一功能的实现并不困难,现行的个人所得税App中就已经具备了“公众服务”的功能,还可以通过该App向自然人纳税人注册邮箱,发送详细的法人纳税人用工需求和岗位职责。

参考文献:

[1]宋美琦,陈烨,张瑞.用户画像研究述评[J].情报科学,2019,37(04):171-177.

[2]费鹏,林鸿飞,杨亮,等.一种用于构建用户画像的多视角融合框架[J].计算机科学,2018,45(01):179-182.

[3]单晓红,张晓月,刘晓燕.基于在线评论的用户画像研究———以携程酒店为例[J].情报理论与实践,2018,41(04):99-104.

[4]黄文彬,徐山川,吴家辉,等.移动用户画像构建研究[J].现代情报,2016,36(10):54-61.

[5]汪剑锋,王会娟.私募股权投资与企业IPO绩效:基于PSM的新证据[J].统计与决策,2021(08):148-152.管理荟萃

作者:张作玲 单位:山东经贸职业学院