构建“供要管用”大数据治理体系的江苏税务实践
| 发布时间:2026-01-27 14:50 | 来源:中国税务报 | 字体:[ 大 ][ 中 ][ 小 ] | 打印本页 | 正文下载 |
大数据是深入实施数字化转型条件下的税费征管“强基工程”、打造效能税务的核心引擎。2025年以来,国家税务总局江苏省税务局落实国家税务总局部署要求,围绕税费数据这一重要资产,持续深化大数据“智能治”,将提高效率、创造效益、产出效果的目标要求,贯穿以用户需求为导向的数据采集、加工、分析、应用全过程,努力在税务领域将“苏大强”建成“数大强”。
构建大数据资源池
日均汇聚数据1.3亿条,覆盖1200个行业小类、951个外部门、302个互联网站……在江苏省税务局大数据“仓库”中,数以千亿计的税费数据量引人瞩目。
“‘数大强’的立身之本是能够最大限度占有数据、最大限度挖掘资源。我们通过广泛采集各类数据,数据自我供给度超过90%,有效解决了无数可用、数据不足、数据断档等问题。”江苏省税务局党委委员、副局长辛静杨表示。
翻开江苏省税务局制作的全省税务系统“数据字典”,琳琅满目的资源信息在井然有序的目录分类下显得层次分明。“我们根据不同数据来源、税费业务等特征,把涉税涉费数据分门别类存放。”江苏省税务局税收大数据和风险管理局局长殷松涛介绍道,“为方便检索,省局建立了‘数据字典’,可以快速定位到数据库、数据表和数据字段,需要时就像‘中医抓药’一样,随时随地知道所需数据放在‘哪一格’。”
除了日常通过征管系统采集的纳税人缴费人登记、申报、发票等数据,大量数据还来源于部门信息共享和互联网数据采集。近年来,江苏省落实《江苏省税费征管保障办法》,30多个省级部门定期向税务部门提供119类数据,市县层面税务局也与工信、发改、民政、市场监管等部门建立了常态化数据共享机制,税收共治“朋友圈”持续拓展。
针对上市公司减持等223类数据,江苏省税务局自主研发了互联网数据采集功能模块,运用实时网页解析、云端精准抓取等技术,从互联网采集涉税涉费数据10余亿条。“这些数据不是盲目采集,而是基于业务部门需求和基层实际征管需要有针对性地进行采集。”殷松涛说,“多样化采集形成了丰富的税务大数据资源池,既内嵌于实时业务,又用于后续信用和风险管理,为税费征管数字化转型添力赋能。”
形成多主题数据集
打开江苏税务大数据资源池,映入眼帘的首先是一张巨大的“蜘蛛网”,密密麻麻的黑色线段纵横交错。将之不断放大,就可以看到线段两端连接着不同的数据表,时刻不停地抓取着原始库中的生产要素,往税费数据加工装配“生产线”上运输传送。
“这张网反映的其实是基于数据主题应用的清洗、加工过程。”江苏省税务局数据加工团队负责人丁志勇举了一个例子,比如要统计小微企业相关信息,首先定位税务登记表,然后根据工信部划型标准对相关数据项打上标签,再把所有符合条件的数据抓取出来,便形成了彼此关联、专属小微企业的数据集。“整个过程好比厨师做菜,先采购、再配菜,最后才是烹饪。数据加工的过程就是‘洗、切、配’的过程。”丁志勇说,通过数据预处理,可以对特定群体、特定场景、特定事项分类归集,极大提高数据应用效率。

基于对海量数据运用的探索与实践,江苏省税务局构建起“清洗、转换、按时间聚合、按业务整合、按主题集合”的五层数据加工架构,形成涵盖近4万个分析维度的数据集,有效满足各类分析应用需求。
“省局预先加工好的数据,开放后我们可以直接使用。”南通市税务局税收风险管理局局长徐海斌表示,数据集为基层提供了一份份“预制菜”,可以方便基层快速定位数据异常,精准发现税收风险。“2025年省局定制了制造业数据集并向各地开放,我们针对南通纺织业特色,设计了相应的风险模型,直接使用省局数据集完成了风险扫描,省去了原来需要自行开展数据清洗、校验、加工的过程,而且在数据口径上实现了统一规范,相较于直接在原始数据上加工,效率提升了好几倍。”徐海斌说。
此外,江苏省税务局还应用数据缓存、数据抽取、任务调度等技术,最大限度提高数据处理速度。目前,已实现重要核心数据“当天生产—当天处理—当天使用”,统计分析数据“当天生产—夜间处理—次日使用”,有效解决数据静态滞后的问题,实现查询类业务“秒级”响应。
打造全业务产品库
在江苏省委网信办等5部门联合发布的2025江苏网络强省建设优秀实践成果公示名单中,江苏省税务系统创新打造的“基于税务垂直领域人工智能大模型的‘智’系列产品应用”榜上有名、位居前列。
辛静杨表示,江苏省税务系统基于数字化转型创新推出的数据“智能治”、税费“智能服”、申报“智能审”、风险“智能评”、日常“智能管”、决策“智能析”六大产品,都离不开大数据的支撑。
以税费申报“智能审”为例,通过相关有效数据的抓取分析,“智能审”可以在申报期内及时将涉税风险自动推送给纳税人自纠,实现纳税人“无痛”、税务人“无感”。据江苏省税务局征管和科技发展处处长段兵介绍,2025年以来累计通过“智能审”推送审核提醒8.32万户次,更正准确率超过90%,实现税款成效16.24亿元。
通过“智能服”推进税费诉求数据综合分析和“未诉先办”,人工服务量下降10%;建立2000多个分析指标开展“智能析”、近700个风险指标实施“智能评”,有力保障决策分析和风险管理……
随着“智”系列产品的广泛深度运用,江苏省税务系统向更加高效、便捷和智能化的方向不断迈进。在2025年国家税务总局“供要管用”税收大数据管理能力评价复评中,江苏省税务局以12项指标满分的佳绩名列前茅。
“江苏税务大数据平台提供了江苏经济运行的全景视窗,我们据此打造了‘江苏经济早感知’税收经济分析品牌,成为服务党委政府决策的重要参考。”江苏省税务局经济分析处副处长李军说,“全省税务系统2025年以来共向各级党政领导报送税收经济分析报告2123篇,以税资政能力不断增强。”
江苏税务大数据平台“年度使用热度排名”显示,2025年以来全省各级税务机关累计使用各类数据产品近3000万次;对于部分想自己动手“定制分析”的税务干部,省局还提供了智能分析工具,支持自由取数、自建模型、自主分析、自行验证,全程“零脚本”,极大降低取数用数门槛。
江苏省税务局党委书记、局长许光烈表示,将持续完善“供要管用”大数据治理体系,以“智能治”筑牢数字化转型之基,以“数大强”提升智能化征管之效,让海量数据资源和强大算法算力发挥更大作用,全力打造江苏税务大数据治理新样板。