网络爬虫技术在审计风险控制中的应用探究论文

2025-07-28 17:08:36 来源: 作者:xuling
摘要:大数据审计作为一种新型审计方式,日益受到关注。网络爬虫技术能够围绕审计目标,根据审计业务内容,自动抓取审计相关数据,提高数据采集效率。
[摘要]大数据审计作为一种新型审计方式,日益受到关注。网络爬虫技术能够围绕审计目标,根据审计业务内容,自动抓取审计相关数据,提高数据采集效率。文章提出运用网络爬虫技术下的大数据抓取手段,构建网络爬虫审计实施框架,阐述该框架下的具体审计工作过程,为传统审计提供补充证据,以应对传统审计过程中审计证据不足、质量不高等问题,从而发现审计问题和审计线索,降低审计风险,提高审计质量。
[关键词]大数据;网络爬虫技术;审计风险控制
1研究背景
大数据概念的产生给审计领域带来了巨变,越来越多的学者认为大数据技术能够显著提高审计效率[1-3]。2015年12月8日,中共中央办公厅、国务院办公厅印发了《关于完善审计制度若干重大问题的框架意见》《关于实行审计全覆盖的实施意见》等相关配套文件,提出构建大数据审计工作模式,提高审计能力、质量和效率,以及拓展审计监督的广度和深度。构建国家审计数据系统和数字化审计平台,积极运用大数据技术,加大业务数据与财务数据、单位数据与行业数据以及跨行业、跨领域数据的综合比对和关联分析力度,提高运用信息化技术查核问题、评价判断、宏观分析的能力[4]。2016年5月17日,中华人民共和国审计署印发《“十三五”国家审计工作发展规划》,要求加快审计信息化建设,加强大数据技术运用。积极应用云计算、数据挖掘、智能分析等新兴技术,提高审计效率。探索多维度、智能化数据分析方法。加强对各领域、各层级、各系统间数据的关联分析,增强判断宏观经济、感知经济风险等方面的能力。大力推进联网审计[5]。2018年5月23日,习近平主持召开中央审计委员会第一次会议时强调,要坚持科技强审,加强审计信息化建设[6]。2021年6月22日,中央审计委员会办公室、审计署印发《“十四五”国家审计工作发展规划》,要求全面贯彻落实习近平总书记关于科技强审的要求,加强审计技术方法创新,充分运用现代信息技术开展审计,提高审计质量和效率[7]。因此,运用大数据技术进行审计信息化建设迫在眉睫。
在传统审计模式下,审计人员只能分析被审计单位提供的数据,而不能有效采集和分析被审计单位外部的数据。这容易出现审计人员与被审计单位信息不对称的情况,难以准确评估与应对审计风险。大数据的出现给审计行业带来了机遇,也对审计工作提出了新的要求。大量学者研究发现,运用大数据技术进行审计有利于控制审计风险。尹京姬(Kyunghee Yoon)等人的研究表明大数据审计能够为传统审计提供更多证据,将传统审计获得的数据与大数据审计获得的数据相结合,能够有效降低审计风险[8]。
但是,大数据具有数据体量大、数据增长速度快、处理速度快、种类和来源多样化、数据价值密度低等特点。若审计人员通过搜索引擎在互联网采集被审计单位信息,那么工作量将变得非常大且不现实。基于此,本文提出一种基于网络爬虫技术的大数据审计方法,设计网络爬虫审计实施框架,根据审计业务内容,挖掘被审计单位的相关信息,为后续的审计工作提供更充分的审计证据,从而达到降低审计风险的目的。
2网络爬虫审计实施框架
2.1审计准备阶段
审计人员应与被审计单位沟通确定审计业务的性质和范围、审计的目标、审计工作的安排、管理层提供的工作条件和协助,确保审计人员不受限制地接触与审计有关的信息等,并充分了解被审计单位的性质、经营规模及组织结构,所属行业、业务性质及主要业务,治理层及管理层关键人员信息,诚信情况、经营状况及财务状况、内部控制状况、会计政策、关联方及其交易情况,据此完成业务承接评估。若接受业务委托,则签订审计业务约定书,制订审计计划。制订的审计计划应包括总体审计策略和具体审计计划。将网络爬虫技术用于具体的审计工作,实际上是由审计人员执行网络爬虫审计程序,从互联网上抓取被审计单位的各类数据,并将这些数据与被审计单位提供的内部数据相结合,以此为得出合理的审计结论、发表恰当的审计意见提供依据。
2.2审计实施阶段
2.2.1网络爬虫软件选择
笔者选择Python作为网络爬虫审计的语言。Python是一门很简便的计算机编程语言,比较适合新手学习。其易于扩展,拥有丰富而强大的库,可以用来挖掘不同类型的审计证据。因此,Python是将网络爬虫技术用于审计的最优语言。通过使用Python语言可以实现网络爬虫所需的数据采集、数据存储、数据处理、数据分析等功能。
要想运用Python工具实现网络爬虫审计,需要先完成Python开发环境的安装。安装Python时,通常需要单独下载并安装Python解释器,再通过pip等工具安装所需的第三方库。这个过程可能相对烦琐,尤其是涉及多个项目和不同版本的库时。随着网络爬虫技术的不断发展,技术人员研发了一款名为Anaconda的软件。
Anaconda是一个基于Python的开源发行版本,它提供了一个集成的解决方案,不仅包含Python解释器,还集成大量的科学计算和数据分析库,以及一个软件包管理系统。Anaconda的安装简单,打开Anaconda官方网站后,用户可以根据自己的操作系统选择相应的安装包进行下载,安装后,在Anaconda中可以直接使用Python语言代码挖掘包括企业经营状况等在内的各类数据信息。
2.2.2网络爬虫审计重点运用领域
(1)网络爬虫技术运用于审计风险评估。网络爬虫技术的重点运用领域首先是被审计单位的风险评估。审计人员运用大数据进行审计,必须采集包括企业所在行业环境、政策与监管环境、企业经营状况、关联方状况等在内的原始数据,这些原始数据可以通过网络爬虫技术采集。采集到原始数据后,将这些数据与被审计单位提供的内部数据进行结合,也就是将网络爬虫审计风险评估程序与传统审计风险评估程序相结合,从而识别和评估被审计单位的重大错报风险。
(2)网络爬虫技术运用于审计风险控制。审计人员需要以评估的重大错报风险为导向,设计和执行进一步审计程序。也就是说,审计人员要开展网络爬虫审计风险的控制,针对评估的各项重大错报风险再深入挖掘相关信息。审计人员以网络爬虫审计程序作为传统审计程序的补充,能够挖掘更充分的审计证据,从而达到降低审计风险的目的。
2.3构建网络爬虫审计模块
2.3.1行业环境审计模块
审计人员在构建行业环境审计模块之前,首先要根据企业主要经营活动等判断被审计单位的所归属行业。之后在网络爬虫审计实施框架中,由审计人员编写网络爬虫审计代码,挖掘被审计单位所属行业的市场动态与竞争态势、行业的关键指标及统计数据,生产经营的季节性和周期性特征,资源供应及其成本等数据。审计人员在挖掘到被审计单位的上述数据后,进行存储、整理和分析。通过将外部行业数据与被审计单位的内部数据相结合,审计人员能够发现被审计单位与所属行业整体经济行为的冲突点,从而识别和评估被审计单位的重大错报风险,对被审计单位重大错报风险实施进一步的审计程序,获取更多的审计证据,进而达到降低审计风险的目的。
2.3.2政策与监管环境审计模块
构建政策与监管环境审计模块,主要是为了获取与被审计单位有关的财政政策、货币政策等宏观经济政策,以及与被审计单位相关的包括法律法规和直接监管活动等在内的外部监督和管理数据,尤其是会对被审计单位经营活动产生重大影响、涉及企业盈利情况与整体运营情况的相关政策、监管信息。首先,审计人员通过网络爬虫技术采集与被审计单位有关的政策与监管数据,并对其进行归纳整理。其次,审计人员需要判断当前获取的政策与监管信息是否会对被审计单位产生影响及其影响程度。最后,审计人员将抓取的政策和监管环境数据与被审计单位提供的内部数据相比较,将网络爬虫审计与传统审计的风险评估程序相结合,对识别和评估出的重大错报风险进一步实施审计程序,从而为控制审计风险提供保障。
2.3.3经营状况审计模块
构建经营状况审计模块主要是为了运用网络爬虫技术抓取有关被审计单位经营状况的数据,将网络爬虫获取的经营数据与被审计单位提供的经营数据进行对比分析,评估从被审计单位内部获取的经营数据与网络爬虫获取到的经营数据是相呼应的还是相悖的。审计人员可以通过网络爬虫获取的经营数据,判断被审计单位的经营状况是否良好,外部评价是否正向,盈利能力是否较强等。若被审计单位的各类经营指标看起来非常“优秀”,而网络爬虫获取的数据显示被审计单位正在面临诉讼或者有极大可能面临诉讼、管理层变动较大、关联子公司发生股权交易或被抵押、网上负面评价过多,则审计人员应保持职业怀疑,对外部数据与被审计单位提供数据相互矛盾的情形保持警觉,质疑相互矛盾的审计证据的可靠性,并展开进一步调查,以确定需要修改哪些审计程序或实施哪些追加的审计程序,核查被审计单位提供证据的真实性和可靠性,从而加强对审计风险的控制。
2.4网络爬虫审计程序执行
网络爬虫审计程序执行包括数据采集、数据筛选和提炼、审计数据库的形成等步骤。审计人员根据构建的网络爬虫审计模块,可以通过网络爬虫技术采集被审计单位的相关信息。文章中的网络爬虫审计,是基于python计算机程序语言,在Anaconda软件中运行网络爬虫审计的代码,从而在网络中高效抓取审计人员所需的被审计单位信息。具体而言,审计人员在Anaconda软件中运行网络爬虫审计代码,抓取被审计单位的行业环境、政策及监管环境、经营状况、关联方情况等各类数据,初步获取被审计单位的数据信息,并对行业、政策、监管、关联方相关的审计证据进行筛选和提炼,从而生成审计数据库。尤其是要根据易于出现重大错报的财务报表项目及用传统审计方法推测被审计单位可能存在重大错报的财务报表项目。
2.5网络爬虫数据挖掘结果分析
审计人员运用网络爬虫技术挖掘被审计单位的行业环境、政策与监管环境、经营状况、关联方状况的数据,并对挖掘到的数据进行筛选、提炼,将处理后的大数据与被审计单位内部提供的数据进行比较分析,将网络爬虫审计程序与传统审计程序相结合,评估被审计单位提供的审计证据是否合理、是否符合其所属行业整体经济环境和发展趋势;评估被审计单位所面对的政策与监管环境是否会对被审计单位的经营活动产生重大影响、是否会对盈利情况产生重大影响。若有影响,评估被审计单位的财务数据是否考虑了政策及监管环境的影响;评估被审计单位提供的经营数据与外部获取的经营数据是否相匹配;评估被审计单位关联方是否存在异常交易。通过上述比较分析,评估被审计单位提供审计证据的真实性和可靠性,评估重大错报风险,并据此实施进一步的审计程序,从而达到控制审计风险的目的。
2.6审计结束阶段
审计人员根据被审计单位提供的数据及网络爬虫技术获取的数据进行筛选、提炼、分析后形成审计证据,归纳、整理形成的审计证据,据此对被审计单位作出综合评估,形成审计报告。同时,审计人员还需要评估客户持续经营能力,检查或有事项、检查期后事项等。审计人员出具审计报告并提出审计意见后,被审计单位应进行改进。另外,审计人员应归档整理审计底稿等各类审计资料,归还向被审计单位借阅的资料。
3结束语
大数据技术的出现给审计行业带来了机遇,也带来了新的挑战。本文提出运用网络爬虫技术下的大数据抓取手段构建了网络爬虫技术审计实施框架,阐述了该框架下具体审计工作的安排。网络爬虫技术可以帮助审计人员更高效地获得更充分的审计证据,从而降低审计风险。
主要参考文献
[1]程平,张雅頔.大数据时代基于云会计的审计实施框架构建[J].会计之友,2015(24):134-136.
[2]徐超.大数据背景下审计数据采集技术与方法的研究:以互联网金融企业专项审计为例[J].会计之友,2020(19):114-119.
[3]鲁清仿,梁子慧.大数据对风险导向审计影响的研究[J].河南师范大学学报(哲学社会科学版),2015(2):55-58.
[4]中华人民共和国中央人民政府.中*中央办公厅国*院办公厅印发《关于完善审计制度若干重大问题的框架意见》及相关配套文件[EB/OL].(2015-12-08)[2024-10-15].
[5]中华人民共和国中央人民政府.审计署发布《“十三五”国家审计工作发展规划》[EB/OL].(2016-06-02)[2024-10-15].
[6]中华人民共和国中央人民政府.习近平主持召开中央审计委员会第一次会议[EB/OL].(2018-05-23)[2024-10-15].
[7]中华人民共和国审计署.中央审计委员会办公室、审计署关于印发《“十四五”国家审计工作发展规划》的通知[EB/OL].(2021-06-28)[2024-10-15].
[8]YOON K,HOOGDUIN L,ZHANG L.Big Data as Complementary Audit Evidence[J].Accounting Horizons,2015(2):431-438.
