MSP #1:自愿遵守
美国国税局过于注重所谓的“执法”收入和生产力,没有充分利用行为研究洞察来提高自愿纳税遵从率
美国国税局过于注重所谓的“执法”收入和生产力,没有充分利用行为研究洞察来提高自愿纳税遵从率
采用随机对照试验(RCT)定期测试行为洞察(BI)的程序,以确定哪些程序对各种合规问题和纳税人群体最有效。
国税局对建议的回应: 美国国税局所采用的方法以《2014 年总统经济报告》第 7 章《评估作为改进联邦计划的工具》为指导,其中概述了进行严格影响评估的方法:
“强有力的影响评估需要一种构建更有效的比较的策略——具体来说,就是确定‘治疗’组和‘控制’组,这些组的结果差异可以合理地归因于计划或干预,而不是其他因素。使用严格、高质量的方法进行的影响评估提供了最大的信心,即该计划所针对的结果的观察变化确实归因于该计划或干预。”
报告还概述了可用于创建有效比较组的方法类型。“虽然经典的影响评估设计需要将接受者随机分配到实验组和对照组,但有时可以通过利用产生随机性的自然变异来实现构建有效比较的目标,这种方法称为准实验。准实验比传统的大规模随机分配实验要便宜得多。”美国国税局采用随机对照试验和准实验环境分析进行行为洞察测试,目的是加强纳税人服务和执法。当前和最近的努力包括报告、归档和付款合规推动、推广使用 IRS(例如电子支付)和合作伙伴(例如 VITA)服务、促进自愿遵守的因素的准实验分析(1099-K、1099-B 基础报告、FATCA 和 OVDP,以及先前执法工作的影响)、鼓励接受税收优惠的推动(例如 EITC 和 AOTC)以及各种行为推动以促进问题解决和未来合规(收集中的例子包括就业税早期干预试点、两个通知重新设计试点、一个预先通知试点和一个留置权试点)。
美国国税局已投入资源进行行为干预,包括成立行为洞察团队,以促进行为洞察在国税局的传播和应用。行为洞察团队和相关实践社区已经开发了资源和程序,以促进与行为洞察相关的知识共享,为这项工作的未来应用和扩展奠定了基础。这些资源包括国税局内部和外部的最佳实践和成功应用示例,这些资源总结在行为洞察工具包中。与学术界和政府其他部门的行为研究人员的合作有助于国税局继续提供最佳的行为研究,以促进有效的税收管理。
纠正措施: 无
塔斯马尼亚州回应: 美国国税局已开始使用 RCT 和准实验设置来测试 BI。它还成立了一个 BI 团队并开发了一个 BI 工具包。这些步骤应该有助于美国国税局更常规地使用 BI 来改善税务管理。然而,美国国税局的回应并没有表明它已经修改了程序指南或向工作人员提供了指示(例如,管理活动的指示),要求那些负责解决合规问题的人员考虑结合 BI 的替代治疗方法或衡量使用 RCT 或准实验的任何治疗方法的效果。美国国税局应该按照建议发布此类指导。
已采纳、部分采纳或未采纳: 部分采用
营业或关门: 不营业
行动截止日期(如未确定): 无
采取程序及时披露 IRS 研究和随机对照试验 (RCT) 的结果,以便所有内部和外部利益相关者都能从中受益。
国税局对建议的回应: 美国国税局正在使用多种方法在内部和外部传播 RCT 和准实验研究的结果。在内部,研究规划和优先执行指导委员会、研究主任协调委员会、行为研究实践社区都提供了论坛,经常报告 RCT 和准实验研究的结果。行为洞察团队还与 HCO 合作开发行为洞察知识库,以整合和传播 RCT、准实验研究和相关行为研究的基线和新见解。在外部,美国国税局举办年度研究会议,参加许多其他税收和研究会议,并通过联合统计研究计划管理的学术伙伴关系促进这些基于证据的发现的透明度。相关的演示文稿和论文通过 irs.gov 上的税务统计页面或通过展示结果的组织的网站和期刊公开,从而促进透明度和外部审查。
纠正措施: 无
塔斯马尼亚州回应: 美国国税局在编目基线商业智能洞察以及正在进行的商业智能研究方面取得了重大进展。国家纳税人权益保护局赞扬美国国税局与人力资本办公室 (HCO) 合作建立知识库,以整合和传播基线和新商业智能。然而,美国国税局应该改进其商业智能存储库,或找到另一种方法来保存其研究结果,以便美国国税局不同职能部门的员工可以随时使用它们,即使结果似乎没有揭示新的洞察。关于什么不起作用的信息几乎与关于什么起作用的信息一样重要。
同样,IRS 也延续了过去的做法,向外部利益相关者披露部分研究成果,例如允许 IRS 研究人员起草和发表期刊文章。但是,如果不进行文献综述,在某些情况下,不付费访问,就很难了解 IRS 研究人员提交了哪些内容以供发表或在会议上发表了哪些内容。此外,一些 IRS 研究人员可能不会将他们的研究成果提交发表,即使提交了,也可能不被接受。虽然 IRS 研究会议的透明度是朝着正确方向迈出的一步,但 IRS 应该考虑要求在 IRS 网站上免费提供摘要、演示文稿、论文和其他可交付成果(如有必要,应进行删节),如果这些成果是由 IRS 员工撰写或由 IRS 资助并交付给客户或目标受众。这样的政策将有助于内部和外部利益相关者找到他们需要的信息来评估并可能扩展 IRS 的先前工作,而无需检查或要求其他人检查内部存储库。
已采纳、部分采纳或未采纳: 部分采用
营业或关门: 不营业
行动截止日期(如未确定): 无
定期测量并向内部和外部利益相关者报告替代疗法带来的“服务”收入和合规收益。
国税局对建议的回应: 正在进行的研究和分析旨在更好地理清促成合规的各种因素和机构行为。2014 年 OECD 税务管理论坛关于衡量税务合规结果的报告对相关衡量和归因问题提供了有用的概述:
“要使结果衡量指标符合目的,就必须以合理的证据为基础,以确保衡量的可靠性。一个相关但独立的问题是归因可靠性。结果衡量指标可以适用于目的而无需归因。如果现实中的因果关系不是直接的,就不能期望指标直接归因。在战略层面尤其如此,其中结果衡量指标可用作整个税务管理系统健康状况的指标。为此,结果衡量指标不需要归因于税务机构的具体行动。例如,总体按时申报可以可靠地衡量,但不能直接归因于税务机构的行动。相反,在操作层面,适合目的的有效性衡量指标需要有可靠的归因,以使税务机构能够确定哪些干预措施有效,哪些没有按预期发挥作用。”
正如叙述性回应中所讨论的,美国国税局通常将合规性和收入结果作为学术研究界和纳税人援助蓝图所呈现的结果的一部分进行报告。美国国税局还在《美国国税局数据手册》中提供有关 AUR 和 ASFR 等替代处理的年度统计数据。美国国税局会持续审查《数据手册》中最合适的内容,并将评估今后更全面地解决这一问题的方案。值得注意的是,当前的执法统计数据包括软通知活动和更传统的执法方法的结果。涉及估算方法的新统计数据的制定须遵守 OMB 指南。
纠正措施: 无
塔斯马尼亚州回应: IRS 的回应引用了纳税人援助蓝图 (TAB) 和 IRS 数据手册中有关 AUR 和 ASFR 计划的数据,作为其计划绩效透明度的例子。这些出版物中包含的信息并不完整。例如,TAB 引用了各种纳税人使用情况调查和纳税人经验调查,但调查结果的完整分析似乎并未向公众开放。相比之下,当 TAS 进行调查时,它会同时公布结果和调查工具。对于 ASFR 和 AUR 计划,IRS 数据手册仅报告非常基本的数据,例如结案和评估的数量。如上所述,这些统计数据无法让利益相关者评估这些计划在实现预期结果方面的成功或失败。例如,IRS 不会报告错误评估的数量或减免金额、其 ASFR 或 AUR 结案的最终结果或纳税人未来的合规情况。
此外,美国国税局的回应似乎表明,它无法制定一项衡量自愿遵守收入的指标,该指标完全来自美国国税局的努力,而不是其他原因。然而,这正是美国国税局的 BI 团队在使用 RCT 或准实验将美国国税局的 BI 处理效果与其他原因隔离开来时所做的。目前尚不清楚为什么美国国税局不能扩展这种方法,即使它一开始只是用它来估计活动、应用 BI 带来的改进或类似举措带来的服务收入。
美国国税局显然担心自己无法制定符合 OMB 指导方针的服务收入衡量标准,该指导方针要求“有影响力的科学或统计信息”必须“能够被大量复制”。然而,这并不是一个不切实际的高标准。它只要求“使用相同方法对原始数据或支持数据进行独立重新分析会产生类似的分析结果,但误差程度要可接受”。美国国税局的回应并没有解释为什么一个合理的方法可以解决内部和外部利益相关者表达的所有担忧,但却无法达到这一标准。
已采纳、部分采纳或未采纳: 部分采用
营业或关门: 不营业
行动截止日期(如未确定): 无
停止或修改突出“执法”收入(目前定义)的报告,该报告具有误导性,因为它包括“服务”收入,而不包括不必要的强制措施的(潜在负面的)间接影响。
国税局对建议的回应: 上文 1-3 中已讨论。此外,正如 TAS 报告第 70 脚注所述,GAO 要求使用当前执法收入报告方法计算当前执法投资回报率。我们同意,当前执法收入报告不包括对后续自愿报告的间接影响估计(正面或负面)。
纠正措施: 无
塔斯马尼亚州回应: 国税局的回应并未回应国家纳税人权益保护局的建议,即纠正或停止国税局对“执法”收入的误导性定义。该回应还误解了 GAO 的建议,即“审查直接[执法]收入收益与成本比率的差异”,将其理解为保留“执法”收入误导性定义的“要求”。如果 GAO 可以要求国税局采取行动,它就不需要提出建议。
此外,GAO 并未建议 IRS 保留其对“执法”收入的误导性定义。事实上,GAO 建议 IRS“探索估计执法活动对自愿遵守的边际影响的可能性”,并建议改变“执法”收益的定义。IRS 对 GAO 的回应还表示,其使用直接“执法”收入(大概是目前定义的)来分配资源存在问题,它表示:“IRS 致力于优化资源配置,这就是为什么……我们在跨计划或工作类别分配资源时,除了直接投资回报外,还考虑其他因素……”此外,分离和报告服务收入符合 GAO 的建议和 IRS 对 GAO 的回应。
已采纳、部分采纳或未采纳: 未被采纳
营业或关门: 不营业
行动截止日期(如未确定): 无
将行为响应指标(例如响应率和未来合规性)纳入所有 IRS 计划,以帮助避免过分强调直接收入的重要性。
国税局对建议的回应: 如上所述,美国国税局正在评估绩效指标,以支持其未来愿景。经济合作与发展组织等机构制定的框架以及美国以外税务机关使用的做法提供了有用的模型。美国国税局的官方统计数据是根据预算与管理办公室信息与监管事务处统计政策处发布的政策和指令精心编制的。管理联邦机构传播信息的准则旨在最大限度地提高质量、客观性、实用性和完整性,强调可重复性和用于生成统计数据的方法的同行评审。这些原则必须指导任何新的美国国税局绩效指标。
纠正措施: 无
塔斯马尼亚州回应: 美国国税局的回应称,它正在评估绩效指标,以支持其未来愿景,这是建议。由于美国国税局的回应引用了一份支持国家纳税人权益保护局建议(如上所述)的 OECD 报告,因此美国国税局似乎表示,它同意国家纳税人权益保护局对美国国税局当前以产出为导向的指标的担忧。因此,它不愿完全采纳国家纳税人权益保护局的建议,似乎源于对“用于生成统计数据的方法的可重复性和同行评审”的担忧。
换句话说,国税局似乎担心,它可能无法以客观和可重复的方式衡量或估计其活动对自愿遵守的影响。虽然这种担忧是合理的,但如果国税局明确承认,它需要更多地关注其活动对自愿遵守的总体影响,而不是各种执法职能的产出,正如建议的那样,它就可以朝着这个目标努力,这并不像国税局的回应所说的那么困难。
如上所述,一些自愿遵守的指标相对容易量化或估计,例如未来的申报和付款合规性。甚至某些类型的报告不合规也很容易发现(例如,数学错误和不匹配)。虽然可能很难绝对肯定地说是什么原因导致纳税人在与 IRS 互动后遵守或不遵守规定,但正如 IRS 所承认的那样,当前的直接“执法”收入统计数据也无法确定。此外,IRS 已开始使用 RCT 和现场实验,这些实验可以合理估计其活动对未来合规性的影响。如果设计得当,这些估计可以推广。IRS 应该有信心定期报告这些结果,并按照建议转向更全面的指标。
已采纳、部分采纳或未采纳: 未被采纳
营业或关门: 不营业
行动截止日期(如未确定): 无