首页 >> 行业应用 >> 政府
责任编辑:张富凯  

合规性数据仓库正在向你走来

发表时间:2008-09-28 11:48:24.0  作者:CBISMB编辑  
 
随着 4 月 15 日临近,纳税季节开始进入最后的疯狂阶段,准备纳税申报的个人和公司会计都可能会打小算盘,计算他们可以虚报多少水分。

  千万别有蒙混过关的念头。最近几年来,美国国税局在侦办虚假报税的能力已经有了显著的提高,并且加大了执法力度。

  2006 年,该机关在 140 万项审计中收缴税款创下记录,达到 592 亿美元。在过去的七年里,该局税收收入一直增加,自 2000 年以来已经增加了 75%。

  特别是,美国国税局增加了中产阶级(年收入在 25,000 美元到 100,000 美元之间)和超级富翁(年收入达 100 万美元以上)虚假报税的稽查数量。美国国税局在 2006 年审计了 436,000 个中产阶级家庭和个人,数量相当于 2000 年的三倍。据纽约时报报道,税收稽查机率从六年前的 1/337 相应增加到 2006 年的 1/140。

  同时,年收入超过 100 万美元的富人群体被税务机关稽查的机率也从三年前的 1/20 提高到 2006 年的 1/11。

  与此同时,据美国国税局负责调查数据库的主任 Jeff Butler 所说,国税局已经能够逐步减少对诚实纳税人的审计数量。

  Butler 监管国税局的调查数据仓库,这是该机关近期多项改进的关键。

  “我们现在所做的工作,在某些方面上,具有开创性,”Butler 说,并流露出一个多年为官者的有分寸的自豪(他已经在美国国税局工作了整整 15 年,还曾在美国交通部任职 5 年)。“我们正努力完善自己,希望达到象最大信用卡公司或银行一样的水平。”

  世界级的数据系统
  Butler 可能过于谦虚了。将过去 10 年的所有纳税申报表和相关信息统一起来,150TB 合规性数据库 (CDW) 的规模就足以跟世界上已知的最大数据库相媲美,例如 YouTube、AT&T 和 CIA 运行的那些数据库。

  不只是 CDW 的规模令人印象深刻,它的性能亦是如此。

  美国国税局调查人员可以使用它来“一次性搜索和分析数以亿计的记录,因此我们可以回答问题,了解趋势,进行模拟和优化建模,”Butler 说道。而且那些分析不再像以往一样需要花费数周或数月的时间,现在只需要几个小时或几天的时间,他说道。

  通过使用 CDW,国税局可以发现哪些方面的偷漏税现象严重,例如收入所得税扣除或小企业合法减免所得税,Butler 说道。

  调查人员还使用 CDW 来发现或确认哪些人可能会延迟缴纳税款。例如,贷款上大学的年轻毕业生极有可能会出现这种情况。

  当然,该系统也存在局限性。它不能协助国税局代理人实际执行审计过程。同时,系统不能将信息反馈给那些希望得到关于某些申报问题解答的个人或企业。

  “我们没有向公众开放。同时,我们并不管理任何事务数据储存。我们只在幕后实现价值,”他说道。

  合为一体
  与所有的大型联邦机构或企业一样,美国国税局储存许多来源的数据-包括原有的主机数据库、Oracle数据库和平面文件。在十年前把它们连接起来完成任何一类商业情报工作就象是一场“恶梦”,Butler 说道。

  对于 CDW 而言,Butler 的调查小组在 10 年前选择采用Sybase 公司提供的当时最新版 IQ Analytics Server。与大部分的水平式设计数据库不同,IQ Analytics Server 将数据存储在基于列的表格中,这可能放慢了数据的写入速度,但却提高了数据的读取速度-使其成为数据仓库这类应用程序的理想之选。

  今天,Sybase 的 IQ 拥有 1,000 多个客户,包括200 家银行。但是当时以不菲的价格选择这样一种新型的技术是非常冒险的。

  “我们遭受许多质疑,”Butler 回忆说。“为什么你们不选 IBM 或 Informix?”有人问我。这看起来也有些冒险,因为 Sybase IQ 当时并不是市场认可的企业体系架构的一部分。最后,有人告诉我,我们可以使用 IQ 进行调查分析,但我们打算大部分都使用 Oracle 和IBM DB2。”

  限制访问
  实际上,调查部门还使用微软公司的 SQL Server 来储存数据仓库和其它部门的所有元数据。管理和清除所有的元数据- 150 个数据库的 10,000 个表-本身是一项艰巨的任务,Butler 说道。

  更好的硬件、IQ 带来的改进,再加上速度更快和价格更实惠的储存,所有这些结合起来提高了 CDW 的性能。

  “最初,我们用了六到八周的时间装载完一年的纳税申报表的容量 [15 到 20TB]。而现在它只需要四个小时,”Butler 说道。

  今天,大约只有 500 名的调查员-大部分来自美国税务局,一部分来自美国财政部-可以使用Hyperion Solutions Corp. 的业务智能查询工具直接访问 CDW 。

  不过,Butler 的团队目前已经开始建立分析服务,它将分析汇总和趋势统计数据,并将这些数据向国税局内部的Wiki站点、博客和 SharePoint 站点发布。这使得国税局更轻松地满足联邦机构的数据需求。

  最终的目标是向公众公布这些信息,这与美国人口调查局在其网站上发布大量人口数据的方式一样。Butler 说,那真可谓是“苦尽甘来”。
  
推荐给好友】【评论】【BBS】【博客】【报告错误】【打印】【关闭
版权声明:该文章由CBI版权所有,未以书面授权不得转载或摘录。
请您留言 热点新闻 |  头条回顾 |  热门案例 |  热门方案
  笔名:  联系方式:
  评论内容:
  
  表情:
    
  请输入验证码: 看不清楚,换一张图片
      
注意:请尊重网上道德,遵守中华人民共和国的各项有关法律法规;承担一切因您的行为而直接或间接导致的民事或刑事法律责任;cbismb新闻留言板管理人员有权保留或删除其管辖留言中的任意内容.
相关新闻
新闻检索:      


简报订阅:
    
 


文章搜索:
   

专题IT经理快报
大话SMB图片联播
博客论坛
                    
雷阳 张富凯 郝鹏 邓建功 尚昭 李丽 郭雪梅
最新更新 热点排行