行业新闻

现在位置: 首页 > 行业新闻 >

如何调查拥有6000万份文档的公司

发布时间:2021/1/21 17:25:55浏览次数:159

  想象一下,必须搜索一家大型跨国公司的所有文档,电子邮件和消息。
  Yousr Khalil不必想象。法务会计师是一个团队的一部分,该团队不得不在航空航天巨头空中客车公司承认通过中间人行贿后,提出了不当行为的证据。
  她说:“空中客车就像其中有900套公寓的高楼大厦。我们必须决定要研究哪些套间。”
  Khalil女士在FRA(法医调查公司)工作,该公司为全球法律案件提供支持。
  但这是一个例外,也是FRA有史以来最大的工作。
  为了符合延期起诉协议(DPA)的要求,空客于2016年对其运营进行了严格的审查。
  这项为期四年的根除腐败行为的项目帮助空客与英国,美国和法国的监管机构达成协议,根据该协议,空中客车公司支付了36亿欧元(30亿英镑)的罚款,以表彰其欺诈和贿赂行为。
  Khalil女士和一支由70名员工组成的团队面对着遍布全球活动的大量文件,交易数据和电子邮件,其中大部分都是无害的。
  那么他们如何规划课程呢?
  人工智能(AI)和量身定制的计算机不同于您曾经使用过的任何PC,在这一史诗般的数据拖网中发挥了重要作用。
  5亿个庞大的文档和交易的艰巨收集工作必须减少。
  随着数据量呈指数增长,在此类调查中越来越频繁地使用AI。
  消除重复和其他不相关的材料后,调查人员将获得6000万份文档进行审查。AI搜寻了这些图案并找到了不合适的片段,例如价值1亿美元的体育赞助协议。
  在所有这些过程中,空中客车与员工的关系如何?哈利勒女士说:“没有一家公司真正为全面的法医调查做好准备,”但她来自空中客车公司的同事反应迅速。“当监管者对某件事进行快速反应时,他们就此采取行动。”
  好像六千万件物品还不足以构成挑战,全球范围内有800名空客雇员被合法指派为这些文件的保管人。
  “您可能将信息散布在笔记本电脑,存储设备,USB驱动器等不同介质上。我们必须确定谁是该数据的托管人,” Greg Mason表示,他是该公司数据分析的创始合伙人兼联席主管FRA。
  建立了七个安全的调查地点。这些允许对文档进行完全安全的检查,这对空客而言至关重要。这是一个庞大的业务,与欧洲主要的军用飞机项目交织在一起。因此,调查必须设计出一种方法,以防止将全国范围内敏感的材料拒之门外。
  专用软件允许收集信息,而无需查看其来源的整个文档,因此可以防止窥视他人的秘密防御信息。
  此外,还使用了定制的价值100,000美元的计算机,该计算机运行多个磁盘并且没有与Internet的连接。
  这被称为“气隙”,它在敏感数据和Internet外部世界之间提供了明确的界限。
  如果仅将数据视为数据,则处理大量数据将变得更加轻松快捷。FRA提取了元数据,即每个电子文档背后的信息(定义了元数据),然后使用它对材料进行索引,以便可以删除不相关的文件。
  AI构成了此技术辅助审核(TAR)的基础。
  AI经过训练可以搜索非结构化数据,例如电子邮件。与表单和列中包含的结构化数据不同,这些元素很难扫描。
  利用机器学习的原理,AI软件可以看到特定类型消息的多个示例并开始发现它们属于哪个类别,FRA能够迅速提取相关文档。梅森观察到:“人工智能程序寻找消息的上下文,上下文就是一切。”
  该软件正在寻找通过代码安排的贿赂,例如医生开药。通过运行此类隐藏消息的示例,该软件获得了医学概念,然后获得了处方概念。这意味着它可能会涉足非结构化数据并发现腐败行为。
  梅森先生说:“当您发现越来越多的秘密支付实例时,人工智能便会实时学习。这就是人工智能的魅力所在。” 建立了评分系统,为某些属性添加了分数。任何高于一定数字的分数都被认为值得进一步调查。随着机器学习技术的发展,它变得越来越好。
   梅森先生认为,预留的文件中只有大约5%是由人检查的,但仍然有300万份文件。“人工智能不是万灵药,但它的学习方式却非同寻常。”
  这位统计学家经过培训,对AI技术如何使大量短时间工作印象深刻。“即使今天很小的情况下,海量数据也随之而来。”
  他必须将TAR的新概念卖给英国严重欺诈办公室(SFO)等监管机构,并获得批准,这不是传统的调查方法。“这是我进行过的最复杂的调查。”
  四年的调查听起来很累。但是,与AI助手一起揭露欺诈行为使团队获得了很多个人满意度。
  他们的工作得到了合法的认可印章。
  英格兰和威尔士最资深的民事法院法官之一维多利亚·夏普夫人(Victore Sharp)总结了这项调查的深远影响及其在人工智能方面的突出作用。
  在为2020年1月在英国举行的三国事件辩护时,她宣布空中客车公司“真正掏腰包,现在是一家发生过错的公司”。