友情提示:本平台主要功能已迁移至全国标准信息公共服务平台,请访问 http://www.std.gov.cn
收藏本站   设为首页
当前位置:IEC新闻 > 正文

高质量数据在人工智能中的重要性

发布时间: 2024-08-12 00:00:00   审校:元宇宙   浏览次数:
来源:https://www.iec.ch/blog/garbage-garbage-out-importance-quality-data-ai  

想象一下,一个只推荐男性的招聘工具,或者一个吐出种族主义推文的聊天机器人。或者是一个估算房地产价格的在线工具,它的错误导致房地产市场损失超过3亿美元。

这些只是现实世界中的一些例子,说明为人工智能系统输入低质量的数据会产生灾难性的后果。糟糕的数据不仅会产生糟糕的结果,还会在人工智能中引起幻觉。

像这样的错误很少,但表明需要确保输入人工智能模型的数据具有尽可能高的质量,从而使其能够在许多方面继续为社会做出积极贡献。但是怎么做?

提高数据质量的一种方法是通过数据质量管理体系。通过提供持续改进数据质量的指南和流程,它有助于确保所使用的数据是适当的。它还概述了衡量质量以及实现审计和管理的方法。

许多组织已经制定了保证数据质量的流程,但人工智能中的机器学习模型有特定的要求。因此,IEC和ISO人工智能联合委员会SC 42最近制定了一系列国际标准,从各个角度解决数据质量问题。它为提高分析和机器学习(ML)的质量数据提供了要求和指南,以及如何不断改进它。

ISO/IEC 5259系列提供了一个数据质量模型、测量数据质量的方法、数据质量的定义以及示例和用例。这包括数据质量特征、可能存在问题的方面以及生命周期特定的数据质量管理等要素。

它还包括数据质量的治理,以帮助组织拥有适当的控制,以跟踪数据的来源和使用,并解决有关责任和透明度的问题。这将有助于建立对人工智能系统的信任,并进一步减少错误。

该系列的一些部分刚刚出版,其他部分可能会在未来几个月内效仿。


  • 版权所有 侵权必究
  • 主管:国家标准化管理委员会
  • 主办:国家标准化管理委员会标准信息中心
  • 运营:北京中标赛宇科技有限公司
  • 经营许可证编号 京ICP证 号
  • 盗版侵权 举报热线:400-650-6190
  • 关于我们
  • 技术团队
  • 合作伙伴
  • 法律声明
  • 知识产权