蚂蚁集团发布AI安全检测平台“蚁鉴2.0” 可实现用生成式能力检测生成式模型
时间:2023-07-08 09:23:58来源:上海证券报·中国证券网

7月7日,2023世界人工智能大会(WAIC)“聚焦·大模型时代AIGC新浪潮—可信AI”论坛举行,蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型,可识别数据安全、内容安全、科技伦理三大类的数百种风险,覆盖表格、文本、图像等多种数据和任务类型,是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解,该产品还入选了本届大会的“镇馆之宝”。

AIGC安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰发表《可信人工智能展望》主题演讲。他认为,不能再将人工智能视为简单的技术工作,而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。

在该论坛上,蚂蚁集团同时宣布,“蚁鉴2.0”全面开放,面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具,可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。


【资料图】

据了解,“蚁鉴2.0”的两项硬核能力,一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类,可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测,并会生成检测报告,帮助大模型更加有针对性地持续优化。

蚂蚁集团大安全事业群技术部总裁李俊奎表示:“生成式大模型是一种‘深黑盒’技术,‘蚁鉴2.0’通过智能博弈对抗技术,模拟黑产以及自动化生成海量测试集,可实现‘生成式机器人’对‘AIGC生成式模型’的诱导式检测计算,很像一个24小时不眠不休的‘安全黑客’在找茬大模型,从而找到大模型存在的弱点和安全问题所在。这种AI对AI的评测,也是教学相长。好比生成式考官考核生成式运动员,在对抗中双方能力互相提升,进一步提高整个行业的AI安全水位。”

另一项硬核能力是,“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识,通过可视化、逻辑推理、因果推断等技术,从完整性、准确性、稳定性等7个维度及20余项评估指标,对AI系统的解释质量量化分析,帮助用户更清晰验证与优化可解释方案。

据了解,“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利,支持零编码测评。开发者通过API接口,将AI模型接入蚁鉴,就可以一键识别和挖掘模型漏洞。

蚂蚁集团认为,人工智能的深度应用,不仅对数据、算法、算力提出了更高要求,也对安全、隐私、伦理提出更多挑战。在确保数据安全和隐私保护、健全人工智能伦理与安全的前提下,才能让AI技术真正地释放应用价值。

此次论坛上,中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《AIGC可信倡议》。该倡议得到数十家单位参与,围绕人工智可能引发的经济、安全、隐私和数据治理等问题,提出构建AIGC可信发展的全球治理合作框架,采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升AIGC可信工程化能力,最大限度确保生成式AI安全、透明、可释。

论坛现场还发布了由中国信通院、清华大学、蚂蚁集团联合编纂的《可信AI技术和应用进展白皮书(2023)》。该报告基于统一的可信AI认知维度,梳理总结可信AI发展现状,提练了面向新阶段大模型和AIGC引发的新需求,形成以技术为保障的可信AI评估体系和工具,探索新一代可信人工智能发展。

公开资料显示,蚂蚁从2015年开启可信AI的实践和探索,是蚂蚁集团在人工智能领域的重点布局之一。通过可信AI技术的突破,蚂蚁集团建设了一套世界领先的智能风控解决方案;蚁鉴AI安全检测平台先后获得2022年上海金融科技中心建设三周年优秀成果、信通院可信人工智能实践标杆案例等认可。

(文章来源:上海证券报·中国证券网)

标签:

生活指南
  • 因GPS无法正常工作 雷克萨斯召回部分NX

    日前,丰田汽车(中国)投资有限公司根据《缺陷汽车产品召回管理条例》

  • 河南省气象台发布今年首个高温红色预警!

    四季有时有序时光步履从容当阳光一天一天的强烈人间迎来了夏季的第五个

  • 猴头菇产地是哪里?猴头菇煲汤放多少合适? 全球热文

    猴头菇产地是哪里?产地生境猴头菇在自然界中分布很广,主要分布在北

  • 【独家】午夜凶铃哪部好看?午夜凶铃共几部?

    午夜凶铃哪部好看?第二部《午夜凶铃2之贞子缠身》、第三部《午夜凶

  • 机票改签怎么办理

    机票改签办理的方式有两种,分别是电话改签以及现场改签。如果是电话改

  • 新股申购额度是多少?新股申购额度怎么算?

    新股申购额度是多少?新股申购额度是根据投资者股票市值来算的,沪市

  • 定名豹5,或将于今年年内交付_每日看点

    7月4日,方程豹汽车首款车型官宣定名“豹5”。据悉,豹5将搭载全新混动

  • 【天天聚看点】国际逆回购的特点有哪些?逆回购操作流程是怎样的?

    国际逆回购的特点有哪些?1 跨国性。国际逆回购是跨国金融机构之间

  • 当前关注:涡轮增压一般寿命多久 涡轮增压器的寿命有多长)

    hello大家好,我是城乡经济网小晟来为大家解答以上问题,涡轮增压一般

  • 两台苹果手机如何同步通讯录?怎么把两个苹果手机的数据同步?

    两台苹果手机如何同步通讯录?同步两台苹果手机的通讯录方法:1 使

  • 茶文化遇到高科技,西城区建设“马连道•茶•中国数据街”

    北京日报客户端|记者张骜方非通讯员杜颖7月3日,2023全球数字经济大会

  • 假日暖洋洋2孔令麒爸是好是坏?假日暖洋洋2剧情介绍

    假日暖洋洋2孔令麒爸是好是坏:孔令麒爸曾经是一个温馨的家庭,但父

  • 当前时讯:带圆圈的数字11 怎么打?圈里带数字的序号怎么复制?

    带圆圈的数字11 怎么打?1 打开Word空白文档,输入数字11。 2 选中

  • 唐山八中录取分数线2019_唐山八中录取分数线 每日视点

    1、唐山一中:公助生560分,择校生554分。2、唐山二中:公助生542分,

  • 《幽灵诡计幻影侦探》诡异密室之谜成就攻略 诡异密室之谜怎么解锁?

    诡异密室之谜是幽灵诡计幻影侦探需要收集的成就之一,想要解锁这个成就

  • 蓉港直达高铁开通 将给四川带来哪些发展机遇? 快资讯

    蓉港直达高铁开通将给四川带来哪些发展机遇?戴宾介绍,香港一直是四川

  • 民生
    • 苹果公司将于8月4日发布2023财年第三季度财报

    • 武汉牙达人口腔整形医院收费怎样?看机构背景资料及医生名单信息

    • 【有你家吗】2023年首批老旧小区改造名单出炉 大兴是这四个

    • 共绘智慧产城实景图 青浦这个特色产业园携多家企业“新科技”亮相2023WAIC