蚂蚁集团发布AI安全检测平台“蚁鉴2.0” 可实现用生成式能力检测生成式模型

发布日期：2023-07-08 15:03:37 来源：环球网

7月7日，2023世界人工智能大会（WAIC）“聚焦·大模型时代AIGC新浪潮—可信AI”论坛举行，蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2.0”。蚁鉴2.0可实现用生成式AI能力检测生成式AI模型，可识别数据安全、内容安全、科技伦理三大类的数百种风险，覆盖表格、文本、图像等多种数据和任务类型，是业内首个实现产业级应用的全数据类型AI安全检测平台。据了解，该产品还入选了本届大会的“镇馆之宝”。

AIGC安全成为当前人工智能研究发展的重要议题。中国科学院院士何积丰发表《可信人工智能展望》主题演讲。他认为，“不能再将人工智能视为简单的技术工作，而是成为整个组织的变革引擎。可信人工智能要致力于保障数据安全可信、系统行为可追责、算法模型可解释、网络环境可信、法律伦理可信等问题。”

【资料图】

在该论坛上，蚂蚁集团同时宣布，“蚁鉴2.0”全面开放，面向全球开发者免费提供AIGC安全性、AI可解释性、AI鲁棒性三项检测工具，可服务于数字金融、教育、文化、医疗、电商等领域的大规模复杂业务场景。

据了解，“蚁鉴2.0”的两项硬核能力，一是实现了用生成式能力检测生成式模型。检测标准覆盖内容安全、数据安全、伦理安全三大类，可对大模型生成式内容完成包含个人隐私、意识形态、违法犯罪、偏见与歧视等数百个维度的风险对抗检测，并会生成检测报告，帮助大模型更加有针对性地持续优化。

蚂蚁集团大安全事业群技术部总裁李俊奎表示，“生成式大模型是一种‘深黑盒’技术，‘蚁鉴2.0’通过智能博弈对抗技术，模拟黑产以及自动化生成海量测试集，可实现‘生成式机器人’对‘AIGC生成式模型’的诱导式检测计算，很像一个24小时不眠不休的‘安全黑客’在找茬大模型，从而找到大模型存在的弱点和安全问题所在。这种AI对AI的评测，也是教学相长。好比生成式考官考核生成式运动员，在对抗中双方能力互相提升，进一步提高整个行业的AI安全水位。”

另一项硬核能力是，“蚁鉴2.0”融入了可解释性检测工具。综合AI技术和专家先验知识，通过可视化、逻辑推理、因果推断等技术，从完整性、准确性、稳定性等7个维度及20余项评估指标，对AI系统的解释质量量化分析，帮助用户更清晰验证与优化可解释方案。

据了解，“蚁鉴2.0”集成了蚂蚁近10年可信AI实践、1000余项可信AI专利，支持零编码测评。开发者通过API接口，将AI模型接入蚁鉴，就可以一键识别和挖掘模型漏洞。

蚂蚁集团认为，人工智能的深度应用，不仅对数据、算法、算力提出了更高要求，也对安全、隐私、伦理提出更多挑战。在确保数据安全和隐私保护、健全人工智能伦理与安全的前提下，才能让AI技术真正地释放应用价值。

此次论坛上，中国信通院、上海人工智能实验室、武汉大学、蚂蚁集团等多家单位共同发起的《AIGC可信倡议》。该倡议得到数十家单位参与，围绕人工智能可能引发的经济、安全、隐私和数据治理等问题，提出构建AIGC可信发展的全球治理合作框架，采用安全可信的数据资源、技术框架、计算方法和软件平台等全面提升AIGC可信工程化能力，最大限度确保生成式AI安全、透明、可释。

论坛现场还发布了由中国信通院、清华大学、蚂蚁集团联合编纂的《可信AI技术和应用进展白皮书（2023）》。该报告基于统一的可信AI认知维度，梳理总结可信AI发展现状，提练了面向新阶段大模型和AIGC引发的新需求，形成以技术为保障的可信AI评估体系和工具，探索新一代可信人工智能发展。

标签：

上一篇:地球之巅积雪厚度9.5±1.2米！第二次青藏科考队发布珠峰顶部积雪厚度 下一篇:地球之巅积雪厚度9.5±1.2米！第二次青藏科考队发布珠峰顶部积雪厚度

蚂蚁集团发布AI安全检测平台“蚁鉴2.0” 可实现用生成式能力检测生成式模型

微信扫一扫：分享

蚂蚁集团发布AI安全检测平台“蚁鉴2.0” 可实现用生成式能力检测生成式模型

蚂蚁集团联合清华大学发布AI安全检测平台“蚁鉴2 0”，可识别数百种风

地球之巅积雪厚度9.5±1.2米！第二次青藏科考队发布珠峰顶部积雪厚度

2023年7月8日，记者从第二次青藏科考队了解到：第二次青藏科考队利用雷

放大财政“乘数效应” 厦门迎来三场签约仪式

7月7日至8日，“2023母基金年度论坛暨第四届鹭江创投论坛”在福建厦门

新赛季挽尊！MVP不是万能丹 费城一哥做好1事才是真大帝

尽管费城如今仍然在处理哈登是否需要交易的问题，但是对于这支球队来讲

亚通股份：7月7日融资买入22.75万元，融资融券余额1.67亿元

7月7日，亚通股份（600692）融资买入22 75万元，融资偿还35 58万元，融

国米已经官宣签下萨索洛中场弗拉泰西，球员也通过社...

国米已经官宣签下萨索洛中场弗拉泰西，球员也通过社媒发文纪念。“我很

美将向乌克兰提供集束炸弹！德国表态反对，舆论激烈质疑

《纽约时报》称，白宫之前不愿向乌克兰提供集束炸弹，部分担忧是，美国

联合国：反对在乌克兰战场使用集束弹药

当地时间7月7日，在回答央视记者关于美国批准向乌克兰输送集束弹药相关

北京哪家点痣比较好（北京哪里点痣好呢）

1、您好，根据您的描述一般是激光点痣。2、建议您也不要太担心，如果稍

探展WAIC｜区块链+WEB3新发展论坛召开，国内首家区块链+WEB3创投联盟成立

2023年7月7日，上海张江科学城举办了“未来互联网赋能新金融”2023世界

R星将推出2款重制/复刻版游戏！但其中可能没《GTA4》

日前，T2称R星会在2024财政年推出两款之前发布过的游戏，玩家们第一时

华为云发布盘古大模型3.0

华为云发布盘古大模型3 0---中新社北京7月7日电在各大科技公司纷纷推出

2023下半年广东教资考试报名入口（直达官网）

2023下半年全国中小学教师资格证报名时间是7月7日—7月10日(仅供参考，

中航光电: 关于实施高端互连科技产业社区项目暨对外投资的公告

中航光电:关于实施高端互连科技产业社区项目暨对外投资的公告

大冷门！2-3不敌跨国组合，陈梦王曼昱止步8强，国乒无缘会师决赛

第二轮：输掉第一局后，陈梦和王曼昱在第二局比赛中进步很大，连拿三分

西安市雁塔区人力资源和社会保障局在哪个位置（西安市雁塔区人力资源和社会保障局在哪）

1、西安市雁塔区人力资源和社会保障局在雁环中路2号。2、坐公交525路、

甲胄齐整什么意思_甲胄

1、甲：按传说最早是由夏人发明的避箭衣，后演变为战争中人马的普遍护

一女子从网贷“客户”变成犯罪“同伙”被抓！

日前，香河县公安局反诈中心通过缜密侦查、固定证据，成功抓获一名涉诈

国药现代：上半年净利润同比预增48.96%-57.86%

国药现代晚间发布半年度业绩预告，预计2023年半年度实现归属于母公司所

上坤地产上半年销售金额16.3亿元 同比下降71.15%

截至2023年6月30日止六个月，上坤地产累计合约销售金额约为16 3亿元，

商业拆迁与行政征收，天壤之别，千万别搞混了

商业拆迁与行政征收，天壤之别，千万别搞混了,征地,拆迁补偿,商业拆迁,

新加坡经济发展局领导一行到智慧互通（IICT）考察交流

日前，新加坡经济发展局副局长彭明光、主任蔡璇一行到智慧互通科技股份

2023年自学考试《英语(二)》必背大纲词汇（76）

2023年自学考试《英语(二)》必背大纲词汇（76）由自学考试栏目提供,查

日本5月实际工资同比减少1.2% 连续14个月下滑

7月7日电，日本厚生劳动省7日公布的5月每月劳动统计调查（初值、员工5

西藏最大风电项目首台风机吊装完成

中新网7月7日电 中新财经记者刘文文记者7日从国家能源集团获悉，6日上

传谷歌Pixel手机定制芯片推迟至2025年 并由三星转台积电生产

这是50岁的吴越，至今未婚也没啥好自卑

歇后语的特点和分类（歇后语的特点）

各地采取积极举措帮助高校毕业生就业

今日小暑 北京最高气温37℃

内蒙古一村民举办升学宴，两人为帮忙不幸触电身亡，供电局已解决此事

何超琼出席富商曾文豪家宴，干女儿曾昭仪和妈妈开心合影

“欣”友来捧场！范伟虞书欣加盟《非诚勿扰3》

新能源车突破2000万辆，意味着什么？

学生团体意外保险有什么保障？值得买吗？

河南洛阳：保订单 车间生产忙

蛋壳变硬最佳送女人纪念礼物大揭秘

比亚迪海外布局，豪掷45亿

越来越多高分考生选择中职学校

学稚手机电池耐用吗

罗马诺：普利西奇明确表示要去米兰，目前正在讨论报价的组成结构

中国海军“和平方舟”号医院船在西太平洋开展海空立体医疗救护演练

李世民果断杀掉亲兄弟，却引来后世历代人民的称赞！

贸发会议报告：2022年全球外国直接投资下降12%

警方通报“环卫工误扫男子脚被殴打”：嫌疑人已抓获，行拘10日罚款500

【OFweek维科杯】金固美参评最具成长力企业奖项

一块砖一铲灰，86岁的老人“修修补补”感动大连！

60页PPT深入分析：借壳/重组上市

ChatGPT六月流量环比下降9.7%，为发行以来首次下滑

北京市第三十五中学“中美双文凭国际高中课程项目”2023年招生简章

选来的冠军！母队夺冠数排行榜：乔丹第一 库里第五

环球即时看！全面恢复线下办展，第31届华交会将于7月12日至7月15日举行

【热闻】上海金基准价早盘报450.32元/克

新赛季挽尊！MVP不是万能丹费城一哥做好1事才是真大帝

上坤地产上半年销售金额16.3亿元同比下降71.15%

中新网7月7日电中新财经记者刘文文记者7日从国家能源集团获悉，6日上

传谷歌Pixel手机定制芯片推迟至2025年并由三星转台积电生产

今日小暑北京最高气温37℃

河南洛阳：保订单车间生产忙

选来的冠军！母队夺冠数排行榜：乔丹第一库里第五

《最终幻想16》发布1.03版本更新动态模糊可以关闭了_全球速看

开办费的摊销年限（开办费摊销年限是多久）今头条

一旦感染非常可怕夏天别随便带孩子去这里玩全球滚动

焦点日报：吉首：政务事项延时办为民服务暖人心

黄金收盘：美联储纪要暗示加息降至黄金震荡收跌每日播报

试驾丨汉兰达380T 涡轮增压动力依然丝滑快消息

柳梧铁路项目召开“交投先锋+五融品质党建”联建工作推进会焦点精选

盈盛控股乔迎宾：不显山露水潜心打造“智能办公”

中沃防火门马忠良：前半生守国门后半生护家门

打造零碳机场示范样板朔州机场工程要实现清洁低碳用能模式

打造零碳机场示范样板朔州机场工程要实现清洁低碳用能模式

天津：划定封控区全市开展全员核酸检测