生成式人工智能滥用恶用的安全威胁及对策建议研究

以ChatGPT为代表的生成式人工智能(AIGeneratedContent,AIGC)给人类社会带来了巨大的技术红利,为第四次工业革命提供了新动能。但也逐渐暴露出一系列安全风险。尤其是2022年下半年以来,暗网涌现出WormGPT、PoisonGPT、EvilGPT等一批恶意人工智能大模型,给AIGC的安全治理带来了新的严峻挑战,亟待未雨绸缪加强治理。

一、生成式人工智能滋生了恶意大模型的新威胁

生成式人工智能滋生了一批恶意人工智能大模型。恶意人工智能大模型是指由非法组织或不法分子操纵,借助开源模式模仿ChatGPT等合法模型,基于有害语料库训练而生滋生的、专门用于网络犯罪、诈骗等非法行为的一类非法大模型。恶意大模型与人工智能的滥用还不尽相同,其产生的直接目的就是用于各类非法行为,主要运行于暗网,具有更强的隐蔽性、危害性,形成了“人工智能+犯罪”新治理挑战,对国家安全、行业创新、生产生活等方面造成危害。

(一)对维护国家安全提出新挑战

滥用恶用AIGC给国家政治和军事带来了新的安全挑战。一是在意识形态安全方面,AIGC在数据投喂、算法训练等环节易受到核心技术掌控方操纵,出现污染投毒和算法偏见等问题。可能成为西方国家对华“认知战”的新工具。二是在技术自主可控方面,霸权国家主导AIGC标准制定,技术相对弱势的国家可能盲目大规模进行产品使用和追随开发,出现因科技封锁和贸易制裁等遭遇“卡脖子”危险。三是在国防军事安全方面,AIGC提高了作战人员、武器和指挥信息系统的智能交互水平,对历史战况和现实情报通过先进算法进行快速推演分析,提升打击精度和反应速度。美国军方在2023年已开始利用AIGC撰写国防咨询报告,并成立Lima工作组在五角大楼评估、整合和使用该技术。

(二)对行业应用创新造成新冲击

滥用恶用AIGC给产业和行业发展带来了新的安全冲击。一是在教育就业方面,各种AIGC产品总体内容质量仍良莠不齐,容易出现创作的“劣币驱逐良币”现象。利用AIGC辅助完成课业和学术研究减少了必要的批判甄别和分析研究过程,会产出更多虚假信息和学术垃圾。二是在产业转型方面,大部分传统行业数字化转型进程仍较为缓慢,对于正确运用AIGC收集、处理数据,并将其应用于研发、生产、销售等各环节的意愿和能力尚且不足,大规模盲目引入AIGC可能会适得其反。

(三)对生产生活方式带来新威胁

二、生成式人工智能安全治理难点

(一)包容审慎存在失衡,政策尺度有待细化

AIGC是一个新生事物,其发展规律还未完全明晰,包容审慎的政策尺度和平衡点较难把握。一方面,目前AIGC安全治理政策在适应数字时代新型商业模式和秩序框架,鼓励新业态自主创新、资源共享、国际合作等方面还有待健全完善。另一方面,在AIGC政策具体实施层面还存在市场形势判断难、干预时机决断难、责任主体划分难等难点,市场主体开展安全可信技术创新激励和容错措施尚未制度化。包容审慎监管试点较少,对拟实施或已实施的监管产生的积极影响和消极影响进行评估的监管影响分析程序重视度不够,科技伦理治理公共服务平台有待建设。

(二)协同治理能力不足,联动合力有待提升

(三)监管手段相对滞后,技术赋能有待加强

“以技术管技术、以技术治技术”的监管治理体系尚不健全。在伦理安全层面,深度伪造技术层出不穷,而检测算法的泛化性、鲁棒性等还有待提升。在算法安全层面,算法安全内生机理、风险评估、全生命周期安全监测等关键技术支撑还需进一步加强。在数据安全层面,数据安全监测预警技术有待创新,数字贸易跨境监管仍有进步空间。非现场、物联感知、穿透式等新型监管手段运用不够充分,监管智能化水平有待提升。

三、生成式人工智能安全治理对策建议

(一)健全制度规则,提升政企协同治理能力

1.政府发挥规范引导指挥棒作用

一是加大查处管控和宣传教育。实行包容审慎和分类分级监管,监控查处非法使用和传播恶意AIGC行为,管制违规账号。二是健全技术规范和评价标准。制定AIGC预训练和优化训练数据、标注、数据分类分级保护等方面的国家标准,以及深度伪造、智能群呼设备等高风险AI技术的使用规范。三是完善法律体系和制度框架。采用安全港等机制处理内容责任归属问题,加强和改进反垄断和反不正当竞争执法。探索我国数据存储体系优化,构建数据被动出境的主动防御体系,建立跨境数据流动规则和白名单等机制。

(二)加强技术创新,健全安全治理技术体系

1.完善人工反馈的强化学习机制

注重对人工反馈的强化学习机制(RLHF)的优化。从与训练语言模型、收集数据并训练奖励模型、强化学习微调语言模型等阶段,降低数据成本、优化算法、改进微调策略,防止被某些策略绕开而产出不当内容,使模型与人类需求对齐。自动化调用模型知识,进一步降低对大规模高质量人工标注数据的依赖。

2.加强模型安全技术研究及应用

一是部署数据和模型安全防御。通过优化鲁棒训练算法应对数据投毒,采取截断混淆、差分隐私等手段使模型隐私信息模糊化,采取模型水印、模型指纹等溯源手段保障知识产权专有性。二是做好各类接口安全性设计。采用身份验证、日志监控、网关等技术手段加强API和网页端接口的安全防范管理。使用VPN等加密通道传输数据,部署抗DDoS工具,使用嗅探器等检测安全问题并跟踪数据泄露。三是分析研究新型LLM。探索利用人工智能工具逐步实现自动化对抗恶意AIGC,进而用大模型“对抗”大模型。

(三)优化监管手段,提升智能治理监管能力

四、结语

本文对AIGC滥用恶用的安全治理进行了研究。归纳了滥用恶用AIGC对国家安全、行业创新、生产生活等三方面威胁,总结出AIGC政策尺度有待细化、联动合力有待提升、技术赋能有待加强等难点。最后,从健全制度规则、加强技术创新、优化监管手段等方面提出对策建议,对促进AIGC规范应用和健康发展具有重要启示作用。

THE END
1.电子签名软件有哪些电子签章数字签名软件哪个好用2024年电子签名十大品牌最新发布,电子签名排行榜前十名品牌有e签宝、上上签、法大大、信步云、安心签、大家签、腾讯电子签、诚信签、一签通、密信。电子签名10大品牌排行榜由品牌研究部门收集整理大数据分析研究得出,帮助你了解数字签名软件哪个好。https://m.maigoo.com/maigoo/9380dzqm_index.html
2.AI写诗在线自动写诗软件藏头诗生成器请输入主题或关键词 五言绝句 五言律诗 七言绝句 七言律诗 字体设置 字号 字体颜色 背景设置 开始创作 在线写诗、创作藏头诗 在线快速生成 输入关键词后在线快速一键智能生成古诗 诗句连贯通畅 AI生成的诗句前后连贯通畅,上口容易记 诗体多样化 藏头诗,五言绝句律诗,七言绝句律诗多种诗体任意选 https://www.gaituya.com/aixieshi/
3.10款优秀的AI生成logo软件,简单易上手2.AI logo生成软件推荐 2.1 Pixso AI Pixso AI是在线矢量编辑工具Pixso的内置AI助手,基于人工智能AI,帮助用户完成创意探索。Pixso AI目前具备文生图、图标生成、AI翻译、灵感专家、设计规范生成、设计元素检查清单6大功。其中AI生成图标风格多样,可在线生成扁平、2.5D毛玻璃、3D、拟物、游戏、logo,满足多元化需求。Pixsohttps://pixso.cn/designskills/10-ai-logo-generation-softwares/
4.爆火的AI网站工具合集,30个自动生成内容网站推荐!在现今的技术驱动型社会中,人工智能(AI)的发展无疑是当之无愧的热门话题。每一次AI技术的进步,都会引发一阵媒体狂潮。今天,我们将介绍30个AI网站工具,它们不仅是AI领域的革新者,更是为不同领域提供了无限可能的解决方案。https://boardmix.cn/article/30-ai-website-tools/
5.昇腾学院昇腾AI处理器软件栈离线模型生成 以卷积神经网络为例,在深度学习框架下构造好相应的网络模型,并且训练好原始数据,再通过离线模型生成器进行算子调度优化、权重数据重排和压缩、内存优化等,最终生成调优好的离线模型。离线模型生成器主要用来生成可以高效执行在昇腾AI处理器上的离线模型。 https://blog.51cto.com/u_15214399/2810247
6.远光软件什么是AI? 人工智能(Artificial Intelligence),是一门综合了 计算机科学、生理学、哲学的交叉学科。凡是使用机器代 替人类实现认知、识别、分析、决策等功能,均可认为使 用了人工智能技术。作为一种基础技术,人工智能在很多 行业都有用武之地。 了解更多 https://www.ygsoft.com/zt/ai2018/index.html
7.AI写小说绘画剪视频,生成式AI更火了近日,生成式AI又火了!一个叫做「盗梦师」的微信小程序,上线一鸣惊人,达成了日增5万新用户的纪录。 盗梦师是一个能根据输入文本生成图片的AI平台,属于AIGC(AI-Generated Content,即人工智能生成内容)的分支。 在用户发挥想象,输入文字描述后,盗梦师便可生成1:1、9:16和16:9三种比例的图片,还有24种绘画风格https://36kr.com/p/1993822961414916
8.没有审核的ai绘画软件不用审核的ai绘画ai绘画生成器无审核飞翔游戏网为大家整合了一系列无需审核的ai绘画软件,近期ai人工智能相关的话题十分火热,在chatgpt横空出世之前,ai绘画已经范围性的火起来了,ai绘画软件随着市场的需求增多也越来越多地被开发出来,那么没有审核、无需审核的ai绘画软件有哪些呢?跟小编一起来看看吧! 其他绘画推荐: 免费的ai作图软件 画世界pro软件合集https://www.fxxz.com/k/myshdaihh/
9.AI人工智能sora视频生成制作教程,图文完整版软件方法步骤随着人工智能技术的不断发展,越来越多的领域开始应用AI技术进行视频生成制作。其中,AI人工智能sora是一款备受瞩目的视频生成软件,它能够将文字转化为高质量的视频内容。下面将详细介绍AI人工智能sora视频生成制作的教程,包括软件安装、基本操作、进阶技巧等方面的内容,帮助大家快速掌握这款软件的使用方法。 sora全部学习视频https://www.jianshu.com/p/086d7c9e90da
10.2023年10款好用的AI生成PPT软件盘点,干货建议收藏!AI生成PPT软件使用先进的人工智能算法,可在几分钟内生成具有专业外观的演示文稿,无需事先具备设计专业知识。 大多数AI生成PPT软件能够分析输入提示、生成相关内容,提供适当的布局和设计建议,并提供自定义选项。其中一些软件还带有额外的AI功能,例如从文本生成图片(即AI绘画)以及将文档一键转换为PPT演示文稿。借助AI生成https://www.hxsd.com/information/4891/