生成式人工智能滥用恶用的安全威胁及对策建议研究

以ChatGPT为代表的生成式人工智能(AIGeneratedContent,AIGC)给人类社会带来了巨大的技术红利,为第四次工业革命提供了新动能。但也逐渐暴露出一系列安全风险。尤其是2022年下半年以来,暗网涌现出WormGPT、PoisonGPT、EvilGPT等一批恶意人工智能大模型,给AIGC的安全治理带来了新的严峻挑战,亟待未雨绸缪加强治理。

一、生成式人工智能滋生了恶意大模型的新威胁

生成式人工智能滋生了一批恶意人工智能大模型。恶意人工智能大模型是指由非法组织或不法分子操纵,借助开源模式模仿ChatGPT等合法模型,基于有害语料库训练而生滋生的、专门用于网络犯罪、诈骗等非法行为的一类非法大模型。恶意大模型与人工智能的滥用还不尽相同,其产生的直接目的就是用于各类非法行为,主要运行于暗网,具有更强的隐蔽性、危害性,形成了“人工智能+犯罪”新治理挑战,对国家安全、行业创新、生产生活等方面造成危害。

(一)对维护国家安全提出新挑战

滥用恶用AIGC给国家政治和军事带来了新的安全挑战。一是在意识形态安全方面,AIGC在数据投喂、算法训练等环节易受到核心技术掌控方操纵,出现污染投毒和算法偏见等问题。可能成为西方国家对华“认知战”的新工具。二是在技术自主可控方面,霸权国家主导AIGC标准制定,技术相对弱势的国家可能盲目大规模进行产品使用和追随开发,出现因科技封锁和贸易制裁等遭遇“卡脖子”危险。三是在国防军事安全方面,AIGC提高了作战人员、武器和指挥信息系统的智能交互水平,对历史战况和现实情报通过先进算法进行快速推演分析,提升打击精度和反应速度。美国军方在2023年已开始利用AIGC撰写国防咨询报告,并成立Lima工作组在五角大楼评估、整合和使用该技术。

(二)对行业应用创新造成新冲击

滥用恶用AIGC给产业和行业发展带来了新的安全冲击。一是在教育就业方面,各种AIGC产品总体内容质量仍良莠不齐,容易出现创作的“劣币驱逐良币”现象。利用AIGC辅助完成课业和学术研究减少了必要的批判甄别和分析研究过程,会产出更多虚假信息和学术垃圾。二是在产业转型方面,大部分传统行业数字化转型进程仍较为缓慢,对于正确运用AIGC收集、处理数据,并将其应用于研发、生产、销售等各环节的意愿和能力尚且不足,大规模盲目引入AIGC可能会适得其反。

(三)对生产生活方式带来新威胁

二、生成式人工智能安全治理难点

(一)包容审慎存在失衡,政策尺度有待细化

AIGC是一个新生事物,其发展规律还未完全明晰,包容审慎的政策尺度和平衡点较难把握。一方面,目前AIGC安全治理政策在适应数字时代新型商业模式和秩序框架,鼓励新业态自主创新、资源共享、国际合作等方面还有待健全完善。另一方面,在AIGC政策具体实施层面还存在市场形势判断难、干预时机决断难、责任主体划分难等难点,市场主体开展安全可信技术创新激励和容错措施尚未制度化。包容审慎监管试点较少,对拟实施或已实施的监管产生的积极影响和消极影响进行评估的监管影响分析程序重视度不够,科技伦理治理公共服务平台有待建设。

(二)协同治理能力不足,联动合力有待提升

(三)监管手段相对滞后,技术赋能有待加强

“以技术管技术、以技术治技术”的监管治理体系尚不健全。在伦理安全层面,深度伪造技术层出不穷,而检测算法的泛化性、鲁棒性等还有待提升。在算法安全层面,算法安全内生机理、风险评估、全生命周期安全监测等关键技术支撑还需进一步加强。在数据安全层面,数据安全监测预警技术有待创新,数字贸易跨境监管仍有进步空间。非现场、物联感知、穿透式等新型监管手段运用不够充分,监管智能化水平有待提升。

三、生成式人工智能安全治理对策建议

(一)健全制度规则,提升政企协同治理能力

1.政府发挥规范引导指挥棒作用

一是加大查处管控和宣传教育。实行包容审慎和分类分级监管,监控查处非法使用和传播恶意AIGC行为,管制违规账号。二是健全技术规范和评价标准。制定AIGC预训练和优化训练数据、标注、数据分类分级保护等方面的国家标准,以及深度伪造、智能群呼设备等高风险AI技术的使用规范。三是完善法律体系和制度框架。采用安全港等机制处理内容责任归属问题,加强和改进反垄断和反不正当竞争执法。探索我国数据存储体系优化,构建数据被动出境的主动防御体系,建立跨境数据流动规则和白名单等机制。

(二)加强技术创新,健全安全治理技术体系

1.完善人工反馈的强化学习机制

注重对人工反馈的强化学习机制(RLHF)的优化。从与训练语言模型、收集数据并训练奖励模型、强化学习微调语言模型等阶段,降低数据成本、优化算法、改进微调策略,防止被某些策略绕开而产出不当内容,使模型与人类需求对齐。自动化调用模型知识,进一步降低对大规模高质量人工标注数据的依赖。

2.加强模型安全技术研究及应用

一是部署数据和模型安全防御。通过优化鲁棒训练算法应对数据投毒,采取截断混淆、差分隐私等手段使模型隐私信息模糊化,采取模型水印、模型指纹等溯源手段保障知识产权专有性。二是做好各类接口安全性设计。采用身份验证、日志监控、网关等技术手段加强API和网页端接口的安全防范管理。使用VPN等加密通道传输数据,部署抗DDoS工具,使用嗅探器等检测安全问题并跟踪数据泄露。三是分析研究新型LLM。探索利用人工智能工具逐步实现自动化对抗恶意AIGC,进而用大模型“对抗”大模型。

(三)优化监管手段,提升智能治理监管能力

四、结语

本文对AIGC滥用恶用的安全治理进行了研究。归纳了滥用恶用AIGC对国家安全、行业创新、生产生活等三方面威胁,总结出AIGC政策尺度有待细化、联动合力有待提升、技术赋能有待加强等难点。最后,从健全制度规则、加强技术创新、优化监管手段等方面提出对策建议,对促进AIGC规范应用和健康发展具有重要启示作用。

THE END
1.AI造字签名免费AI造字签名免费生成AI造字在线预览转换关键词列表>AI造字 预览签名 劲草体生成签名 小可爱生成签名 敏行签生成签名 行书签生成签名 青春草生成签名 瘦金体生成签名https://www.qianming.cn/keywords/963434
2.艺术签名在线生成器最高支持四个字的中文名字设计,如果是英文名请进入英文签名设计专用页面,这里只能输入中文,英文显示乱码。 艺术签名在线生成软件经过多年的迭代,现在是7.0版本,更新了多处细节,如调整签名字与字的间距,优化生成签名的风格等大幅提升用户体验。http://www.kachayv.cn/
3.AISignatureGenerator:在线AI签名生成器,轻松创建专业电子签名AI Signature Generator 是一个强大的在线AI签名生成器工具,帮助用户轻松创建个性化和专业的电子签名。您可以通过输入名字或首字母,或者直接绘制签名,生成适用于数字文件的签名。这个工具特别适合需要在PDF、Word文件或电子邮件中使用签名的场景。https://pidoutv.com/sites/25085.html
4.AI姓氏签名头像定制,简单易操作怎么让ai生成签名设计首先,AI姓氏签名头像定制的简便操作让用户能够轻松地定制属于自己的独特头像。通过这项服务,用户只需输入自己的姓氏和个人偏好,AI系统即可根据用户提供的信息,生成符合用户要求的个性化签名头像,无需复杂的操作步骤,省时省力。 其次,AI姓氏签名头像定制服务注重创意设计,为用户提供丰富多样的选择。AI系统通过智能算法和设计https://blog.csdn.net/qq_61688755/article/details/138677280
5.10款优秀的AI生成logo软件,简单易上手2.1 Pixso AI Pixso AI是在线矢量编辑工具Pixso的内置AI助手,基于人工智能AI,帮助用户完成创意探索。Pixso AI目前具备文生图、图标生成、AI翻译、灵感专家、设计规范生成、设计元素检查清单6大功。其中AI生成图标风格多样,可在线生成扁平、2.5D毛玻璃、3D、拟物、游戏、logo,满足多元化需求。Pixso AI每日赠送20个AI点数https://pixso.cn/designskills/10-ai-logo-generation-softwares/
6.《人工智能国际治理观察》170期据悉,其七大核心能力包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力,目前讯飞星火认知大模型已在中文长文本生成、知识问答、数学能力三大能力上超越ChatGPT。在行业应用方面,“大模型+人工智能(AI)https://aiig.tsinghua.edu.cn/info/1442/1901.htm
7.AIGC2018年,一幅由人工智能生成的画作在佳士得拍卖行以43.25万美元的价格成交,这是世界上首次售出的人工智能艺术品,引起了广泛的关注。随着人工智能在内容创作领域的应用越来越多,人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)的概念逐渐兴起。这一概念指的是利用人工智能技术生成各种形式的内容,如文本https://www.zzbaike.com/wiki/AIGC
8.来自通义万相的创意加速器:AI绘画创作过去的和AI智能的聊天对话,以及现在的基于AI的文生图、文生音频、文生视频,其实AI人工智能的发展,可以说已经极大的丰富了我们的日常生活和工作。现在目之所及,在各行各业都可以看到AI的身影,比如你可以利用AI生成工作年报,或者数据分析,为决策提供依据等等。那么今天我们主要是来感受一下AI在绘画创作行业的重要作用https://developer.aliyun.com/article/1565129
9.AI生成logo怎么做?分享个简单的logo生成方法在现代社会中,logo已经成为了公司、品牌、产品等的象征,因此设计一个好的logo变得越来越重要。现在,人工智能的快速发展使得AI可以帮助我们更轻松地设计logo。本文将介绍如何在手机上利用AI生成logo的简单方法。 AI生成logo的应用 AI生成的logo是一种基于算法和机器学习的设计方法,它可以根据用户的要求快速生成多种可能的https://cloud.tencent.com/developer/news/1121584
10.辨识AI视频越来越难?办法不是没有—新闻—科学网中国科学院自动化研究所研究员董晶研究的就是图像窜改、深度伪造等人工智能内容安全与对抗技术,她和研究团队的许多成果已应用于多媒体智能鉴伪。面对AI越来越强大的功能,技术上有哪些应对的方法和手段?普通公众面对视频内容时如何“多留几个心眼儿”,以防上当受骗?为此,《中国科学报》采访了董晶。 https://news.sciencenet.cn/htmlnews/2024/3/518255.shtm
11.生成式AI来了,我们还能相信自己的眼睛吗?这便是生成式AI的一种应用。 021生成式AI:未来的重要技术战略 日前,Gartner发布了2022年重要战略技术趋势。其中,生成式人工智能(Generative Artificial Intelligence)位列12项重要战略之首。 同时Gartner预计,到2025年,生成式人工智能将占所有生成数据的10%,而目前这一比例还不到1%。 https://36kr.com/p/1498655379610886.html?ivk_sa=1023197a
12.国投智能破局虚假信息:AI鉴真,守护真相针对虚假信息的发现识别,国投智能自主研发AI生成内容检测鉴定的核心引擎,推出AI-3300慧眼视频图像鉴真工作站、人工智能大模型内容检测平台、美亚鉴真内容检测平台小程序等产品,全面支持人工智能生成视频、图像和文本等多媒体内容的检测。目前,市面常见的内容生成工具(如:ChatGPT、Sora、Midjourney、Stable Diffusion等)所生成https://finance.sina.cn/2024-10-31/detail-incumwna4086271.d.html
13.[推荐]每日资讯Meta组建顶级AI团队,欲开发自家ChatGPTIOA需要借助人工智能和自动化技术来提供关于攻击者意图的准确实时的数据。 CrowdStrike、ThreatConnect、Deep Instinct和Orca Security都是使用AI和ML简化IOC的领导者。其中,CrowdStrike是第一家也是唯一一家基于AI的IOA提供商。 CrowdStrike基于AI的IOA在一个通用平台上结合了云原生ML和人类专业知识,同时将AI生成的IOA(行为https://bbs.kanxue.com/thread-275927.htm
14.快看!这幅画拍出300万元,作者:人工智能!签名竟是数学方程式签名竟是数学方程式 随着写诗、唱歌相继被人工智能“攻克”后,人工智能“创作”的画作已登上拍卖市场,并拍出了超过300万元的价格。 一直以来,人工智能被认为难以替代人类完成某些有创造性的工作。但这样的认识恐怕要因最近的一次拍卖而有所改变了。 随着写诗、唱歌相继被人工智能“攻克”后,人工智能“创作”的画作已https://www.jfdaily.com/wx/detail.do?id=112679