生成式人工智能滥用恶用的安全威胁及对策建议研究

以ChatGPT为代表的生成式人工智能(AIGeneratedContent,AIGC)给人类社会带来了巨大的技术红利,为第四次工业革命提供了新动能。但也逐渐暴露出一系列安全风险。尤其是2022年下半年以来,暗网涌现出WormGPT、PoisonGPT、EvilGPT等一批恶意人工智能大模型,给AIGC的安全治理带来了新的严峻挑战,亟待未雨绸缪加强治理。

一、生成式人工智能滋生了恶意大模型的新威胁

生成式人工智能滋生了一批恶意人工智能大模型。恶意人工智能大模型是指由非法组织或不法分子操纵,借助开源模式模仿ChatGPT等合法模型,基于有害语料库训练而生滋生的、专门用于网络犯罪、诈骗等非法行为的一类非法大模型。恶意大模型与人工智能的滥用还不尽相同,其产生的直接目的就是用于各类非法行为,主要运行于暗网,具有更强的隐蔽性、危害性,形成了“人工智能+犯罪”新治理挑战,对国家安全、行业创新、生产生活等方面造成危害。

(一)对维护国家安全提出新挑战

滥用恶用AIGC给国家政治和军事带来了新的安全挑战。一是在意识形态安全方面,AIGC在数据投喂、算法训练等环节易受到核心技术掌控方操纵,出现污染投毒和算法偏见等问题。可能成为西方国家对华“认知战”的新工具。二是在技术自主可控方面,霸权国家主导AIGC标准制定,技术相对弱势的国家可能盲目大规模进行产品使用和追随开发,出现因科技封锁和贸易制裁等遭遇“卡脖子”危险。三是在国防军事安全方面,AIGC提高了作战人员、武器和指挥信息系统的智能交互水平,对历史战况和现实情报通过先进算法进行快速推演分析,提升打击精度和反应速度。美国军方在2023年已开始利用AIGC撰写国防咨询报告,并成立Lima工作组在五角大楼评估、整合和使用该技术。

(二)对行业应用创新造成新冲击

滥用恶用AIGC给产业和行业发展带来了新的安全冲击。一是在教育就业方面,各种AIGC产品总体内容质量仍良莠不齐,容易出现创作的“劣币驱逐良币”现象。利用AIGC辅助完成课业和学术研究减少了必要的批判甄别和分析研究过程,会产出更多虚假信息和学术垃圾。二是在产业转型方面,大部分传统行业数字化转型进程仍较为缓慢,对于正确运用AIGC收集、处理数据,并将其应用于研发、生产、销售等各环节的意愿和能力尚且不足,大规模盲目引入AIGC可能会适得其反。

(三)对生产生活方式带来新威胁

二、生成式人工智能安全治理难点

(一)包容审慎存在失衡,政策尺度有待细化

AIGC是一个新生事物,其发展规律还未完全明晰,包容审慎的政策尺度和平衡点较难把握。一方面,目前AIGC安全治理政策在适应数字时代新型商业模式和秩序框架,鼓励新业态自主创新、资源共享、国际合作等方面还有待健全完善。另一方面,在AIGC政策具体实施层面还存在市场形势判断难、干预时机决断难、责任主体划分难等难点,市场主体开展安全可信技术创新激励和容错措施尚未制度化。包容审慎监管试点较少,对拟实施或已实施的监管产生的积极影响和消极影响进行评估的监管影响分析程序重视度不够,科技伦理治理公共服务平台有待建设。

(二)协同治理能力不足,联动合力有待提升

(三)监管手段相对滞后,技术赋能有待加强

“以技术管技术、以技术治技术”的监管治理体系尚不健全。在伦理安全层面,深度伪造技术层出不穷,而检测算法的泛化性、鲁棒性等还有待提升。在算法安全层面,算法安全内生机理、风险评估、全生命周期安全监测等关键技术支撑还需进一步加强。在数据安全层面,数据安全监测预警技术有待创新,数字贸易跨境监管仍有进步空间。非现场、物联感知、穿透式等新型监管手段运用不够充分,监管智能化水平有待提升。

三、生成式人工智能安全治理对策建议

(一)健全制度规则,提升政企协同治理能力

1.政府发挥规范引导指挥棒作用

一是加大查处管控和宣传教育。实行包容审慎和分类分级监管,监控查处非法使用和传播恶意AIGC行为,管制违规账号。二是健全技术规范和评价标准。制定AIGC预训练和优化训练数据、标注、数据分类分级保护等方面的国家标准,以及深度伪造、智能群呼设备等高风险AI技术的使用规范。三是完善法律体系和制度框架。采用安全港等机制处理内容责任归属问题,加强和改进反垄断和反不正当竞争执法。探索我国数据存储体系优化,构建数据被动出境的主动防御体系,建立跨境数据流动规则和白名单等机制。

(二)加强技术创新,健全安全治理技术体系

1.完善人工反馈的强化学习机制

注重对人工反馈的强化学习机制(RLHF)的优化。从与训练语言模型、收集数据并训练奖励模型、强化学习微调语言模型等阶段,降低数据成本、优化算法、改进微调策略,防止被某些策略绕开而产出不当内容,使模型与人类需求对齐。自动化调用模型知识,进一步降低对大规模高质量人工标注数据的依赖。

2.加强模型安全技术研究及应用

一是部署数据和模型安全防御。通过优化鲁棒训练算法应对数据投毒,采取截断混淆、差分隐私等手段使模型隐私信息模糊化,采取模型水印、模型指纹等溯源手段保障知识产权专有性。二是做好各类接口安全性设计。采用身份验证、日志监控、网关等技术手段加强API和网页端接口的安全防范管理。使用VPN等加密通道传输数据,部署抗DDoS工具,使用嗅探器等检测安全问题并跟踪数据泄露。三是分析研究新型LLM。探索利用人工智能工具逐步实现自动化对抗恶意AIGC,进而用大模型“对抗”大模型。

(三)优化监管手段,提升智能治理监管能力

四、结语

本文对AIGC滥用恶用的安全治理进行了研究。归纳了滥用恶用AIGC对国家安全、行业创新、生产生活等三方面威胁,总结出AIGC政策尺度有待细化、联动合力有待提升、技术赋能有待加强等难点。最后,从健全制度规则、加强技术创新、优化监管手段等方面提出对策建议,对促进AIGC规范应用和健康发展具有重要启示作用。

THE END
1.AI系列之考砸了!用GAN来模拟家长签名总结来说,基于生成对抗网络,AI能够以特定笔迹来代签姓名、誊抄课文,画风一模一样那种,就连模拟医生的“天书”处方也不在话下。 感觉学好AI笔迹模拟后,我的手写技能可以直接荒废了(bushi)。 图:仿冒家长签名 不过,这里必须敲黑板划重点:虽然AI笔迹模拟很强大,但做人还是得诚实! https://zhuanlan.zhihu.com/p/409326448
2.配音在线生成免费人工智能名片在线制作免费生成?4、选择了人工智能名片小程序后,然后点击进去创建名片,依次填写相应资料,随后即可创建到一张微信小程序名片。 5、选择了一个小程序后,然后点击进去创建名片商城,依次填写相应资料,编辑产品信息并上传,随后即可创建一个属于自己的微信小程序名片商城。 6、最后一键生成电子名片,直接转发给好友、客户,让这个高大上的名片https://tool.a5.cn/article/show/72608.html
3.难逃版权争议,网友:生成图像里又看到画家签名了但仍难逃版权争议,网友:生成图像里又看到画家签名了 Lensa本质上是利用AI来编辑剪辑视频。这次爆火的生成头像,只是功能之一。 一股晒AI生成头像的热潮,又一次席卷而来。 微博、推特、小红书等平台再次沦陷: 网友们纷纷表示,这次AI出图hin满意~ 引发这波热潮的,是一个名叫Lensa的APP。https://www.51cto.com/article/742196.html
4.tpm2零代码企业数字化知识站3、数字签名 TPM 2.0 可以生成数字签名,用于验证数据的完整性和来源。这对于确保数据在传输过程中的真实性和防止篡改非常重要。 4、设备认证 TPM 2.0 可以用于设备认证,通过提供独特的硬件标识符来验证设备的身份。这有助于防止未经授权的设备接入网络或系统。 https://www.jiandaoyun.com/blog/article/728341/
5.Web3生态系统中的AI应用前景Web3世界另一个 Web 3 可以为人工智能提供帮助的领域是,在专有机器学习模型作为服务提供时,最小化对服务提供者的信任。用户可能需要验证他们所支付的服务是否真正得到了提供,或获得机器学习模型公平执行的保证,即所有用户都使用同一模型。零知识证明可用于提供此类保证。在此架构中,机器学习模型的创建者生成一个表示该模型的零https://www.web3sj.com/news/60733/
6.快看!这幅画拍出300万元,作者:人工智能!签名竟是数学方程式签名竟是数学方程式 随着写诗、唱歌相继被人工智能“攻克”后,人工智能“创作”的画作已登上拍卖市场,并拍出了超过300万元的价格。 一直以来,人工智能被认为难以替代人类完成某些有创造性的工作。但这样的认识恐怕要因最近的一次拍卖而有所改变了。 随着写诗、唱歌相继被人工智能“攻克”后,人工智能“创作”的画作已https://www.jfdaily.com/wx/detail.do?id=112679
7.多维度解析DePIN如何助力人工智能?如果有一天每条内容都有加密签名,每个人都能可验证地证明创作来源,标记篡改或伪造行为,那我们将迎来美丽的世界。 AI 生成摘要:AI 可能对社会构成重大威胁,尤其是 deepfake 和未授权使用内容,而Web3技术,如使用数字签名的创作者证明和使用 IPFS 和默克尔树的真实性证明,可以验证数字内容的真实性,防止未经授权的更改,https://528btc.com/news/12091237.html
8.网页一键生成app软件(apk生成器)苹果签名行业咨询苹果签名身为资深创作者,倾情向您推荐一款高效实用且免费的原创文章生成软件,借助这款软件,您将能轻易创作出高质量、原创的优质文章,提升您的写作效能及资源利用度。 1.软件介绍: 本款纯免费的原文定制插件依托尖端人工智能技术研发而成,可依据用户设置自动生成相应主题的原创文章。无论是新晋作家还是资深业界专家,均能从中获https://www.chuanqihezi.com.cn/post/1991.html
9.odoo17官方版本发布白皮书,全部功能及重要更新ReleaseNote添加使用可用的电汇银行帐户重新生成付款指令的可能性。 Xendit 添加了覆盖印度尼西亚和菲律宾的 Xendit 支付提供商。 工资单 帐号验证 通过在帐号更改时引入警告,避免向错误的银行帐号付款。 自动取消签名请求 现在,当合同被取消或拒绝时,签名请求会自动取消。 https://www.odooapp.cn/blog/odoo-install-deploy-6/odoo17-official-release-all-functions-and-important-updates-315
10.PKI前线人工智能在PKI管理中的优势与风险人工智能PKI对于管理公钥基础设施(PKI)的团队来说,人工智能可能是一种福音。如果战略性地、彻底地实施AI与PKI系统的集成可以极大地提高组织安全态势的可靠性和效率。在本文中,我们将探讨行业趋势与相关数据,以帮助您理解与AI和PKI管理相关的威胁和机遇。https://www.racent.com/blog/380
11.电子签名生成图片电子签名生成素材图片大全摄图网图片库智能匹配电子签名生成图片素材专题,该电子签名生成图片大全提供:电子签名生成高清图片、电子签名生成摄影图、电子签名生成素材等。助您电子签名生成图片素材设计丰富灵感、充实电子签名生成图片设计模板素材。我们欢迎您下载正版图片素材,授权图片有版权、商用https://699pic.com/image/dianziqianmingshengcheng.html
12.网络空间安全动态(202432期)编者按:网安动向热讯,本期有八点值得关注:一是工信部印发《关于推进移动物联网“万物智联”发展的通知》;二是国家互联网信息办公室发布《人工智能生成合成内容标识办法(征求意见稿)》;三是中证协发布《证券公司网络安全事件舆情处置示范案例》;四是美拟全面禁用中国智能网联汽车软硬件;五是美空军发布“网络数据模式”https://metc.njtc.edu.cn/info/1141/5212.htm
13.人工智能生成图片标题视觉注意力,即擅长细节,并且具有擅长综合性的语义注意力,同时利用了这两种注意力生成标题 我们的优势: 小花儿人工智能科技鉴黄接口1天可以处理一亿张图片,并且24小时不间断工作。准确度超过99.5%,可以替代80%以上的人工审核,并且可以不断学习提高准确度. https://www.xiaohuaerai.com/trail/img2txt
14.第2部分:通过SparkPost签名密封和交付如果您只是测试,可以使用 Linux 上的命令行工具 openssl 为电子邮件地址生成“自签名”证书和密钥,遵循 此过程。在该过程结束时,您将拥有一个 smime.p12 文件。将此文件重命名以匹配您的发送身份,包括 @ 符号,例如,alice@example.com.p12 。 或者 b) 具有外部有效性的密钥/证书 如果您想获得能够签署的外部有效http://messagebird.com/zh/blog/s-mime-part-2-signed-sealed-delivered-sparkpost
15.人工智能导航,一站式AI导航大全NCouchbase 推出用于开发人工智能的服务套件 AI技术 6天前 NAWS 在 Connect、AI IVR、聊天信用卡中添加了 Amazon Q AI技术 6天前 NAnthropic 的新标准引发了人工智能隐私和其他问题 AI技术 6天前 如何为人工智能开发准备数据 AI技术 1周前 AI绘画 more+ Ideogram.ai 生成带有文本的图像方面具有独特优势https://tools.voidke.com/ai
16.10款优秀的AI生成logo软件,简单易上手2.AI logo生成软件推荐 2.1 Pixso AI Pixso AI是在线矢量编辑工具Pixso的内置AI助手,基于人工智能AI,帮助用户完成创意探索。Pixso AI目前具备文生图、图标生成、AI翻译、灵感专家、设计规范生成、设计元素检查清单6大功。其中AI生成图标风格多样,可在线生成扁平、2.5D毛玻璃、3D、拟物、游戏、logo,满足多元化需求。Pixsohttps://pixso.cn/designskills/10-ai-logo-generation-softwares/
17.以后深夜emo,直接让Coze一键生成个签让哥哥猜以后我根据用户的需求和你的专业知识,设计出符合用户个性和需求的签名,这种个签一般是一句话或者一段话,可以是自己的心情、感悟、格言、喜欢的歌词等等,只要能表达出你的个性就可以了。 确保签名的内容遵守所有法律法规,不得歧视、侮辱、恶俗等。 技能1: 根据用户提供的词语,生成自定义的个性签名。 https://juejin.cn/post/7330398758591873064
18.AIGC2018年,一幅由人工智能生成的画作在佳士得拍卖行以43.25万美元的价格成交,这是世界上首次售出的人工智能艺术品,引起了广泛的关注。随着人工智能在内容创作领域的应用越来越多,人工智能生成内容(Artificial Intelligence Generated Content,简称AIGC)的概念逐渐兴起。这一概念指的是利用人工智能技术生成各种形式的内容,如文本https://www.zzbaike.com/wiki/AIGC
19.高盛两万字报告首发:生成式人工智能,到底是炒作还是真正的变革此外,在过去十年中,学术和工业实验室在人工智能领域取得了令人难以置信的进步,如卷积神经网络(CNN,腾讯科技全文编译注)、生成式对抗网络(GAN,腾讯科技全文编译注)、强化学习(RL,腾讯科技全文编译注)等。尤其是基于Transformer的放大模型,其能力和通用性令人震惊。过去五年的研究加速巩固了我的信念,即人工智能的发展正在https://www.thinkphp.cn/news/236
20.RK3588主板/开发板Android12系统APK签名文件生成的方法,干货满满本文介绍瑞芯微RK3588主板/开发板Android12系统下,APK签名文件生成方法。触觉智能EVB3588开发板演示,搭载了瑞芯微RK3588芯片,该开发板是核心板加底板设计,音视频接口、通信接口等各类接口一应俱全,可帮助企业提高产品开发效率,缩短上市时间,降低成本和设计风险。 工具准备 下载Keytool-ImportKeyPair工具 在源码:build/tarhttps://m.elecfans.com/article/6382804.html
21.[AI]生成式人工智能的应用[3]生成式人工智能模型及其基于特定应用的分类 列出可用模型、了解其功能并选择合适模型的过程 OpenAl 提供的 Completion API 和 Chat Completion API、它们的关键属性以及如何使用这些 API 来创建聊天机器人和写作助手等应用程序 完成和聊天完成 API 的高级选项可帮助我们引导模型,从而控制生成 - 例如,使用 Logit Bias 影响https://blog.csdn.net/u013716859/article/details/134749541
22.AI写诗在线自动写诗软件藏头诗生成器请输入主题或关键词 五言绝句 五言律诗 七言绝句 七言律诗 字体设置 字号 字体颜色 背景设置 开始创作 在线写诗、创作藏头诗 在线快速生成 输入关键词后在线快速一键智能生成古诗 诗句连贯通畅 AI生成的诗句前后连贯通畅,上口容易记 诗体多样化 藏头诗,五言绝句律诗,七言绝句律诗多种诗体任意选 https://www.gaituya.com/aixieshi/
23.AISignatureGenerator一款免费的AI签名生成工具,用户可以使用它生成不同风格的AI签名,并将其用于数字方式的文档签署中。 网站提供:Ai工具箱,Ai办公应用,AI签名生成器,AISignatureGenerator,AI签名生成器,AI签名制作器,免费AI签名生成器,免费在线签名生成器,在线签名生成器,在线签名制作器,电子签名,数字签名。 AI Signature Generator简介 使https://openi.cn/sites/258815.html