知网与秘塔之争:AI搜索引擎的版权边界在哪里?索引库

作者|游云庭上海大邦律师事务所高级合伙人、知识产权律师

编辑|布鲁斯

近日,知网向人工智能搜索服务商秘塔发送侵权通知,要求其立即断开知网内容搜索结果链接。无独有偶,一个月前拥有《纽约客》、《时尚》、和《连线》的美国杂志巨头康泰纳仕集团也曾向人工智能搜索引擎Perplexity发出过类似侵权通知。作为秘塔和Perplexity的用户,今天就来分析下:知网有权要求秘塔断开链接吗?

一、知网的robots文件并未屏蔽秘塔

搜索引擎是否有权对互联网站内容进行抓取,是由网站robots文件的设置决定的,如果网站的robots文件不允许抓取,则搜索引擎强行抓取可能有不正当竞争风险,有意思的是,虽然知网给秘塔发函要求断开链接,也就是不允许其抓取网页内容,但其网站的主站robots文件[i]网页却显示:很抱歉!您浏览的页面不存在,可能已被删除或转移。也就是说,知网主站并没有禁止任何搜索引擎爬虫。

当然,现在很多的人工智能搜索引擎的爬虫确实也不讲武德,其不像传统的百度、谷歌、搜狗、必应那样把自家的爬虫进行命名,而是默不作声的匿名爬取,比如前文提到的Perplexity公司CEO接受采访时公然表示,哪怕你禁止我的爬虫,我也不保证不抓取你的网页,因为我的工具包括匿名的第三方爬虫[ii]。但至少从技术上,知网没有屏蔽秘塔的爬虫。

二、屏蔽特定爬虫要有正当理由

可能有读者会问,我的地盘我做主,网站所有人要屏蔽别人为什么还要有正当理由?这里涉及两方面的问题,一个是《反垄断法》,另一个是行业协会的规定。

1、知网有市场支配地位

2022年国家市场监管总局曾认定知网在中国境内中文学术文献网络数据库服务市场具有支配地位,并因其其他的垄断行为,对其处以8760万元罚款。我国《反垄断法》第二十二条规定:禁止具有市场支配地位的经营者从事下列滥用市场支配地位的行为:没有正当理由,拒绝与交易相对人进行交易。所以,有市场支配地位的知网,要求秘塔搜索断开链接需要有正当理由的,否则就涉嫌拒绝交易的违法垄断。

2、行业公约规定限制搜索引擎抓取应有合理理由

多年前,中国互联网协会制定了《互联网搜索引擎服务自律公约》对搜索引擎爬取网站信息是否正当进行了规定。根据该公约第八条:互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由,不利用机器人协议进行不正当竞争行为,积极营造鼓励创新、公平公正的良性竞争环境。这个自律公约可以看做行业对于网站屏蔽搜索引擎标准的共识,知网的限制行为需要符合这个共识。

3、法院认为无正当理由屏蔽搜索引擎涉嫌不正当竞争

三、人工智能涉及的知识产权问题可以作为正当理由吗?

如果知网可以证明秘塔的系统抓取其网站大量论文并进行批量训练的,则可以主张训练行为涉嫌侵权其整体数据权利,构成不正当竞争,法律依据是《反不正当竞争法》第二条原则性条款,经营者在生产经营活动中,应当遵循自愿、平等、公平、诚信的原则,遵守法律和商业道德。

2、秘塔索引库如包含知网内容,可能侵权

根据网上公开的报道[iii],秘塔AI搜索的播客和文库板块是有索引库的,笔者理解的索引库可能是秘塔把批量收集的文献事先直接在内部做了一个索引数据库,当用户搜索时,秘塔会搜索网络对应的实时内容,然后利用人工智能把实时搜索结果和索引库的内容整合在一起提供答案。

3、过拟合可能导致输出结果侵权

如果出现搜索结果抄袭知网论文,或者秘塔制做索引数据库、或者向用户提供论文pdf的在线阅读功能的情况,都是侵犯信息网络传播权的行为,如果知网据此要求秘塔断开链接的,笔者认为是正当的。

4、抓取学术文献题录及摘要数据不一定侵权

笔者注意到,知网的侵权通知中称秘塔向用户提供知网的学术文献题录及摘要数据,涉嫌侵权。对秘塔抓取这两部分网页是否侵权,笔者倒是有不同意见。网页不同于论文,知网的学术文献题录(标题、作者、发表年份、期刊卷号、期号、页码以及摘要)及摘要网页都是国内用户公开可以访问的,知网作为在中国境内中文学术文献网络数据库服务市场具有支配地位的经营者,其不允许秘塔搜索抓取这两部分公开信息需要有合理的理由。如果秘塔清除了索引库中的知网论文,并且不再向用户提供知网论文的在线阅读功能,此时,知识产权侵权的争议就很小了,根据《反垄断法》和《互联网搜索引擎服务自律公约》,知网不允许秘塔搜索抓取这两部分公开信息就不再具有合理的理由。

THE END
1.河源市公共图书馆联盟亲爱的读者朋友: 您好! 多媒体电子阅览区目前因系统故障暂时无法使用,恢复时间将另行通知。 由此给您带来不便,敬请谅解! 河源市图书馆 2024年12月13日https://www.hylib.cn/information/704
2.读秀知识库广州新华学院在图书馆官网直接登录资源,如:读秀点击访问 或者在网页往下拉,找到“数字资源”如下图: 2.非校园网访问 通过广州新华学院企业微信平台或“融合门户”(统一身份认证访问→WebVPN→图书馆资源→(读秀) 移动端Webvpn PC端融合门户(统一身份认证:https://xhcas.xhsysu.edu.cn/lyuapServer/login)点击Webvpn访问 https://library.xhsysu.edu.cn/info/1491/4170.htm
3.关于广东工业大学校外VPN,不能登陆IEEE的解决办法1.首先我们要去广工官网下载一个软件奇安信大概长这样子,对了要使用校外VPN进入学校图书馆要购买校园网,大概300一年。 2.设置一下,stuvpn.gdut.edu.cn 443然后就是 账号:账号+@wifi 密码:密码 3.如果还是登陆不了知网或者IEEE,大家可以在文件夹输入这个路径找个这个文件用记事本打开看看内容 https://zhuanlan.zhihu.com/p/9708617281
4.广州图书馆·广图公告·广州图书馆2025年元旦期间开放安排广图公告 广州图书馆2025年元旦期间开放安排发布时间:2024-12-19 15:31:35 分享到 根据国务院办公厅《关于2025年部分节假日安排的通知》,结合本馆服务工作的实际情况,广州图书馆2025年元旦期间开放时间安排如下: 2025年1月1日(周三)9:00-16:00 特此通知。 广州图书馆 2024年12月19日https://www.gzlib.org.cn/bunotice/215129.jhtml
5.知网收录多篇“牛皮癣”式医疗软广?客服:来自期刊原文,没法屏蔽对于网友提出的“为何不屏蔽此类医疗软文”的疑问,上述客服人员解释:“这些内容发布于公开发行的期刊,没在屏蔽范围内。这个是正常的上网刊物合作,没有办法进行屏蔽。”知网检索到的医疗广告软文。知网官网截图 执业律师聂炜昌认为,从内容及刊发位置看,这明显是医疗软文。刊物名称《现代营销(创富信息版)》属于经济https://baijiahao.baidu.com/s?id=1818580114177101907&wfr=spider&for=pc
6.广州市图书馆可以用知网查重吗广州图书馆可以查知网文献吗本文给大家分享知网相似度查重类有关的方法,可以做为知网检测参考。 一、知网论文查重只能在图书馆检测吗 当然不是,只能在图书馆检测,你也可以通过电脑登录平台进行检测,当然手机也是可以的,只是说在图书馆检测的话,可能跟着方便。没有,在手机和电脑上操作那么复杂。 http://www.cleverschool.com/cnkichachong/191218.html
7.日本留学生必备的参考文献检索网站一览CiNii是日本国立情报研究所运营的日本最大的学术论文数据库,收录了日本各学术机构及团体的期刊论文和大学学报论文。相当于日本的知网。 输入关键词,并限定需要的筛选条件查询即可。看到下方有黄色框框的一半就可以下载。 注意!并不是CiNii上的论文都有电子版,可能有点只有纸质版,需要你去图书馆或者大学查找。 https://www.keedu.cn/news/view?id=142791
8.1搜索广州图书馆,进入官网进行注册登录2登录后回到首页给自己人分享一个不花钱也能下载知网论文的好方法,在家也可以用,,绝大多数都能下载。 1、搜索广州图书馆,进入官网进行注册登录 2、登录后回到首页,点击网页最右方的第四个点 3、在第四个点的页面(p3)里面点击知网进去就可以啦! 进去后你的登录账号是来自广图的就可以随便下载啦,大多数都能下载哦~ 希望能帮https://zealer.com/detail/1420531
9.广州图书馆跳转中国知网教程广州图书馆知网入口文章浏览阅读1.1w次。免费进入中国知网在线查阅公开的毕业论文教程1、进入广州图书馆官网首页,地址为:广州图书馆·首页 (gzlib.org.cn)2、在线注册普通读者证账号。3、登录进去在数字资源导航栏即可看到中国知网入口,如下图:_广州图书馆知网入口https://blog.csdn.net/wode3157695297/article/details/121057077
10.新生特辑丨广州软件学院图书馆篇现有馆藏纸质图书馆截止到2020年7月31日共计:389158种, 1203276册,生均图书84.1册,生均年购书4-5册。图书馆购买电子资源有:中国知网的四个库六个专辑资源;维普《中文期刊全文数据库》;超星尔雅百万电子图书、读秀知识库、名师讲坛;银符考试题库;百度文库;IEEE外文数据库;ACM外文数据库。图书馆建成千兆到馆百兆到http://www.fjgkedu.com/gkzzd/a/866716.html
11.信息检索大赛范文6篇(全文)为提升广大师生基础信息素养能力,4月23日星期六上午,为庆祝第16个世界读书日,同时宣传昌北高校图书馆联盟,由校纪委、校团委、图书馆共同举办主题为“联盟●联想●联谊”的第二届“读书月”开幕式暨昌北高校图书馆联盟“知网杯”搜索竞赛活动,在江西农业大学逸夫图书馆四楼电子阅览室正式拉开帷幕。 https://www.99xueshu.com/w/file77si59aq.html
12.广州图书馆2024年数字资源续订(CNKI系列数据库平台)项目结果公告二、项目名称:广州图书馆2024年数字资源续订(CNKI系列数据库平台)项目 三、采购结果 合同包1(CNKI系列数据库平台): 供应商名称供应商地址中标(成交)金额 同方知网数字出版技术股份有限公司 北京市海淀区西小口路66号中关村东升科技园B-2号楼二层B201、B202、B203、B205、B206、B207、B208、B209、B210室(东升地区http://www.ccgp.gov.cn/cggg/dfgg/cjgg/202410/t20241029_23476468.htm
13.广州图书馆学术百科提供全面的“广州图书馆”相关文献(论文)下载,论文摘要免费查询,广州图书馆论文全文下载提供PDF格式文件。广州图书馆中文、英文词汇释义(解释),“广州图书馆”各类研究资料、调研报告等。https://wiki.cnki.com.cn/HotWord/95497.htm
14.某同学在图书馆检索中国知网上的文章,当某篇文章的“下载”链接某同学在图书馆检索中国知网上的文章,当某篇文章的 “下载”链接标识符显示为灰色时,通常表示( )。 A. 服务器终端出了故障 B. 服务器暂时停机 C. 并发用户已满,等待其他时间下载 D. 图书馆没有购买这篇文章,不能下载 题目标签:常表示标识符图书馆如何将EXCEL生成题库手机刷题 https://www.shuashuati.com/ti/70a4b3434154466db9100a671c05a62b.html?fm=bdbdsc36de77d26fc35d46db16e90111cce03
15.知网又上热搜了,这次是因为查重南方plus这边,学生们为了查重过五关斩六将;那边,学校对知网也是怨声载道。曾有媒体报道,不断上涨的知网服务费用,让不少高校直呼“用不起”。 据不完全统计,北京大学、武汉理工大学、云南大学等高校,都曾因报价过高而停用知网。 北京大学图书馆发布的“中国知网”可能中断服务通知 https://static.nfapp.southcn.com/content/202105/26/c5317418.html
16.广州中医药大学图书馆简介广州中医药大学图书馆开放时间→MAIGOO广州中医药大学图书馆创建于1956年,是学校文献信息资源服务中心。图书馆由三元里校区图书馆和大学城校区图书馆组成,总建筑面积33350平方米。图书馆由三元里校区图书馆和大学城校区图书馆组成,设有中医学书库、医学书库、综合书库、期刊阅览室、外文书库、特藏阅览室、参考阅览室、电子阅览室、学生自修室等一线服务场所https://www.maigoo.com/citiao/159993.html
17.基于用户满意度视角的广州图书馆服务优化研究广州图书馆是广州市政府为市民提供公共服务的重要机构之一,从用户满意度视角出发,了解广州图书馆的用户服务情况,参考相关研究文献构建合适的评测指标,分析广州图书馆用户服务中存在的问题,提出改善对策,对指导我国现代化城市公共图书馆的发展具有一定的现实意义。本文以公共服务、顾客满意度等理论为基础,结合广州图书馆的https://mall.cnki.net/magazine/article/CMFD/1019931284.nh.htm