数据垄断形成机制与监管分析

摘要:数据垄断及其对市场竞争的影响是数字平台反垄断分析的一个疑难问题。守门人地位、切换成本、人工智能算法和数据保护制度不健全等因素,加剧了电子商务、搜索引擎、移动操作系统、社交媒体等数字平台公司对数据的控制,推动形成集中度高甚至赢者通吃的市场结构。数据垄断既能够通过多种渠道增进市场效率,又容易限制和排除竞争,剥夺用户和第三方厂商利益;数据反垄断监管应当充分考虑数据兼具公共产品和私人产品的复杂特征,围绕数据保护、共享、移植、安全、算法和使用等环节的问题,在约束数据领域不当行为、探索数据公地建设、完善非歧视规则和鼓励数据去中心化存储等方面形成较为完善的制度。

关键词:数据监管;数据市场;数字平台;反垄断

基金项目:中国社会科学院登峰战略“产业经济学优势学科项目;中国社会科学院创新工程项目“新发展阶段中国竞争政策与反垄断研究”(SKGJCX2021-03)。

一、问题提出

二、典型领域数据垄断的表现形式

数字市场的网络效应、切换成本和其他进入壁垒,使市场结构趋于集中和单一公司主导。一旦市场由单一公司主导,其他竞争者和潜在进入者将难以与其竞争,竞争过程从市场中的竞争转向为垄断市场和剥夺其他参与者利益而竞争。一些风险资本分析报告发现,存在一个主导平台与竞争压力隔离开来的创新杀戮区,投资者偏好避免向与数字平台直接或间接竞争的企业投资,从而削弱数字市场的创新和创业精神。根据欧盟、美国反垄断监管机构的调查,数据垄断集中体现在电子商务、搜索引擎、移动操作系统、社交媒体等数字平台领域。尽管下面几个数字平台公司都是总部位于美国的公司,但是由于业务和商业模式相同,其利用访问和控制数据能力谋求市场势力和实施垄断行为的形式,对分析我国数字平台公司垄断行为具有参考价值。

(一)电子商务

(二)搜索引擎

(三)移动操作系统

(四)社交媒体

三、数据垄断的形成机制

笔者认为,虽然数据具有非竞争性特点,即一方的使用不会影响另一方的使用,但数字平台可能利用以下几个机制采取排他性策略,为竞争者访问和使用数据设置技术限制,保护现有企业免受竞争。

(一)利用守门人地位,控制业务用户访问潜在客户

(二)固化切换成本,限制数据移植

(三)利用人工智能和机器学习,实施算法垄断

(四)保护制度不完善,加剧平台过度收集和滥用数据

数字平台吸引更多客户积累更多数据获得市场主导地位,在用户一边体现为隐私和数据保护价格以及传统客户常规价格的提高。数字平台垄断行为可能不再采取直接提高产品和服务价格的行为,而是表现为通过大量收集、汇聚和使用数据,变相提高消费者支付的价格。实际上,隐私和数据保护可以被视为产品和服务的质量特征。厂商经常向消费者隐匿收集、汇聚、使用和出售数据的信息,消费者难以意识到其数据被过度收集、汇聚和使用,表明缺乏隐私不仅是一个价格,而且是一个不可观察的价格。由于消费者与使用其数据的平台之间存在信息不对称,平台可能通过欺骗性承诺获得消费者数据,出现阻碍公平数据交易的行为偏差,数字平台可以利用这一行为偏差操纵用户行为以谋取利益。一些文献发现数字平台利用行为偏差来说服消费者交出数据或购买产品。数字平台越来越有能力通过数据聚合和分析准确预测消费者行为,减少平台与消费者之间的信息不对称,改善市场运作。例如,亚马逊为一种商业方法申请了专利,该商业方法能使其在客户订购之前发货,一些保险公司试图通过访问基因数据或智能健康设备来更多地了解客户的健康状况。这说明,数字平台对客户的了解有时比客户对自己的了解更多。

目前,世界各国普遍基于知情同意方式保护数据,即数据收集者在数据提供者同意提供数据之前,有义务告知数据提供者关于数据收集和使用的信息。其基本逻辑是,一旦数据收集者告知数据的使用方式,用户就能够对数据交易做出合理决定。但是,不仅这种告知的可信度受到怀疑,公司还可能隐匿有关数据使用的信息,期望消费者以这种方式做出合理决定可能是天真的。在实践中,这个模型被证明是有问题的。可见,数字平台使用大量数据,依赖数据作为感知、分析、推理、决策,持续获得知识和经验并不断提升技能,尤其是在深度学习方面,但数据提供者很难知道正在处理哪些数据、如何处理这些数据以及如何生成有关个人的决策。

四、数据监管的思路与措施

(一)探索数据公地建设,促进数据开放共享

(二)加强数据管理和保护,增进数字市场的信任

(三)完善数字平台非歧视规则,促进数字市场公平竞争

(四)鼓励数据去中心化存储,遏制集中式存储造成的垄断

(五)探索监管沙盒,提高监管效率

参考文献

王世强.数字经济中的反垄断:企业行为与政府监管[J].经济学家,2021(4):91-101.

SCHNEIER,B.DATAANDGOLIATH:TheHiddenBattlestoCollectYourDataandControlYourWorld[M].NewYork:W.W.Norton&Company,2016.

SMITH,N.C.,GOLDSTEIND.G.&JOHNSON,E.J.Choicewithoutawareness:Ethicalandpolicyimplicationsofdefaults[J].JournalofPublicPolicy&Marketing,2013,(32)2:159-172.

WACHTER,S.&MITTELSTADTB.Arighttoreasonableinferences:Re-thinkingdataprotectionlawintheageofbigdataandAI[J].Colum.Bus.L.Rev.,2019,2:494.

GOLDFARB,A.,&TUCKERC.DigitalEconomics.JournalofEconomicLiterature[J],2019,57(1):3-43.

易芳,包嘉豪.数字平台的反垄断监管[J].财经问题研究,2022(2):33-41.

刘戒骄.我国公用事业运营和监管改革研究[J].中国工业经济,2006(9):46-52.

孙晋.数字平台的反垄断监管[J].中国社会科学,2021(5):101-127.

THE END
1.强化学习的主流算法:从基础到实践强化学习的主要应用场景包括机器人控制、游戏AI、自动驾驶、推荐系统等。随着数据量的增加和计算能力的提升,强化学习在近年来取得了显著的进展。本文将从基础到实践的角度介绍强化学习的主流算法,包括值函数方法(Value-based methods)、策略梯度方法(Policy-gradient methods)和模型基于方法(Model-based methods)。 https://blog.csdn.net/universsky2015/article/details/137307363
2.科学网—[转载]强化学习在资源优化领域的应用基于这种行业趋势,本文针对强化学习算法在资源优化领域的应用展开调研,帮助读者了解该领域最新的进展,学习如何利用数据驱动的方式解决资源优化问题。鉴于资源优化问题场景众多、设定繁杂,划分出3类应用广泛的资源优化问题,即资源平衡问题、资源分配问题、装箱问题,集中进行调研。在每个领域阐述问题的特性,并根据具体的问题特性https://blog.sciencenet.cn/blog-3472670-1312677.html
3.人工智能团队研究成果在TKDE发表:样本高效的离线转在线强化学习算法实验室人工智能团队在D4RL基准测试上进行了大量实验来说明本研究中提出的算法的优越性。实验结果表明,本研究提出的算法在样本效率方面显著优于最先进的离线转在线强化学习算法。 相关的研究成果近期发表在TKDE上,文章第一作者为吉林大学未来科学国际合作联合实验室博士生郭思源,通讯作者为吉林大学陈贺昌教授和常毅教授。http://icfs.jlu.edu.cn/info/1007/3101.htm
4.结合向前状态预测和隐空间约束的强化学习表示算法而在强化学习的应用场景中, 智能体遇到的大多数环境的状态的存在形式都是充满噪声的高维度的. 因此, 如果有一种表示学习方法能让智能体从高维状态中准确提取低维的状态表示, 就能有效提高强化学习的样本效率. 现有算法难以从高维状态中提取准确特征的原因如下: 一是深度强化学习算法只用一个值函数损失作为损失函数,https://c-s-a.org.cn/html/2022/11/8801.html
5.TensorFlow机器学习常用算法解析和入门上图为基于ICA的人脸识别模型。实际上这些机器学习算法并不是全都像想象中一样复杂,有些还和高中数学紧密相关。 后面讲给大家一一详细单独讲解这些常用算法。 强化学习 13)Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
6.2020年媒体技术趋势报告:13大领域89项变革全输出多任务强化学习算法 (General Reinforcement Learning Algorithms) AlphaZero的团队开发的新算法可以学习多个任务。比如AlphaZero不仅在围棋上无人可敌,在象棋和日本象棋中也出类拔萃。 更快的深度学习 (Much Faster Deep Learning) 深度学习(Deep Learning, DL)是机器学习中相对较新的分支,也会很快无形地融入到各个组织https://36kr.com/p/5267903
7.百度算法岗武功秘籍(中)● OCR识别有哪些算法模型? 3.1.4 图像分类 ● 如果图像分类有百万个class,你会怎么设计模型? 3.2 深度学习-RNN递归神经网络方面 3.2.1 自然语言处理NLP ① Bert ● 文本分类,bert了解吗?输入有什么改进? ● 讲一下Bert原理? ● Bert模型结构,分类和句子翻译如何微调? https://www.flyai.com/article/948
8.在线网课学习课堂《人工智能(北理)》单元测试考核答案()A鸟喋吟B腺喋吟C胞喀咤D尿喀咤王萌售宾,D第33题单选题(1分)DNA依靠()实现计算A碱基B蛋白质C碱基的互补性D酶王确普拂匕C第34题多选题(2分)DNA计算的特性有哪些?()A巨量存储B超级并行C计算精确D低能量消耗正确答案ABD第35题多选题(2分)下列哪些搜索算法一定可以找到最优解?()A穷举搜索B度优先搜索Chttps://www.yxfsz.com/view/1673214771380457473
9.AI深度强化学习落地方法七步曲2——状态空间篇回报函数篇鉴于强化学习算法对优秀reward函数设计的依赖,学术界提出了很多方法改善这一状况。比如逆向强化学习,利用expert demonstration(专家示范)学习到reward函数,再用这个reward函数训练RL策略。此外,还有一大堆模仿学习的方法,干脆抛开reward直接拟合专家策略。以上方法的前提是要有专家数据,不具备普适性,这里就不多说了。 https://www.shangyexinzhi.com/article/4228946.html
10.钛坦白微软亚洲研究院秦涛:深度学习的五个挑战和其解决方案本期钛客之一、微软亚洲研究院主管研究员秦涛博士,在国际会议和期刊上发表学术论文100余篇,曾/现任机器学习及人工智能方向多个国际大会领域主席或程序委员会成员,曾任多个国际学术研讨会联合主席。他是中国科学技术大学博士生导师,IEEE、ACM会员。他和他的团队的研究重点是深度学习、强化学习的算法设计、理论分析及在实际https://www.tmtpost.com/2578654.html
11.高中信息技术课程标准在选修部分的五个模块中“算法与程序设计”是作为计算机应用的技术基础设置的;“多媒体技术应用”“网络技术应用”“数据管理技术”是作为一般信息技术应用设置的;“人工智能初步”是作为智能信息处理技术专题设置的。为增强课程选择的自由度,五个选修模块并行设计,相对独立。各选修模块对开设条件的要求有所不同,各学校https://www.fqkhzx.cn/index/article/view/id/94.html
12.每日热点1102Nature子刊:深度学习算法可以在显微镜图像中识别出各种细菌 BMJ:人工甜味剂安全性再添新忧!超10万人研究发现,饮食中总甜味剂摄入量高,与心血管疾病和脑血管疾病风险增加9%和18%相关 舆情信息 新冠病毒疫苗接种情况 世卫组织:黎巴嫩霍乱疫情迅速蔓延 “个人碳账户”还应更多些 https://www.sccdc.cn/Article/View?id=30661
13.九章云极DataCanvas方磊:Hypernets——自动化机器学习的基打架第二种算法叫遗传算法 (Evolutionary Algorithm),与第一种算法相比,不那么结构有序。但在搜索空间比较复杂的时候,想要找到接近于全局最优的局部最优解,Evolutionary Algorithm 是非常有效的方式。 第三类算法 Reinforcement Learning,本身是比较好的一种算法。强化学习的目标是获得最多的累计奖励。 https://m.thepaper.cn/baijiahao_13676597
14.一秒做出8000张海报设计的「鹿班智能设计平台」是怎么工作的这也是阿里内部让产品设计师学习机器学习的原因,因为搞懂算法框架和技术原理,才能更好理解工作原理。 但三方面功课背后,也不是没有具体挑战。 整个鲁班打造过程中,遭遇了三方面技术挑战。 技术挑战 首先是缺少标注数据。今天所有的人工智能都基于大规模结构化标注数据,设计这件事情连数据都没有完成在线化,更别说标准化https://www.uisdc.com/alibaba-luban-ai-work/