用主流價值導向駕馭算法研究傳媒

此文為2019年度“人民網獎學金優秀論文獎”獲獎論文。

摘要:隨著近年來互聯網的發展,算法技術得到了越來越廣泛的運用,而價值觀對算法的影響,也逐漸成為了公眾討論的焦點,本文通過對算法演化方向的研究、價值觀在算法的前期開發、后期管理以及算法本身的影響,配合對人民網、知乎、今日頭條等典型案例的分析,探究主流價值觀對算法的駕馭及算法未來的發展方向。

一.引言

現今算法被應用於各個領域:信息的獲取及篩選,收集數據對用戶喜好進行分析和個性化推薦等。可若單一考慮用戶立場或信息受歡迎度進行信息篩選而進行算法設計可能會導致不好的結果,例如推送一些諸如搶劫、行凶等消息會對導致社會風氣走向危險的道路。此時,就需要企業對價值觀做一個衡量,是選擇利益,還是選擇引導,這些選擇會被體現在算法中。

二.算法的演化方向與研究

算法是一個逐漸演變的過程。它的誕生初期僅僅是人類開始開發他們的智慧,用以改造生活﹔漸漸地,人類的生活得以滿足,算法被用來創造金錢﹔近年來,算法已與科技無法分開,成為人類價值觀的一種體現。

(1)初期算法——文明的起源

早期的算法是沒有分類的,人類僅僅是將他們的生活經驗進行總結並擴大應用。公元前4000年,最早的歷算法“一周七天”,“一年十二個月”等誕生了﹔公元前3000年,多位數乘法出現﹔公元前2100年,美索不達米亞人已經有了乘法表,使用著六十進位制的算法,甚至還擁有了倒數表、平方和立方表等,同時,中國夏朝出現的象征吉祥的河圖洛書縱橫圖的“九宮算”,被認為是現代“組合數學”最古老的發現[1]﹔公元前2000年,十進制的算法在達羅毗托人的生活中出現﹔公元前400年,斯巴達人將密碼用於軍事用途……

(2)早期算法——知識的啟蒙

公元前300年,歐幾裡得算法誕生﹔公元前200年,矩陣誕生﹔公元前50年,愷撒密碼誕生﹔50年,“秦九韶算法”誕生﹔100年,《九章數學》成書﹔263年,圓周率的近似值被推出﹔500年,多項式方程算法出現﹔600年,十進制系統出現﹔1360年,奧雷姆通過橫、縱坐標表示點的位置並進而討論函數圖像﹔1484年,正負號誕生﹔1545年,一元三次方程與一元四次方程的解被得出﹔1593年,珠算發展到了頂峰﹔1607年,《幾何原本》前六卷出版﹔1628年,《籌算》出版﹔1686年,萊布尼茨發表第一篇積分學論文《深奧的幾何與不可分量及無限的分析》[1],創造了微分符號及積分號,發現了微分和積分的互逆關系﹔1700年,萊布尼茨提出二進制算法……

(3)中期算法——科技的角逐

二進制算法出現后,計算機領域得到了飛速發展,人類對算法的研究逐漸轉移到更復雜、更深奧的領域,同時,算法也與科技及商業綁定。

1815年,阿達奧古斯塔為巴貝奇分析機擬定了“算法”,寫了一份“程序設計流程圖”,這份規劃被人們視為“第一件計算機程序”,阿達奧古斯塔被認為是世界上第一位軟件工程師﹔1834年,巴貝奇提出分析機的概念,分析機分類堆棧、運算器、控制器三部分﹔1847年,布爾運算誕生﹔1930年,Prim-Jarnik算法誕生﹔1934年,哥德爾使用原始遞歸函數﹔1943年,哥德爾確定出可計算函數﹔1951年,Booth算法誕生﹔1958年,面向算法的語言ALGOL誕生﹔1959年,Dijkstra算法誕生﹔1965年,LR算法誕生,復雜度的概念被提出﹔1973年,數據加密標准誕生﹔1986年,BP網絡和BP算法被提出……

(4)現代算法——價值觀的需求

隨著算法體系的不斷完善與科技的不斷進步,商業市場逐漸擴張,算法不再是數學家們為了研究知識而提出的解決方案,更多的時候,它是商業家們為了完成商業需求而開發的針對性算法,或者,他們將已完善的算法拿來,用以滿足他們的商業需求﹔算法是沒有價值觀的,但他們卻是使用者價值觀的體現。例如,有人利用網絡算法無法對上傳內容進行分辨的空子,進行違法活動﹔同時也有人利用算法對客戶的喜好進行總結與推導,給予用戶更好的產品體驗。有人認為算法不應評判內容,而應給用戶一個平等而自由的平台,無需平台給他們貼標簽﹔也有人認為,網絡應該給予人民好的引導形象,算法應將壞的一面徹底剔除……在這些領域,每天的爭議都不絕於耳,源於當今市場的復雜化,商業需要在滿足用戶需求、投資者需求的前提下追求最大的價值,有些產業選擇走上非法之路,有些產業選擇堅守正義,在這其中所體現的,就是算法的價值觀,也是人的價值觀。

三.價值觀對算法的影響研究

在與算法的融合過程中,價值觀對算法的前期開發、后期管理乃至算法本身都產生了一定的影響,引發了一系列的變化。

(1)價值觀對算法前期開發的影響

在研究了多款文字呈現類軟件后我們發現,為了所謂的“點擊率”,發布者常常選擇發布一些不符合常理的、甚至涉及暴力或帶有性暗示的視頻來滿足觀眾的獵奇心理。用戶觸發點擊行為后,將會被算法捕捉記錄。點擊量越大,算法的推送力度越大,進一步帶來更多的點擊量,從而導致惡性循環,最終使得越來越多庸俗、粗俗、導向不正的內容充斥在各大客戶端的頁面上。

強調主流價值導向,將會增強算法開發者的使命感,開發出真正優質的、與主流價值觀完美融合的算法,從而提高推送內容的質量。

(2)價值觀對算法本身的影響

1)促進算法公正

2018年5月,攜程被曝“酒店同房不同價”,涉嫌存在“殺熟”行為﹔2015年美國芝加哥法院使用的犯罪風險評估算法COMPAS被証明對黑人犯罪嫌疑人造成了系統歧視﹔微軟開發的Tay聊天機器人試用24小時便成為種族滅絕的反女權主義納粹分子,發出“希特勒無罪”的消息……諸如此類的事件引發了人們的強烈不滿,國內外對於“算法公正性”的不滿和質疑層出不窮。

算法的本質其實是為了實現某個功能的工具。使用者希望在應用算法時,它能夠中性並且保持公正。然而,算法由人創建。因此在編寫算法的過程中,開發者必然會給算法賦予判斷的標准和某些傾向性。同時,算法所依賴的大數據也並非是絕對中立的。大數據來源於社會群體,而社會群體中,或多或少都隱藏著固有的不平等、歧視乃至排斥的情況。

算法開發過程中的“黑盒”性以及數據來源隱藏著的不平等都影響著算法的公正性。即便算法難以實現絕對的公正,我們仍要以正確的主流價值觀作為算法導向,才能盡可能地讓算法趨於公正。

2)提升算法的透明性和可解釋性

算法技術對於大部分不具有相關專業知識的普通用戶來說,是非常復雜且不透明的。人們無法真正地理解算法,從而可能導致對算法的誤用、濫用。

當一些帶著惡意破壞社會秩序、價值觀畸形的算法出現時,用戶的誤用將會給其作惡的可趁之機。與此同時,一些算法隻能用於特定人群,還有一些算法的使用場景有嚴格的限制,倘若這類算法被用戶在不知情的情況下使用,可能會造成各種不良影響。同樣,對於監管審核人員來說,無法真正理解算法將會成為監察管理路上的重大阻礙。

因此,在把算法提供給用戶使用或者監管人員進行審核的同時,需要將如算法使用限制、算法准確性、算法誤差范圍等需要被了解公開的內容進行必要且詳盡的說明,同時,對於涉及用戶利益的部分,更應主動以用戶能夠理解的方式進行充分的說明,結合內生性的生產邏輯和外生性的監管邏輯,按照算法披露、法律規制和社會監督三個思路構建算法透明實現機制。

(3)價值觀對算法后期管理的影響

今年4月,快手宣布招聘3000名內容審核員,審核團隊達到數千人﹔2018年,今日頭條急招2000名內容審核編輯,審核團隊人數過萬。雖然算法是一種智能工具並且具有自我學習能力,但是如今依舊不能完全靠規則化的機器來完成所有判斷。

由於僅靠算法本身對不良有害內容進行篩查監管是遠遠不夠的,因此,相關公司還需要招聘具有專業知識、有高度社會責任感的人員進行監管審核,彌補算法自篩查能力的不足,與算法共同把關,真正做到雙重保障。

四.主流價值觀對算法影響的典例分析

(一)正面典例分析

1、“人民號”典例分析:平台首創主流價值算法,弘揚傳播積極內容

1)背景簡介

百度技術賦能人民日報搭建的“人民號”平台首創了“黨媒算法”[2],在主流價值觀駕馭之下,實現為用戶個性化推薦優質內容的功能。人民日報官方微博賬號數據顯示,截至人民號上線一周年為止,已有近18萬賬號申請入駐該平台,經過層層篩選,有2萬多優選賬號成功入駐﹔累計收錄優質內容300萬條,其中用戶偏好的內容大多集中在新聞資訊、影視、工作職場、金融、出行等方面。由此可見,不只是通過低俗、吸引人眼球的內容才可以獲得高流量,正能量和主旋律的內容同樣可以獲得人們的關注、喜愛和認同。

2)價值觀給算法帶來的正面影響

在“算法焦慮”與“流量焦慮”仍待解決的當下,人民號堅持用主流價值觀構建主流價值算法,用社會責任與義務規范傳播內容,用優質平台凝聚眾人的智慧與力量,不斷將正能量傳播給整個社會。百度與人民日報聯合研究的“黨媒算法”不同於傳統商業意義上的推薦算法,它在基本的算法邏輯的基礎上,努力為算法賦予黨媒的主流價值觀,構建一個新穎的新媒體生態。”人民號“平台的出現恰恰印証了算法是可以在主流價值觀的引導之下避免不良、有害內容傳播,弘揚積極向上的正面態度的,正如前人民日報社副總編輯盧新寧所說:“我們高度重視用戶流量,但我們堅決反對低俗的流量、失序的流量、帶血的流量。……我們高度重視算法推薦,但我們堅決反對失控的算法、混亂的算法、危險的算法,我們認為任何算法都不應抽離價值,都應是在主流價值駕馭之下的。”[3]當蘊含有主流價值觀的內容,經由算法的分發擴散后,這些內容必將獲得更大的傳播能力,進而使這些正面、優質的東西被更多人知道、了解,向整個社會傳遞美好積極的信息。

2、知乎典例分析:算法遵從主流價值觀,為用戶創造良好社區氛圍

隨著互聯網產業的發展,當今諸如快手、抖音等許多熱門APP專注於根據用戶喜好個性化推薦內容,而知乎作為其中“格格不入”的一員,卻更“關注內容生產的本身,將算法大規模應用於社區氛圍的管理,以生產出有價值和對用戶有幫助的內容”[4]。知乎創始人周源在談到知乎的價值觀時說到:“我們會依據自己的價值觀,將違反知乎價值觀的觀點刪掉。我們反對偏見,也反對謠言八卦。……平台的價值的一部分就是要有自己的價值觀,雖然這是一個比較難的選擇題,但如果知乎認為這麼做是對的,就會去做。”[5]知乎通過開發算法機器人來識別垃圾廣告、處理舉報內容、處理人身攻擊類內容,其算法也很好地避免了低俗內容的產生、維護了一個良好的社會氛圍,符合我們所提倡的主流價值觀。我們也可以從中看出,平台需要有價值觀、算法也要有自己的價值觀,一個受到主流價值觀引導的算法,會將這種價值觀反饋傳達給用戶,可以為社會的發展起到一定的積極作用。

(二)負面典例分析

1.今日頭條案例分析

今日頭條是一款基於北京字節跳動科技有限公司開發的數據挖掘引擎產品,是一款在新媒體環境中向用戶推薦信息的產品,提供用戶與信息的連接。以“為你推薦你喜歡的個性化新聞資訊”為廣告語,以個性化新聞的獨家推薦為最大賣點,其創始人張一鳴一直以來信奉“算法沒有價值觀”,在價值觀與技術的沖突面前,主張技術>價值觀,今日頭條利用大數據挖掘和剖析,從多方面分析用戶的行為習慣,根據多維信息特點的匹配程度為用戶提供個性化的推薦服務,用戶也可通過“訂閱”與“定制”功能來獲得自己感興趣的相關信息。這樣的信息分發模式,給今日頭條帶來了巨大的收益,根據新浪科技訊消息,截至2016年10月底,今日頭條已累計有6億激活用戶,1.4億活躍用戶,每天每用戶使用時長為76分鐘,然而無道德觀約束的算法導致的弊端也隨之而來,2018年元旦,國家網信辦就持續傳播低俗信息、違規轉載新聞信息等問題約談今日頭條,4月,國家廣電總局約談今日頭條,責令其下線有害節目並進行整改。2017年底,今日頭條因“持續傳播色情低俗信息、違規提供互聯網信息服務”等問題,暫停更新24小時。如今依然許多網友反映,今日頭條推送的垃圾信息過多,優秀內容難以得到有效傳播與宣傳。

2)今日頭條算法簡介

新聞算法推送以計算機數學算法為計算工具,通過對用戶瀏覽歷史的數據挖掘來推斷用戶的興趣,結合性別、年齡、職業、等基本個人信息,得到用戶查看新聞的時間、網絡環境和搜索習慣等信息,結合大數據分析,推算用戶對新聞的偏好,並將其推送給用戶以達到根據用戶偏好差異提供相應推薦的效果。

3)忽略價值關的算法帶來的負面危害

a)繭房效應

信息繭房是指人們的信息領域會習慣性地被自己的興趣所引導,從而將自己的生活桎梏於像蠶繭一般的“繭房”中的現象。而數字算法下個性化推薦技術和用戶的心理,共同造成了今日頭條的“信息繭房”效應。

首先,在今日頭條這個融合各種信息與觀點的公開平台上,信息過載現象與用戶注意力是匱缺以及用戶選擇性接觸等多種原因,決定了人們更願意傾向於選擇自己感興趣的話題,而今日頭條“無價值觀算法”的作用與“人工不干預”理念,加上其通過算法進行個性化推薦的廣泛運用,導致其產品依靠數字算法,完全為了迎合受眾的需求而進行個性化推薦,使用戶禁錮在符合自己舒適度的“圈子”裡,通過今日頭條推薦算法獲取的新聞大多與之前已經有所了解的內容相關或相同,導致用戶不斷被這些信息所包裹,從而形成了信息繭房。[6]

b)低質量信息傳播

今日頭條個性化推薦算法完全依賴於用戶行為,未對推薦信息進行宏觀把控與干涉,當用戶的閱讀歷史產生一定傾向性時,個性化推薦內容會迅速捕捉並匹配到這樣的傾向性,然而,一方面,用戶的需求通常是盲目且階段性的,另一方面,一些娛樂主題的新聞或有噱頭的標題,一定程度上確實會引起用戶的好奇並增加其被用戶點擊的概率,雙重作用導致當用戶點開幾條八卦新聞之后,其接收到的個性化推薦相關推送將會被各類八卦新聞佔據﹔當用戶觀看幾部不符合常理的、甚至涉及暴力或帶有性暗示的打違法擦邊球的視頻作品后,平台將加速向其推薦這類劣質作品﹔而這樣的低質量信息很容易對當代辨識能力不足的年輕人、兒童造成不良的價值觀影響,不健康的信息的過度傳播,將影響當代社會年輕人的身心發展與良好社會形態的構建。

2.谷歌案例分析

使用最先進圖像識別技術的谷歌早期曾由於搜索引擎所使用的算法未涵蓋有關“種族”的價值觀考量,GooglePhoto算法將黑人打上“猩猩”的標簽,而搜索“不職業的發型”時,結果中種族面絕大多數是黑人的大辮子,同樣,根據哈佛大學數據隱私實驗室教授拉譚雅·斯維尼的調查發現,根據谷歌智能廣告工具Adsense給出的結果,在谷歌上搜索有“黑人特征”的名字,很可能彈出與犯罪記錄相關的廣告,同樣在其退出的一款名為GoogleArts&Culture的對照片進行識別並找到相似的歷史名畫的APP中,外媒DiggNews發現,有色人種和女性所配對的作品相當有限,而且往往帶著種族歧視色彩,谷歌因此多次陷入“種族歧視”風波。可見即便算法與算法開發者不帶有種族傾向性,可能也會由於算法與機器學習本身的特質吸收和放大歧視,對社會上的弱勢社群造成傷害,因此算法必須考慮價值觀因素。

3.微軟案例分析

2016年3月23日,微軟開發的人設為19歲女性,昵稱為Tay的聊天機器人在推特上線。該機器人通過抓取和用戶互動的數據模仿人類的對話進行聊天。而由於該機器人所依賴的算法並未對言語質量與倫理道德進行把控,上線一天之內,Tay就成為了一個滿口叫囂著種族清洗的極端分子,並因此被下架。可見依賴於未考慮價值觀因素的算法的產品極容易收到不良社會風氣的影響,從而對網絡環境及社會造成反向危害。

五.基於主流價值觀的算法未來發展方向

近幾年來,關於“算法究竟有沒有價值觀”問題的討論成為了互聯網領域的熱門話題,經過我們的調研與分析,它的答案是肯定的,也應該是肯定的。一些人提出,算法只是一門技術,不應給算法拷上沉重的道德倫理枷鎖。然而,算法是人創造出來的,算法的價值觀就是人的價值觀的直接投射。擁有正確價值觀的算法不僅僅給人們的生活帶來便利,有時更接近於一種人文關懷。西安電子科技大學通過大數據分析學生在校刷飯卡的記錄,給達到設定標准的學生予以補助,這一暖心舉措獲得人們的廣泛好評,大贊。與之相反的是,擁有錯誤價值觀的算法往往成為助長社會不良風氣的溫床,例如平台監管不力導致的淫穢色情、暴力血腥制品的傳播,詐騙犯罪經由互聯網渠道“重獲新生”,隱私被竊取和販賣的現象屢見不鮮……

由此,大力推行基於主流價值觀的算法,整改與優化偏離主流價值觀的算法已經刻不容緩。由今日頭條的負面案例分析可見,在其“算法沒有價值觀”,“技術>價值觀”的導向之下,弊端很快浮現,隨之而來的央視點名、廣電約談、產品下架整改,操作快、穩、准,顯示出國家引導算法向主流價值觀靠近的決心與力度。

人民日報嚴正指出:“技術紅利與公序良俗沒有必然沖突。新事物在跨越野蠻生長階段之后必須逐步走上正軌。”[7]如何讓算法更好地服務於人類,遵從於人類社會的秩序,然后健康有序地發展,既是提問,也是對基於主流價值觀算法的要求。在本文中提到的解決方案也許不夠全面,但基於主流價值觀的算法若能在規范化的基礎上採用“Ai算法+人工干預”機制,不斷優化與發展,相信算法亂象的治理應該會有很大的改善。

參考文獻

[6]趙欣琦:《數字算法下信息繭房效應——今日頭條為例》.衛星電視與寬帶多媒體,2019

[7]趙丹:《人民日報海外版:算法也有價值觀》.人民網-人民日報海外版,2018.04.13

[8]錢皓:《為算法補齊短板,是社會責任,也是快手們的新機遇》,

THE END
1.大学四年,从小白到大神,全网最硬核算法学习攻略,不接受反驳说到算法的学习方式,对我来说,真的没有什么捷径之类的,就是像我上面说的,先找本书死磕入门数据结构,就跟着书的例子,把例子跑起来就好了,跑起来也不是一件简单的事情。之后就去接触下一些算法思想,后面就可以分类刷题了,刷题就是最好的捷径了。 https://blog.csdn.net/m0_37907797/article/details/118341093
2.码农的数学和算法入门腾讯云开发者社区码农的数学和算法入门 一流程序员靠数学,二流靠算法,三流靠逻辑,四流靠SDK,五流靠Google和StackOverFlow,六流靠百度和CSDN。 虽然是段子,但其实也挺写实的,因为你打开各大招聘网站,会发现越是高薪的IT岗位,对数学的要求越高。其实,我曾经也不太明白数学为什么对程序员很重要,不明白为什么在大学里初入编程之门https://cloud.tencent.com/developer/article/1821198
3.知乎精选运筹学(最优化理论)如何入门?运筹OR帷幄知乎精选 | 运筹学(最优化理论)如何入门? 本文仅作为学术分享,如有侵权作删文处理 作者· 王源 链接: https://www.zhihu.com/question/22686770/answer/618437135 学习一门课程首先要了解学习的目的和意义。我们这里暂且不谈学好了运筹学能够走上人生巅峰,迎娶白富美的事情。这里只谈一小点学了运筹学的人和没有https://www.shangyexinzhi.com/article/5050232.html
4.知乎算法战“杠精”你好AI无论看到不好的,还是让他们不爽的,或是不希望出现在知乎的内容,都会点举报。可以说这群用户很不好“伺候”,但他们更乐于生产内容,更重要的是,他们的行为相当于人工标注,为后期知乎算法去学习场景提供了训练样本。 早期的知乎,就是靠用户举报和人工运营,去逐条处理帖子里的情绪毒瘤。 https://36kr.com/p/1723104215041
5.十张图带你领略知乎答案排序算法之美上一篇文章——知乎核心功能:问答中写到了知乎对单个提问下回答的排序,采用威尔逊算法。但文中缺少对公式的定量分析解释。本文将对公式进行详细阐述。 首先分析单个知乎单个回答下投票的特点: 1.只有赞同和反对两个选项。(设赞同数=u,反对数=v,总票数n=u+v) https://www.jianshu.com/p/26305064b47e
6.seo算法网站推荐知乎seo算法入门教学许昌seo在当今数字化的时代,搜索引擎优化(SEO)对于网站的重要性不言而喻,了解 SEO 算法的运作机制,能够帮助网站所有者更好地【许昌seo】优化内容,提高在搜索引擎结果页面(SERP)中的排名,从而吸引更多的流量和潜在客户,寻找优质的 SEO 相关网站和资源,对于提升自己的 SEO 技能和知识也具有重要意义,而知乎,作为一个知识分享http://hm28.jlgou.com/?s=seo%E7%AE%97%E6%B3%95%E7%BD%91%E7%AB%99%E6%8E%A8%E8%8D%90