今年伊始,娛樂圈某明星出軌的消息席卷新聞熱搜,甚至從不關心娛樂新聞的讀者也被裹挾其中,聯想到日前微博熱搜榜、熱門話題榜等被下線,不禁讓人思考:我們?yōu)槭裁磿痪砣搿盁狳c話題”的漩渦?這是我們主動的選擇、潛意識的興趣,還是被系統后臺操控的“身不由己”?
日前,電子科技大學成都研究院大數據室研究人員、成都鏈科云科技技術合伙人熊文軒,為科技日報記者解答了這些問題。
被算法“套路”的熱搜推送
“這不是簡單的‘貼標簽’,而是組合‘套路’。”熊文軒說,新聞聚合平臺、社交平臺推送的新聞、信息使用的大數據算法大體分兩類:基于內容推薦規(guī)則和協同過濾推薦規(guī)則。
前者是根據個人行為習慣將瀏覽的新聞、信息等對象進行特征提取、內容分類后,進行關聯內容推送,但其最大弊端是推薦內容單一。“舉個簡單例子,某天你的手機被女友拿去看了絲襪產品,那么接下來幾天你都會被推薦絲襪。”
于是協同過濾規(guī)則出現了,這是根據網絡用戶相互的交叉體驗,尋找相同愛好的群體,推薦相同瀏覽記錄或行為。“系統找了一群與你志同道合的‘小伙伴’在背后‘支招’。他們跟你同樣關注體育、旅游新聞,但他們同時也閱讀了氣象新聞,那么算法會將你之前未關注的氣象新聞推送給你。”熊文軒說,這可以避免特征分類單一,實現動態(tài)推薦,即根據個人興趣愛好的變化作調整。
“目前,多數聚合類新聞平臺都會采取融合式算法,即將上述多種算法綜合運用或開發(fā)出一些更復雜的算法,但原理大致類似。”熊文軒說。
沒有瀏覽記錄的“萌新”能否逃出“套路”?他說,注冊時平臺會推薦標簽性分類,如電影、美食等引導用戶第一波使用,隨后用戶開始篩選、點擊、留存,這便實現了數據“冷啟動”。“冷啟動后數據產生,系統便按預設的算法進行推薦。”他說,一些基于新聞學、傳播學特點的“規(guī)則設定”也會推波助瀾,如內容置頂、套紅、延伸閱讀鏈接等。
基于人工智能形成的內容“漩渦”
“在趨于碎片化閱讀的當前,讀者自我訴求不明確、隨機性強,容易被后臺系統引導。”熊文軒說,一些聚合類平臺、社交媒體負責內容推薦的是基于算法的人工智能,而非編輯人員,這更容易形成內容“漩渦”:系統按規(guī)則推薦熱點話題,讀者點擊率、閱讀量不斷提升,系統再次循環(huán)推薦,越來越多的讀者卷入其中。“其實你仔細看會發(fā)現,某熱點話題的閱讀內容可能翻來覆去就是那么幾十條。”
這種基于算法的人工智能內容推薦可控嗎?熊文軒表示肯定。他說,用戶被海量重復信息“包圍”,源于內容把控沒有人為過濾。“算法邏輯不會產生特別精準的推薦,而是大體方向或嘗試性推薦,這就需要大量內容填充,而無法對內容進行強制管理。”他說,可以嘗試用“算法初選+人工引導”的方式,避免被同類內容、低俗內容不斷刷屏。
從內容來源進行控制,也是熊文軒團隊正嘗試的工作之一。他所在的企業(yè)能夠實現讓科技政策、雙創(chuàng)信息通過“大數據+人工智能”的方式“主動”找到企業(yè)更有效地發(fā)揮作用。“在內容源頭,我們會選取政府網站、主流媒體等專業(yè)平臺,這樣內容推送范圍是限定的,可以有準確性、真實性、客觀性。”他說。
最后,通過算法自身規(guī)則設定也能夠實現內容管控。他說,最簡單的方式就是設定不同內容的權重值,如將娛樂新聞類權重設定為0.5、社會新聞類設為1.5,那么同樣由人工智能從網絡中爬取的100條內容中,娛樂類就會僅推送50條,社會類就會推送150條,從側面引導讀者關注熱點。“內容推薦算法的根本是分類和篩選,最終目的是幫助讀者在海量的信息中,精準找到需要關注的內容,而不是被淹沒其中。”熊文軒說。