首先你必須要有一款Rich TextBox,不是微軟自帶的那個噢,一般可以選擇FCKEditor 。
湖里網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)公司!從網(wǎng)頁設(shè)計、網(wǎng)站建設(shè)、微信開發(fā)、APP開發(fā)、成都響應式網(wǎng)站建設(shè)等網(wǎng)站項目制作,到程序開發(fā),運營維護。創(chuàng)新互聯(lián)公司自2013年創(chuàng)立以來到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設(shè)就選創(chuàng)新互聯(lián)公司。
其次呢,數(shù)據(jù)類型呢就是nText類型,圖片不用擔心,這些FCKEditor有上傳圖片的按鈕,你要做的就是把FCKEditor內(nèi)容保存到數(shù)據(jù)庫。
最后就是在后臺直接把內(nèi)容取出,用Literal控件顯示。
資源:
好像是驅(qū)動加裁時類加裁錯誤。
1)你先確定你把SQLServer的驅(qū)動jar包正確(包括位置環(huán)境)
2)看下jar包里的driver類名到底是叫什么? (我見過兩種,一種是你寫的,還一種是net.sourceforge.jtds.jdbc.Driver)
不知道啊對的?
一、世紀易網(wǎng)新聞管理系統(tǒng) v2.0 增強版
∷源碼簡介∷
主要做了2點修改:
1,去掉html目錄,將生成的目錄方式恢復到1.5版,在根目錄下面,上傳圖片可以正確調(diào)用。任意更改服務器名稱或者更改目錄路徑,顯示圖片都不會出錯。
2,將登陸時生成的目錄改成按照月份保存,一年只生成12個月份目錄,20年才生成360個目錄,比原來按照日期生成目錄數(shù)量大大減少
下載鏈接:
二、世紀易網(wǎng)新聞管理系統(tǒng)V1.5
軟件簡介
1、管理用戶密碼進行加密處理
2、添加文章采用功能強大的編輯器,實現(xiàn)所見即所得
3、JS代碼自定義功能,JS代碼信息幫助
4、完善了操作幫助說明文檔
下載鏈接:
三、淘特網(wǎng)新聞管理系統(tǒng)
淘特新聞管理系統(tǒng)是據(jù)淘特網(wǎng)站管理系統(tǒng)并參考其它CMS系統(tǒng)結(jié)合而成。
本系統(tǒng)功能強大,后臺使用 ASP腳本,管理操作方便,添加新聞時所有相關(guān)的欄目均會自動生成靜態(tài)頁面。而且各頻道的首頁、包括網(wǎng)站首頁等均可使用本系統(tǒng)的發(fā)布功能,隨時生成靜態(tài)文件。真正實現(xiàn)了全站的靜態(tài)生成。
本試用版提供的功能有:
1、類別管理(支持無限級分類)
2、新聞管理(添加、修改、刪除、查找,添加新聞時可自定義關(guān)鍵字用于搜索引擎優(yōu)化。)
3、模板管理(新聞頁面模板的在線添加、修改、刪除)
4、標簽管理(此功能是本系統(tǒng)的核心!所有欄目生成靜態(tài)頁面時,均會使用標簽內(nèi)容代替欄目模板中的標簽)。
5、發(fā)布站點(生成各頻道、欄目、網(wǎng)站首頁的靜態(tài)文件)
6、評論管理
7、友情鏈接管理(在線添加友情鏈接,包括文字鏈接和圖片鏈接,發(fā)布首頁時可一并生成靜態(tài))。
8、修改配置參數(shù)(在線修改系統(tǒng)的配置參數(shù)。具體參數(shù)在下面會有詳細說明。)
9、查看空間情況(在線查看系統(tǒng)所占用的空間狀況)。
10、生成JS文件(在線生成JS文件。可將你原來的HTM文件,生成指定文件名的JS文件)。
11、系統(tǒng)配置(在線查看系統(tǒng)的配置情況。)
12、管理日志(管理員登錄的詳細日志管理)。
演示站點1:
演示站點2:
=======================================
下載地址1:
下載地址2:
(一) 算法倫理的研究
1.算法內(nèi)涵界定。算法源于數(shù)學,但現(xiàn)代算法又遠遠不止于傳統(tǒng)數(shù)學的計算范疇。算法多被理解為是計算機用于解決問題的程序或步驟,是現(xiàn)代人工智能系統(tǒng)的運行支柱?!队嬎阒髁x:一種新的世界觀》(李建會等,2012)中將算法定義為能行的方法,在外界的常識性理解中所謂算法就是能感受到的一套運算規(guī)則,這個規(guī)則的特點在于運算時間的有限性、計算步驟的有窮性、輸入結(jié)果的確切性,它是機械步驟或能行可算計程序。該定義點明了算法應具備的兩個基本屬性——有限性與有窮性。《用計算的觀點看世界》( 酈全民,2016) 則從信息傳播的角度解讀算法,認為算法實質(zhì)上是信息處理方法。
2.算法倫理研究
倫理關(guān)乎道德價值真理及其判斷。存在于自然界、社會中的人,其行為應遵循一定的倫理道德規(guī)范。倫理的效應要導向善。倫理道德關(guān)注對個體存在的尊重、個體的自由、公平正義以及組織團體的延續(xù)與發(fā)展等問題。在一定程度上可以說,當今的人類社會已經(jīng)不能脫離智能算法系統(tǒng)而運行了。
算法無時無處不在對世界產(chǎn)生影響,因而算法也會必然的觸碰到倫理道德。和鴻鵬(2017)已指出,算法系統(tǒng)在人類社會生活中的廣泛應用,會陷入諸多如人類面臨且無法回避的倫理兩難選擇困境之中。而當算法與倫理發(fā)生關(guān)聯(lián)時,學界一般認為會引出職業(yè)倫理和技術(shù)倫理兩種倫理問題。
職業(yè)倫理主要與算法系統(tǒng)的開發(fā)者有關(guān),指開發(fā)者是帶有個性價值觀、倫理道德觀去研發(fā)算法系統(tǒng)的行為體,因而算法系統(tǒng)一開始便會摻雜著設(shè)計人主觀性的倫理道德觀。設(shè)計者出于何種目的開發(fā)某算法系統(tǒng)、面對不同問題設(shè)計者持有的倫理道德態(tài)度,這些都會在算法系統(tǒng)的運行中得到體現(xiàn)。
技術(shù)倫理是算法系統(tǒng)在一定意義上可稱之為一種科學技術(shù),這種技術(shù)自身及其運作結(jié)果都會負載著倫理價值。其實在一些情況下,職業(yè)倫理與技術(shù)倫理之間并沒有很明確的界別,關(guān)于這一點,劉則淵跟王國豫已做過論述。
本文將主要從技術(shù)倫理的角度對算法關(guān)涉?zhèn)惱磉@一問題嘗試做深入研究。
(二)網(wǎng)絡新聞傳播的算法倫理研究
算法與技術(shù)的融合不斷英語于網(wǎng)絡新聞傳播領(lǐng)域中,從數(shù)據(jù)新聞到機器寫作,從算法推送到輿情到分析,國內(nèi)新聞傳媒領(lǐng)域的機器新聞和相關(guān)研究逐漸發(fā)展,金兼斌在《機器新聞寫作:一場正在發(fā)生的革命》(2014),作者較早的將眼光聚焦于基于算法的新聞內(nèi)容生產(chǎn)和編輯。認為在自動化新聞生產(chǎn)大發(fā)展的前提下,諸如新聞生產(chǎn)或分發(fā)中勞動密集型的基礎(chǔ)性工作與環(huán)節(jié)都將被技術(shù)取代。張超、鐘新在《從比特到人工智能:數(shù)字新聞生產(chǎn)的算法轉(zhuǎn)向》(2017) 認為算法正在從比特形式走向人工智能階段,這種轉(zhuǎn)向使得數(shù)字新聞與傳統(tǒng)新聞的邊界進一步明晰,促使數(shù)字新聞生產(chǎn)也產(chǎn)生了變革。胡萬鵬在《智能算法推薦的倫理風險及防范策略》中總結(jié)了從算法推送方面:針對新聞的價值觀所受到的負面影響;以及新聞的公共性、客觀性和真實性受到的削弱進行分析;從受眾方面:將具體對信息繭房現(xiàn)象以及受眾的知情權(quán)和被遺忘權(quán)展開探討;從社會影響方面,則針對社會群體、社會公共領(lǐng)域和社會文化所受到的消極影響展開論述。
根據(jù)以上文獻的梳理可以看出,國內(nèi)目前對網(wǎng)絡新聞傳播的算法倫理研究主要集中在新聞業(yè)態(tài)算法倫理失范的相關(guān)問題,因為與其他失范問題相比,這是比較容易發(fā)現(xiàn)的。但目前關(guān)于網(wǎng)絡新聞傳播的算法倫理的國內(nèi)研究還存在不足:國內(nèi)算法倫理和網(wǎng)絡新聞傳播算法倫理的研究還是在起步階段,比較成熟的系統(tǒng)性研究還未出現(xiàn);關(guān)于算法開發(fā)人員和平臺的責任機制的研究都比較薄弱,總上所述,算法推送新聞的倫理問題研究是有必要繼續(xù)加強的。
2.新聞推薦算法的興起、發(fā)展與原理
2.1 新聞推薦算法的興起
隨著計算機技術(shù)的信息處理的維度越來越高,信息處理的能力不斷提升,算法技術(shù)可以從大數(shù)據(jù)中篩選出用戶最關(guān)心最感興趣的信息,改變了原有的新聞信息傳播方式,重塑了新的媒介生態(tài)和傳播格局。
但反過來看,在人人都能生產(chǎn)信息的背景下,信息的生產(chǎn)、傳播和反饋的速度都是呈幾何倍數(shù)增長,用戶面對的信息越來越多。由于設(shè)備的局限性和信息海量,用戶無法集中注意力看自己感興趣的內(nèi)容,也無法及時抓取對自己有用的信息,于是出現(xiàn)了“注意力經(jīng)濟”。美國經(jīng)濟學家邁克爾·戈德海伯(1997)認為,當今社會是一個信息極大豐富甚至泛濫的社會,而互聯(lián)網(wǎng)的出現(xiàn),加快了這一進程,信息非但不是稀缺資源,相反是過剩的。相對于過剩的信息,只有一種資源是稀缺的,那就是人們的注意力。換句話說,信息不能夠一味追求量,還要有價值,價值就在于用戶對信息的注意力,誰獲得了用戶的注意力就可以有市場的發(fā)展空間,通過“販賣”用戶的注意力能夠使新媒體聚合平臺獲得利潤,維持發(fā)展。再加上現(xiàn)在生活節(jié)奏越來越快,人們對信息獲取的量和效率要求提高,不想把時間浪費在自己不感興趣的信息,從而用戶獲取信息的“個性化”特征變得明顯起來。
基于此背景下,算法推送新聞的傳播機制應運而生,用戶不需要特意搜索自己需要的信息,而是海量的信息會自行“找到”用戶,為用戶節(jié)省搜索時間之余,又能做到真正為用戶提供有用的信息。
2.2新聞推薦算法的發(fā)展現(xiàn)狀
算法推薦是依據(jù)用戶數(shù)據(jù)為用戶推薦特定領(lǐng)域的信息,根據(jù)受眾使用反饋不斷修正并完善推薦方案。目前主要有兩類新聞機構(gòu)使用算法推送,其一是新型的互聯(lián)網(wǎng)新聞聚合類平臺,國內(nèi)主要是以今日頭條和一點資訊等算法類平臺為代表,在我國新聞客戶端市場上擁有極高的占有率。張一鳴創(chuàng)建今日頭條是依靠大數(shù)據(jù)和算法為用戶推薦信息,提供連接人與信息的服務,算法會以關(guān)鍵詞等元素判斷用戶的興趣愛好,從全網(wǎng)抓取內(nèi)容實現(xiàn)個性化推薦。國外則是以Facebook、Instagram等平臺為代表,這些APP都是通過算法挖掘用戶的數(shù)據(jù),以用戶個性化需求為導向?qū)τ脩暨M行新聞推送。另一種則是專業(yè)新聞生產(chǎn)的傳統(tǒng)媒體,為積極應對新聞市場的競爭和提高技術(shù)水平而轉(zhuǎn)型到新聞全媒體平臺,如國內(nèi)的“人民日報”等,國外利用算法推送向用戶推送新聞的傳統(tǒng)媒體則有美國的美聯(lián)社、華盛頓郵報和英國的BBC等,他們利用算法監(jiān)督受眾的數(shù)量還有閱讀行為,使他們的新聞報道能夠更加受受眾的喜歡,增加用戶的粘性。
2.2 新聞推薦算法的原理
2.2.1 新聞推薦算法的基本要素
算法推送有三個基本要素,分別是用戶、內(nèi)容和算法。用戶是算法推送系統(tǒng)的服務對象,對用戶的理解和認知越是透徹,內(nèi)容分法的準確性和有效性就越準確。內(nèi)容是算法推送系統(tǒng)的基本生產(chǎn)資料,對多種形式內(nèi)通的分析、組織、儲存和分發(fā)都需要科學的手段與方法。算法是算法推送技術(shù)上的支持,也是最核心的。系統(tǒng)中大量用戶與海量的信息是無法自行匹配的,需要推送算法把用戶和內(nèi)容連接起來,在用戶和內(nèi)容之間發(fā)揮橋梁作用,高效把合適的內(nèi)容推薦給合適的用戶。
2.2.2 新聞推薦算法的基本原理
算法推送的出現(xiàn)需要具備兩個條件:足夠的信息源和精確的算法框架。其中,算法的內(nèi)容生產(chǎn)源與信息分發(fā)最終效果密切相關(guān):是否有足夠多的信息可供抓取與信息是否有足夠的品質(zhì)令用戶滿意都將對信息的傳播效果產(chǎn)生影響。與此同時,分發(fā)環(huán)節(jié)也在向前追溯,改變著整個傳播的生態(tài)。目前,國內(nèi)新聞傳播領(lǐng)域所使用的算法推送主要有三大類——協(xié)同過濾推送、基于內(nèi)容推送和關(guān)聯(lián)規(guī)則推送。
協(xié)同過濾推送分為基于用戶的協(xié)同過濾和基于模型的協(xié)同過濾。前者主要考慮的是用戶和用戶之間的相似度,只要找出相似用戶喜歡的新聞文章類別,并預測目標用戶對該文章的喜歡程度,就可以將其他文章推薦給用戶;后者和前者是類似的,區(qū)別在此時轉(zhuǎn)向找到文章和文章之間的相似度,只有找到了目標用戶對某類文章的喜愛程度,那么我們就可以對相似度高的類似文章進行預測,將喜愛程度相當?shù)南嗨莆恼峦扑]給用戶。因此,前者利用用戶歷史數(shù)據(jù)在整個用戶數(shù)據(jù)庫中尋找相似的推送文章進行推薦,后者通過用戶歷史數(shù)據(jù)構(gòu)造預測模型,再通過模型進行預測并推送。
基于內(nèi)容的推送即根據(jù)用戶歷史進行文本信息特征抽取、過濾,生成模型,向用戶推薦與歷史項目內(nèi)容相似的信息。它的優(yōu)點之一就是解決了協(xié)同過濾中數(shù)據(jù)稀少時無法準確判斷分發(fā)的問題。但如果長期只根據(jù)用戶歷史數(shù)據(jù)推薦信息,會造成過度個性化,容易形成“信息繭房”。
關(guān)聯(lián)規(guī)則推送就是基于用戶歷史數(shù)據(jù)挖掘用戶數(shù)據(jù)背后的關(guān)聯(lián),以分析用戶的潛在需求,向用戶推薦其可能感興趣的信息?;谠撍惴ǖ男畔⑼扑]流程主要分為兩個步驟,第一步是根據(jù)當前用戶閱讀過的感興趣的內(nèi)容,通過規(guī)則推導出用戶還沒有閱讀過的可能感興趣的內(nèi)容;第二是根據(jù)規(guī)則的重要程度,對內(nèi)容排序并展現(xiàn)給用戶。關(guān)聯(lián)規(guī)則推送的效果依賴規(guī)則的數(shù)量和質(zhì)量,但隨著規(guī)則數(shù)量的增多,對系統(tǒng)的要求也會提高。
2.2.3 算法推送的實現(xiàn)流程
在信息過載的時代,同一個新聞選題有很多同質(zhì)化的報道,因此分發(fā)前需要對新聞內(nèi)容進行消重,消重后的新聞內(nèi)容便等待推送,此時的推送有三個類別:啟動推送、擴大推送和限制推送。
第一類是啟動推送,先對用戶精準推送,即將其訂閱賬號的更新內(nèi)容第一時間向用戶推薦;然后根據(jù)用戶的歷史瀏覽數(shù)據(jù),把相似的文本特征歸類后推送給其他用戶;最后是給關(guān)注用戶的相似人群進行推薦。第二類擴大推送是指對于某個點擊率、閱讀時長都明顯高于平均水平的新聞內(nèi)容,系統(tǒng)會將它自動篩選出來,并向更多的人進行推薦。但在擴大推薦的過程中,系統(tǒng)會依據(jù)用戶的反饋進行調(diào)整。第三為限制推送,指某個點擊率、閱讀時長都明顯低于平均水平的新聞內(nèi)容,會被系統(tǒng)自動篩選出來,遏制推送,這樣的內(nèi)容會被縮小推薦范圍。
3. “今日頭條”新聞推薦算法分析
“今日頭條”是國內(nèi)一款資訊類的媒體聚合平臺,每天有超過1.2億人使用。從“你關(guān)心的,才是頭條!”到如今的“信息創(chuàng)造價值!”,產(chǎn)品slogan的變化也意味著今日頭條正逐漸擺脫以往單一、粗暴的流量思維,而開始注重人與信息的連接,在促進信息高效、精準傳播的同時注重正確的價值引導。
在2018年初,“今日頭條”的資深算法架構(gòu)師曹歡歡博士在一場分享交流會上公開了其算法運行原理。在他的敘述中,非常詳細地介紹了“今日頭條”的算法推薦系統(tǒng)概述以及算法推薦系統(tǒng)的操作原理。
3.1.1-1 曹歡歡博士的今日頭條算法建模
上圖用數(shù)學形式化的方法去描述“今日頭條”的算法推送,實際上就是一個能夠得出用戶對內(nèi)容滿意程度的函數(shù):即y為用戶對內(nèi)容的滿意度,Xi,Xc,Xu分別是今日頭條公開的算法推送的三個維度:Xi是用戶,包括用戶的性別、年齡、職業(yè)和興趣標簽,還有其他算法模型刻畫的隱形用戶偏好等;Xc是環(huán)境,這也是移動互聯(lián)網(wǎng)時代新聞推送的特點,由于用戶隨時隨地在不停移動,移動終端也在移動,用戶在不同的工作場合、旅行等場景信息推送偏好也會不同;Xu是內(nèi)容,今日頭條本身就是信息聚合類平臺,平臺上涵蓋各種不同形式的內(nèi)容。本章將以該函數(shù)為基礎(chǔ),逐一分析今日頭條的推薦算法。
3.1 推薦維度之一:內(nèi)容分析
內(nèi)容分析原指第二次世界大戰(zhàn)期間,傳播學家拉斯韋爾等研究學家組織了“戰(zhàn)士通訊研究”的工作,以德國公開出版的戰(zhàn)時報紙為分析研究對象,弄清報紙內(nèi)容本質(zhì)性的事實和趨勢,揭示隱含的隱性情報內(nèi)容,獲取了許多軍情機密情報并且對事態(tài)發(fā)展作出情報預測。在“今日頭條”中,內(nèi)容分析則是對文章、視頻內(nèi)容提取關(guān)鍵要素,通過對文本、視頻標題關(guān)鍵字進行語義識別,給內(nèi)容進行分類?!敖袢疹^條”的推送系統(tǒng)是典型的層次化文本分類算法,來幫助每篇新聞找到合適的分類,比如:第一大分類是政治、科技、財經(jīng)、娛樂、體育等,體育類可以下分籃球、足球、網(wǎng)球等,足球又可以下分中國足球和國際足球,中國足球最后下分為甲、中超、國家隊等。這一步是對文章進行對這個工作主要目的是對文章進行分類,方便以后對客戶推薦。
想要內(nèi)容分析實現(xiàn)效果,則需要海量的內(nèi)容信息給算法系統(tǒng)提供有效的篩選和分類。“今日頭條”既然是依賴于算法推送新聞,那它背后的數(shù)據(jù)庫必然是強大的,“網(wǎng)頁蜘蛛”和“頭條號”就是支撐今日頭條平臺消息來源的重要渠道,其消息來源極其豐富,何時何地有何新鮮事,都能高效率抓取信息。
第一個消息來源的渠道是“網(wǎng)頁蜘蛛”,“網(wǎng)頁蜘蛛”又叫網(wǎng)頁爬蟲,頭條使用的就是搜索引擎爬蟲叫“Bytespider”。它能按照一定的規(guī)則,自動爬行抓取互聯(lián)網(wǎng)的信息或腳本,就像蜘蛛通過蛛網(wǎng)進行捕食,當發(fā)現(xiàn)新的信息資源,蜘蛛會立刻出動抓取信息內(nèi)容并將其收入自己的數(shù)據(jù)庫中。和微信的垂直搜索不同,Bytespider是能夠抓取全網(wǎng)內(nèi)容的全新搜索引擎,因此“今日頭條”的搜索引擎功能很全面,搜索的資源很廣,資源包容性極高。
Bytespider信息抓取的基本流程如下:首先是網(wǎng)頁抓取。Bytespider順著網(wǎng)頁中的超鏈接,從這個網(wǎng)站爬到另一個網(wǎng)站,通過超鏈接分析連續(xù)訪問抓取更多網(wǎng)頁。被抓取的網(wǎng)頁被稱之為網(wǎng)頁快照。由于互聯(lián)網(wǎng)中超鏈接的應用很普遍,理論上,從一定范圍的網(wǎng)頁出發(fā),就能搜集到絕大多數(shù)的網(wǎng)頁。第二步是處理網(wǎng)頁。搜索引擎抓到網(wǎng)頁后,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關(guān)鍵詞,建立索引庫和索引。其他還包括消除重復網(wǎng)頁、判斷網(wǎng)頁類型、分析超鏈接、計算網(wǎng)頁的重要度、豐富度等。第三步提供檢索服務。用戶輸入關(guān)鍵詞進行檢索,搜索引擎從索引數(shù)據(jù)庫中找到匹配該關(guān)鍵詞的網(wǎng)頁,為了用戶便于判斷,除了網(wǎng)頁標題和URL外,還會提供一段來自網(wǎng)頁的摘要以及其他信息。
第二個消息來源渠道是“頭條號”。與“今日頭條”不同,它是今日頭條針對媒體、國家機構(gòu)、企業(yè)以及自媒體推出的專業(yè)信息發(fā)布平臺。致力于幫助生產(chǎn)者在移動互聯(lián)網(wǎng)上高效率地獲得更多的曝光和關(guān)注。簡單來說頭條號是媒體在上面撰寫并發(fā)布文章、視頻后,會在今日頭條(包括今日頭條極速版)平臺展示。通過頭條號后臺,媒體可以看到具體文章推薦量、閱讀量、粉絲閱讀量、評論量、轉(zhuǎn)發(fā)量和收藏量,最后通過這些可以量化的用戶閱讀行為的反饋,算法系統(tǒng)進一步對目標用戶進行內(nèi)容推薦。
3.2 推薦維度之二:用戶分析
用戶分析通過提取用戶的有效數(shù)據(jù),如用戶經(jīng)常瀏覽的文字類型、經(jīng)常搜索的關(guān)鍵字、注冊時登記信息的內(nèi)容等,算法系統(tǒng)可以將每個用戶的瀏覽記錄、瀏覽時間、留言、評論和轉(zhuǎn)發(fā)等行為進行關(guān)鍵字提取,最終形成用戶畫像,以便之后對用戶進行文章和視頻的精準推送。舉個例子,給喜歡閱讀“體育”的用戶標上“體育”標簽;給喜歡“娛樂”的用戶標上“娛樂”的標簽,這一步的作用是給用戶的興趣進行建模,包括用戶對文章和視頻的全局熱度、分類熱度,主題熱度,以及關(guān)鍵詞熱度等。熱度信息在大的推薦系統(tǒng)能夠解決新聞冷啟動問題,幫助新聞實現(xiàn)推送。
用戶分析還具有協(xié)同特征,它可以在部分程度上幫助解決所謂算法越推越窄的問題。協(xié)同特征也就是“聯(lián)想式”的推送方法,并非只考慮用戶已有歷史,而是通過用戶行為分析不同用戶間相似性,比如點擊相似、興趣分類相似、主題相似、興趣詞相似,甚至向量相似,從而擴展模型的探索能力。根據(jù)用戶之間計算數(shù)據(jù)的相似程度,把用戶細化分類成為不同的目標群體,再向目標群體集中的推送其感興趣的新聞內(nèi)容
內(nèi)容分析和用戶分析是相輔相成的,如果沒有分析的文本標簽,無法得到用戶興趣標簽,沒有用戶的興趣標簽就無法給用戶定位實現(xiàn)精準推送。
3.3 推薦維度之三:環(huán)境分析
環(huán)境分析就是根據(jù)文章的時效性和接近性推送給相應的用戶,比如獲取用戶當前所在位置是否在旅游區(qū),這個可以通過獲取用戶的實時位置來實現(xiàn)。還會不斷與用戶之前經(jīng)常出現(xiàn)的所在地進行對比等方式確認當前狀態(tài),分析出用戶是在常住地區(qū)還是在旅行。這時若系統(tǒng)檢測到用戶正在泰山及周邊游玩,則可能會相應推送泰山的相關(guān)文章、周邊的交通新聞和天氣信息等等。
通過上面三個推薦維度可以作為數(shù)據(jù)基礎(chǔ),分析當前用戶處于什么環(huán)境,結(jié)合用戶畫像以及文章的內(nèi)容分類來推薦,盡量做到推送的內(nèi)容都是用戶所感興趣的。算法系統(tǒng)還會通過內(nèi)容分類、分析抽取,把文本相似度高的文章,包括新聞主題、內(nèi)容相似的文章進行消重,解決推送重復的問題,進一步對目標用戶進行精確且不重復的內(nèi)容推薦。最后過濾質(zhì)量低俗色情的內(nèi)容,以免造成平臺會有負面傾向。
3.4 “今日頭條”新聞推薦算法的價值取向
3.4.1 “用戶為上”
“今日頭條”的算法推送是站在用戶的立場上的,以滿足用戶個性化和推送的精準性,“今日頭條”也重新衡量了新聞價值標準:以用戶為上,用戶對新聞內(nèi)容和閱讀方式的滿意度便是平臺推送新聞的價值宗旨。傳統(tǒng)媒體時代,只有報紙和電視,有什么受眾就得看什么,而如今“今日頭條”根據(jù)用戶興趣去進行推送。算法推送平臺用戶范圍廣,很多用戶熱衷關(guān)注負面,也有許多用戶都有窺視欲和好奇心,喜歡無聊八卦和無聊新聞,而且在好奇心作用下用戶都有從眾心理。這使得生產(chǎn)者過度去迎合受眾,只要是用戶喜歡看就可以發(fā)表在“今日頭條”上。
3.4.2 “算法主導”
“今日頭條”更注重技術(shù)分發(fā),生產(chǎn)者是用戶,受眾者也是用戶,這樣一來內(nèi)容監(jiān)管和分發(fā)就很困難。算法推送機制根據(jù)用戶愛好進行推送,這樣生產(chǎn)的內(nèi)容快、也無疑會加速內(nèi)容配送效率。在算法推送模型中,用戶點擊頻率、閱讀時間、點贊評論以及轉(zhuǎn)發(fā)在算法時代都是可以進行量化的目標。在這樣情況下生產(chǎn)的內(nèi)容,想要獲得較大點擊率和推送率,需要標題才能吸引用戶,因為用戶在平臺一眼能看到的就是標題和配圖。標題和配圖決定用戶是否會打開你的內(nèi)容,這導致許多內(nèi)容生產(chǎn)者在編輯新聞標題時陷入標題黨的怪圈,還有導致低俗內(nèi)容的呈現(xiàn),以制造沖突制造懸念貼標簽等方式引用戶點擊,意圖把自己的文章做成爆文。對于海量的信息內(nèi)容,即使今日頭條數(shù)據(jù)和智能推薦做的再好,目前來說也難以抵擋海量的垃圾信息。
4.算法推送新聞引發(fā)的倫理問題
在如今網(wǎng)絡時代的傳播思維中,“用戶為上”、“算法主導”的新聞價值取向已經(jīng)在算法聚合類平臺成為了普遍,算法推送技術(shù)作為吸引用戶的手段,搭建起一個充滿誘導的媒介環(huán)境,以此增加用戶對平臺的粘性。算法推送技術(shù)在獲取信息、傳播速度等方面與以往相比有著跨時代的進步,但與此同時,由于算法推送技術(shù)的加入,衍生出新的倫理問題,并且日漸復雜化。
4.1 算法推送引發(fā)的倫理問題
4.1.1 算法推送過于機械化,沒有思考能力
單向的算法推薦對用戶來說經(jīng)常會帶來內(nèi)容雜亂無章、信息量過大、信息價值低等問題。從邏輯講,算法只是從關(guān)鍵字的檢索匹配來完成統(tǒng)計推薦,但對新聞報道或文學作品具有藝術(shù)性、專業(yè)性的內(nèi)容來說,是不能保證推送的質(zhì)量的。算法方面,目前主要基于匹配檢索與統(tǒng)計,大部分都是個人關(guān)注的信息類型和標簽,難以達到較好的推送效果。一千個人眼里有一千個哈姆雷特,但是計算機只有只有一個。算法技術(shù)過于注重機械化的統(tǒng)計,只根據(jù)關(guān)鍵詞來推薦用戶,對我們中國具有博大精深的中國文字文化底蘊,推薦算法是遠遠不夠的。整個新聞客戶端顯得像是一個菜市場,沒有態(tài)度、沒有風格,閱讀感受單一化,呈現(xiàn)了碎片化的特點。新聞不只是讓用戶能夠了解身邊發(fā)生的新鮮事,還有宣傳正面思想和傳播正能量的作用,新聞應該還要給人們帶來新的思考。讓機器做出正確判斷很簡單,但是讓機器綜合心理學、社會學、乃至某細分領(lǐng)域內(nèi)的規(guī)則做出判斷還要正確地引導受眾則很難,正如現(xiàn)在算法技術(shù)還不能完成一篇富有人文性、文學性和批判性的深度報道,它止步在了碎片式的、表層的傳播范疇。
4.1.2 容易引起“信息繭房”效應
“信息繭房”這一概念是凱斯.桑斯坦在《信息烏托邦》一書中提出的。意指受眾在過度的信息自我選擇之中,這樣會降低接觸外界其他信息的可能,從而將自己的生活桎梏于蠶繭一般的“蠶房”中的現(xiàn)象。人們的信息領(lǐng)域會習慣性被自己的興趣引導,信息窄化帶來了受眾對信息接收的單一性,這種單一性的可能會使受眾陷入循環(huán),加重受眾信息同質(zhì)化。
在互聯(lián)網(wǎng)的普及初期,受眾主要是從主流媒體和門戶網(wǎng)站獲取新聞信息,主流媒體能夠保障新聞的質(zhì)量;對于其他資訊的獲取,由于技術(shù)的限制,此時的繭房并沒有過度被放大,受眾是有適當?shù)淖灾鬟x擇性閱讀新聞的。但到了如今以智能技術(shù)的互聯(lián)網(wǎng)時代,情況發(fā)生了改變,信息繭房的現(xiàn)象越來越明顯,用戶被標簽的情況下,算法系統(tǒng)進行大量的主動推送,使受眾被動地成為信息的接收者。用戶的閱讀興趣不可能涵蓋所有的知識領(lǐng)域,算法分發(fā)的核心邏輯是根據(jù)用戶的行為數(shù)據(jù)來進行精確推薦的,但同時算法又會自動過濾掉“不感興趣”“不認同”的信息,實現(xiàn)“看我想看,聽我想聽”。在此過程中,因為算法技術(shù)的力量將用戶的信息選擇效果放大了倍數(shù),進而將受眾困住在信息繭房當中,受眾也很難憑借自身力量打破繭房,甚至在不知覺中受到更多負面的影響。
4.1.3 算法推送的“偽中立性”
客觀和全面是新聞倫理的基本要求,新聞從業(yè)者必須從可好信息源來獲取真實的信息,以客觀的態(tài)度反應現(xiàn)實。我們慣常認為,互聯(lián)網(wǎng)技術(shù)服務商是技術(shù)中立者,不需要承擔約束大眾媒體的社會責任,然而當信息把關(guān)人又新聞編輯轉(zhuǎn)變?yōu)樗惴üこ處?,傳統(tǒng)的媒介倫理似乎已經(jīng)失效。算法具有商業(yè)傾向性,“中立性”是算法平臺用以逃避媒體責任的理由,給大眾媒介造成傳播亂象,如此一來更像是一場算法平臺“肆意妄為又不想負責”的詭辯。
算法平臺的信息源是經(jīng)過選擇和過濾的,“頭條號”的內(nèi)容占“今日頭條”整個信息系統(tǒng)的絕大部分,然而在“人人都可以做新聞人”的時代,頭條號平臺是一個開放的網(wǎng)絡媒介環(huán)境,存在大量的偏見和錯誤的認知。無論是“今日頭條”平臺設(shè)立的算法規(guī)則,還是其他爬蟲的抓取的關(guān)鍵詞,算法系統(tǒng)的信息源很多是具有目的性的、有偏見和非客觀的信息,所以信息源不能直接作用于用戶。因此,篩選算法系統(tǒng)的信息源與傳統(tǒng)的人工編輯相比較,范圍極廣且很難把關(guān),若算法被惡意利用,那么使整個傳播系統(tǒng)將會被輕易控制。
4.1.4 算法推送里的“議程設(shè)置”
原議程設(shè)置功能揭示的重要內(nèi)涵是:“受眾對新聞的看法雖然被大眾媒體議程設(shè)置功能所主導,但其更深刻的是議程設(shè)置給大眾媒體新聞帶來放大與延伸,從而使受眾對新聞選擇做出能動性修正,讓受眾在滿足需求和媒介依賴中逐漸培養(yǎng)出的潛在認同感”。
推送算法技術(shù)在互聯(lián)網(wǎng)平臺的運用,使原來傳統(tǒng)媒體主導的議程設(shè)置過程發(fā)生了變化,伴隨著傳播權(quán)的轉(zhuǎn)移、公眾參與度的提高和信息量劇增等原因?qū)е伦h程設(shè)置功逐漸能減弱。過往傳統(tǒng)新聞的內(nèi)容是由編輯有選擇地進行報道后再呈現(xiàn)在受眾面前的,而個性化新聞推送是用戶自己來選擇看哪一方面的內(nèi)容,而這一環(huán)節(jié)中,天然的技術(shù)賦權(quán)將傳播權(quán)從傳統(tǒng)媒體下放至平臺的用戶,使得受眾和社會的連接無需依賴傳統(tǒng)媒介,新聞媒體作為把關(guān)人的作用和議程設(shè)置功能都在減弱。
4.2 算法新聞治理缺陷下的算法權(quán)利異化
算法作為人工智能的基石之一,是“一種有限、確定、有效并適合用計算機程序來實現(xiàn)的解決問題的方法,是計算機科學的基礎(chǔ)”。近年來,伴隨人工智能深度學習算法取得的重大突破和大數(shù)據(jù)時代的到來,人工智能的應用場景不斷拓展,人工智能時代正逐漸從想象成為現(xiàn)實。借助于海量的大數(shù)據(jù)和具備強大計算能力的硬件設(shè)備,擁有深度學習算法的人工智能機器可以通過自主學習和強化訓練來不斷提升自身的能力,解決很多人類難以有效應對的治理難題。伴隨人工能算法在國家和社會治理中重要性的日漸凸顯,國家和社會對于算法的依賴也逐漸加深,一種新型的權(quán)力形態(tài)——算法權(quán)力也隨之出現(xiàn)。
可以把算法權(quán)利分為四種:數(shù)據(jù)主權(quán)、算法設(shè)計權(quán)、研發(fā)的資本權(quán)和算法控制權(quán)。由于前三種權(quán)利都是單向的、算法開發(fā)者賦予算法的權(quán)利,是屬于算法開發(fā)者的,與算法分發(fā)平臺呈現(xiàn)的效果沒有直接的影響,所以本文將著重論述算法控制權(quán)。
算法控制權(quán)是雙向的,用戶是算法技術(shù)數(shù)據(jù)行為的提供者,同時又是被算法技術(shù)控制的受害者。例如我們看到“今日頭條”會通過推送算法來監(jiān)管用戶的發(fā)布和瀏覽行為,同時平臺會通過算法決策系統(tǒng)來實現(xiàn)內(nèi)容的發(fā)布去引導用戶。算法控制權(quán)當然是一種天然技術(shù)賦予的權(quán)利,但算法控制權(quán)是在用戶提供數(shù)據(jù)行為的情況下才得以實現(xiàn)的,因此算法控制權(quán)既存在內(nèi)容生產(chǎn)權(quán),同時有要尊重和保護算法相對人的義務。
正因為如此,算法技術(shù)被認為是一種雙刃劍,一方面算法能夠做出精準的行為預測,可以為管理者提供非常好的循環(huán)干預機制;對于公共行為主體來說,可以通過對大數(shù)據(jù)的應用來解決社會治理問題,對于私人主體來說可以借助數(shù)據(jù)來提供個性化和定制化的服務;另一方面,算法技術(shù)存在著諸如利益和風險不對稱等問題,而且由于算法技術(shù)發(fā)展的超前性,新科技的創(chuàng)造者具備不對稱的信息和技術(shù)優(yōu)勢,能夠按照自身利益的需求來塑造在平臺上的算法推送邏輯和社會系統(tǒng),這帶來了監(jiān)管的不確定性。人們要通過集體行為去承擔社會責任,通過這樣的方式規(guī)制算法權(quán)利,可以讓我們能夠?qū)λ惴ǚ职l(fā)系統(tǒng)的意義和價值得到更深刻的思考。
分析下:模塊有用戶、新聞、統(tǒng)計報表。兩個人保守估計三個月開發(fā)完,快的話一到兩個月。一個人工資為4000,再加些雜項算5000。10000-30000左右。