Professional and persistent, keep improving
短視頻推薦算法中的數(shù)據(jù)收集是怎樣的?
1.用戶行為數(shù)據(jù)
瀏覽歷史:這是最重要的數(shù)據(jù)之一。算法會記錄用戶觀看過的視頻,包括視頻的主題、類別、時長等信息。例如,如果用戶經(jīng)常觀看體育賽事的短視頻,系統(tǒng)就會標(biāo)記用戶對體育內(nèi)容有興趣。
點贊、評論和轉(zhuǎn)發(fā):這些互動行為能夠強(qiáng)烈地體現(xiàn)用戶的喜好。點贊表示用戶對短視頻內(nèi)容的認(rèn)可;評論則反映了用戶更深層次的想法,可能是對內(nèi)容的提問、補(bǔ)充或贊美;轉(zhuǎn)發(fā)意味著用戶希望將這個視頻分享給更多的人,也說明用戶認(rèn)為這個視頻有較高的價值。比如,一個用戶頻繁點贊和評論美食制作短視頻,并且經(jīng)常轉(zhuǎn)發(fā)給朋友,算法就會判定該用戶對美食制作內(nèi)容有較高的興趣。
關(guān)注列表:用戶關(guān)注的賬號代表了他們長期感興趣的內(nèi)容領(lǐng)域。如果一個用戶關(guān)注了許多健身博主,那么算法會傾向于認(rèn)為該用戶對健身相關(guān)的短視頻有持續(xù)的需求。
搜索記錄:用戶在平臺內(nèi)的搜索關(guān)鍵詞也能體現(xiàn)他們的興趣點。例如,用戶搜索 “旅游攻略”,說明他們可能正在計劃旅行或者對旅游相關(guān)的短視頻感興趣。
2.視頻內(nèi)容數(shù)據(jù)
標(biāo)簽:創(chuàng)作者在發(fā)布短視頻時會給視頻添加標(biāo)簽,這些標(biāo)簽通常描述了視頻的主題、類型、風(fēng)格等關(guān)鍵信息。比如一個旅游短視頻可能會被貼上 “旅游”“風(fēng)景”“攻略” 等標(biāo)簽。
視頻類別:平臺會對短視頻進(jìn)行分類,如生活記錄、知識科普、才藝展示等類別。這有助于算法在推薦時,從相應(yīng)的類別中篩選出符合用戶興趣的視頻。
視頻時長、畫質(zhì)等基礎(chǔ)信息:這些因素也會在一定程度上影響推薦。例如,對于喜歡快速獲取信息的用戶,算法可能會推薦時長較短的短視頻;對于對畫質(zhì)要求較高的用戶,畫質(zhì)較好的短視頻可能會優(yōu)先被推薦。