蔽性的海量數據面前,完全依靠人工是沒辦法解決內容審核難題,這給視頻的內容管理帶來了巨大的壓力。因此,人工智能或許是視頻內容管理的不二之選。
在大數據基礎上,在視頻文件或直播中,人工智能可以進行智能化視頻分析。快速識別視頻中人臉、聲音、文字、物品、行為、場景等信息,為決策提供參考。具體來說,內容審核可化繁為簡,將視頻、直播內容轉化為人工智能可以判斷的內容比如圖片和文字,通過圖片識別、語音語義識別等人工智能技術對特殊物體如人體、刀具、槍支等做判斷。
搜索了一系列文章,才發現,在網絡視頻內容審核這件事上,如今已有多家平臺商推出了人工智能技術的應用服務,百度即是其中之一。說視頻內容審核可能大家感覺會比較嚴肅,直白點,大概就是原來人工鑒別(暴恐血腥、不良信息)現今已進化到了機器鑒別的階段。至于審核效率提升了多少,引用下網易杭州研究院執行院長汪源的話:“現在依靠深度學習的算法能夠做到99.8%的準確率。”
這樣看來,人工智能技術在網絡視頻內容審核方面的作用可謂是一場“輕量級”的智能視頻分析應用,“輕量級”則是相對于專業級的安防監控視頻的規模而言。同樣是視頻內容檢測、分析和搜索,網絡視頻和監控視頻完全是兩個級別。無論是分析的視頻數據量還是視頻內容的類型都有極大的差異。
量不同
首先從視頻數據的量來看,網站視頻主要集中在各平臺播出的影視劇、PGC/工作室內容、網友上傳的原創視頻(UGC)以及這兩年來走紅的網絡直播視頻上,這其中,數據量最大的要數網絡直播視頻,這類視頻同屬于網友原創視頻的類型,也是各平臺審查力度最大的一類視頻資源。
據2015年艾媒的視頻直播市場調研數據來看,僅2015年,全國在線直播平臺數量就接近200家,大型直播平臺每日高峰時段同時在線人數接近400萬,同時直播的房間數量超過3000個,這樣算下來每日高峰階段即有600000在線視頻直播的內容輸出,這還只是兩年前僅網站直播視頻這一項的數據量,如今這個數據恐怕早已翻出幾倍。
不過盡管如此,相較于城市視頻監控的數據規模,網站視頻的數據量仍然只是很小的一部分比例。安防視頻監控實行的是7*24*365的全時段運作,以一個攝像頭密度為6000的小型城市為例,6000高清攝像頭一小時的視頻大小將有10800000MB,一天算下來,一個城市將有247TB的視頻數據,一個月7416TB,而這僅僅是一個超小型城市的視頻數據量。
內容類型不同
網絡視頻大致可分為娛樂、生活、新聞、體育、在線教育、游戲、電競等類別,無論是影視劇還是網絡直播,審核的目標主要是查看視頻內容是否涉及黃反、暴恐血腥、政治敏感、虛假廣告等,審核的項目除了視頻畫面本身之外,還包括圖片、文字、彈幕、網友留言、惡意刷榜、活動反作弊等項目。其中鑒別不良信息是網站視頻內容審核的最大項目。
