在推薦系統的協同過濾方法中,系統會使用使用者的明確回饋(explicit feedback)或隱性回饋(implicit feedback)推斷其偏好以推薦的使用者有興趣的商品,然而無論是 Latent Factor Models 或是 Neighborhood Methods,都需要基於已有的商品使用者互動資訊來進行建模,因此每當有新加入的商品或是新使用者加入至系統,推薦系統因缺失相關互動資訊而無法進行推薦,此即為冷啟動問題(cold start problem)。
依照缺失的個體類型可以將冷啟動問題分為兩種:
冷啟動問題的核心問題在於缺少推薦所需要的可用的資訊,而取得資訊的方法可以透過明確地直接取得或是隱性地搜集存在的資訊,因此常見的解決方法可以依照此兩類進行區分:
明確取得資訊:以新使用者冷啟動問題來說,透過直接詢問使用者調查其喜好可以獲得明確的使用者資訊,並搜集缺少的資訊,然而困難之處在於過於冗長的詢問過程,會讓使用者參與互動的意願降低,進而有較差的使用者體驗,因此在此類方法需要考量的是如何選出一定代表性的問題,使這些問題保有最多的資訊量,降低詢問的時間,常見使用的技術包含使用主動學習(Active Learning)自既有的推薦候選商品中選取合適且能夠代表系統推薦準確性的商品提供給使用者評論其喜好程度,這樣的做法將可以消除大量候選商品推薦時的不確定性,除了在事前提供一系列評論清單以外,透過面談式(Interview Based)的詢問方式將可以取得較為貼近使用者的偏好,其基於使用者對於每次針對不同商品詢問後的回饋,依照喜歡、不喜歡、未知透過決策樹(decision trees)決定採用下一次要詢問的商品清單,經過多次的詢問將可以逐漸收斂使用者的偏好。
隱性地搜集資訊:此種取得資訊的方式會以最少的使用者互動取得資訊,透過外部的或是當下的現有資訊,組合出冷啟動目標的使用者偏好或是商品資訊,進而將其加入至推薦系統當中進行推薦。此種方法的困難之處在於需要從稀少的資訊挖掘出可使用的資料,以及如何從龐大的外部資料中篩選對系統有幫助的資訊。以資訊相較稀疏的冷啟動使用者檔案為例,可以修正過往的協同過濾方法,透過降低模型所需要的特徵,或是從這些稀少的資訊當中,透過 Native Bayes 或其他分類模型找到最接近的使用者或商品豐富其資訊,進行推薦系統。
另一方面,結合外部資訊如社群網路、知識圖譜等方法,可以擴充系統的資訊量並且補足冷啟動目標所缺少的資訊,得益於外部資訊其龐大且廣泛使用的服務,對於推薦系統往往是有一定輔助功能的。依照使用採用的方式包含直接取用所需要的資訊包含社群網路上,對應使用者喜好的商品、追蹤的朋友等,皆可以直接或間接的應用於現有的推薦系統當中,這些資訊相對原系統來說更具一般性,並且可以跨多領域使用。然而其缺點在於資訊未必可以符合原系統的需求,如外部資訊的喜好可以只有喜歡或不喜歡而沒有量化的評分,而對於保護個資的外部系統來說變更能取得可以使用的資訊。另一種採用的方式是透過圖(graph)的結構將現有的資訊結合成新的資訊,如透過實體對齊(entity alignment)的方式將外部資訊的使用者、商品對應至現有的使用者、商品二分圖(bipartite graph)當中,此種方法可以輕易地與現有的協同過濾方法、圖學習表示法方法結合使用,進而增加推薦準確度,然而其缺點在於外部資訊由於來源的不同其所形成的圖未必可以直接應用於原始的二分圖當中,例如 Facebook 中相連結的使用者未必代表在推薦系統中他們有著相同的喜好,而龐大的外部資訊需要更加負責的資料過濾方能符合原推薦系統的需求。