2024-09-03 01:59
▎DBSCAN 分群演算法介紹與實際應用範例
以前在開發 Chrome 擴充 NimoTab 時,有 1 個功能需要將相似/相同的網頁標題分群在一起,不過為了追求易用性,最大考量是不需要讓使用者自己選擇要分幾個群組,全部自動分群!
當時用的是土炮的方法(但其實類似 DBSCAN),不過後來跟從事機器學習的同事討教有沒有更好的做法時,才知道有 1 個稱為 DBSCAN 的演算法可以使用。
(當時被分群結果的示範圖給嚇到,以為很難,所以沒有去研究,結果最近一看才知道不難⋯⋯)
本文將介紹 DBSCAN 這個實用的分群演算法,並以實際範例展示如何做到將相似的資料分群在一起,藉此讓大家對 DBSCAN 有更深入的理解。