Isomap,全名為Isometric Mapping, 是一種基於Classical MDS所產生的非線性降維演算法(Nonlinear Dimensional Reduction)。 一般來說,如果資料有著線性分佈的性質,如PCA與MDS這類計算整體資料(Global)之間的關係後再進行降維的線性演算法, 都會有不錯的效果。但如果資料本身為非線性分佈,古典PCA與MDS則時常無法在降維後正確展現出資料間的關係。
在[之前]({{ site.baseurl }}/posts/dimension-reduction-tutorial/)已經介紹過資料降維的基礎概念 以及使用進行PCA示範,因此這篇要來談的是另一種降維方式 MDS,並敘述相關理論推導。
在現實生活中,一筆資料可能會有許多欄位,如交易資料會有交易日期,時間,數量等欄位,而天氣資料會有氣溫,氣壓,濕度等,視資料屬性而定還會有超高維度資料存在(如100x100大小的灰階圖片資料可以看成是10,000維的資料,若為RGB彩色圖片就是高達30,000維的高維資料)在處理這些高維資料時會需要耗費許多時間與空間進行處理資料,且時常會包含較不重要的維度資料在其中,並增加資料複雜度。因此在進行高維資料處理時,常使用被稱為**資料降維(Dimension Reduction)**的技術,將高維資料轉換為低維資料,以利後續的資料處理。