win7系統下載
當前位置: 首頁 > 硬件軟件教程 > 詳細頁面

SPSS的系統聚類區分該如何用

發布時間:2025-05-04 文章來源:xp下載站 瀏覽:

SPSS由IBM公司出品,它提供了包括描述性統計、推斷性統計、因子分析、聚類分析、回歸分析等多種統計分析功能,并包括文本分析、機器學習算法、數據分析模型等。SPSS的界面友好,易于操作,能夠快速從數據中提取有用的洞察和分析,廣泛應用于教育、心理、醫學、市場、人口、保險等多個研究領域,也用于產品質量控制、人事檔案管理和日常統計報表等。

對數據進行一定條件下的分類分組是數據分析中經常需要的環節,IBM SPSS Statistics為用戶提供了幾種常用的分類方法:快速聚類、二階聚類和系統聚類。

接下來我們就簡單演示一下SPSS的系統聚類分析方法該如何使用。

一、系統聚類

系統聚類也叫做分層聚類,主要的分析思路是將每個個體看做是一類,再將相似度較高的個體組成新的一類,再將新類之間根據相似度重復合并,直到歸類結束。

常用的系統聚類方法有最短距離法、最長距離法、質心距離法等。

功能位置

圖1:功能位置

SPSS的系統聚類功能在“分析”菜單下的“分類”中,點擊可進入系統聚類分析的操作窗口。

二、操作方法

1.數據樣本

數據樣本

圖2:數據樣本

聚類分析適用于基數較大的數據樣本,為了便于理解,我們這里選擇的是一份學生成績單作為示例。

2.變量設置

變量設置

圖3:變量設置

我們這里是依據學生的單科成績、平均成績和總成績進行分析,所以將這些變量都移入“變量”窗口作為聚類依據。

學生序號移入“標注個案”窗口,注意這個窗口只能接受字符串格式的變量,必要時需要進行變量的格式修改。

選擇個案聚類,輸出內容勾選統計量和圖。

3.統計量

統計量設置

圖4:統計量設置

這個對話框設置的是輸出統計量,合并進程表是每個進程中被合并的類和類間距離,相似性矩陣是觀測值之間的距離矩陣。

聚類成員輸出的是成員所屬分類的設置,選擇“無”即可。

4.繪制

繪制設置

圖5:繪制設置

我們將聚類圖形設置為譜系圖,冰柱圖設置為全部聚類,方向設置為垂直方向。

5.方法

聚類方法

圖6:聚類方法

前文我們有簡單提到幾種聚類方法,這個對話框內顯示了所有SPSS中可用的聚類方法,我們選擇質心聚類法。

度量標準有三個,區間、計算和二分類,一般數據使用的是區間度量,選擇區間中的平方歐式距離。

在這個分析方法中,標準化和轉換度量不需要進行特殊設置。

6.保存

保存設置

圖7:保存設置

用戶可以設置保存的內容,可以不保存任何信息;也可以選擇保存單一方案,即將每一步的變量信息保存到新變量;或者選擇制定方案范圍,設置保存的上下限,本例中不做過多設置。

7.分析

譜系圖

圖8:譜系圖

在輸出日志中會查看到多個圖表,我們這里對譜系圖做一個簡單說明:如上圖,被樹狀連接的個案間、分類間具有相似性,從中我們可以發現多種分類方法,圖中標示的是較為明顯的一種,共分為五類,有兩個個案單獨成一類。

三、小結

系統聚類的概念比快速聚類復雜一點,但結果更為多樣,適合分析者嘗試多種類型的分類分析操作。


世界上許多有影響的報刊雜志就SPSS給予了高度的評價。
本文章關鍵詞: SPSS系統聚類區分 
久久亚洲国产的中文