發布時間:2025-05-04 文章來源:xp下載站 瀏覽:
SPSS由IBM公司出品,它提供了包括描述性統計、推斷性統計、因子分析、聚類分析、回歸分析等多種統計分析功能,并包括文本分析、機器學習算法、數據分析模型等。SPSS的界面友好,易于操作,能夠快速從數據中提取有用的洞察和分析,廣泛應用于教育、心理、醫學、市場、人口、保險等多個研究領域,也用于產品質量控制、人事檔案管理和日常統計報表等。 作為廣受數據分析師青睞的一款數據統計和分析軟件,IBM SPSS Statistics中有全面的數據分析方法,今天我們要介紹的是它的聚類分析中的快速聚類分析。 一、方法概述 聚類分析是將研究對象按照一定的標準進行分類的方法,分類結果是每一組的對象都具有較高的相似度,組間的對象具有較大的差異。 這類分析方法多用于對于數據樣本沒有特定的分類依據的情況,IBM SPSS Statistics會通過對數據的觀察為用戶做出較為完善的分類。
圖1:功能位置 快速聚類是聚類分析的一種,使用到的功能在“分析”——“分類”中的“K-均值聚類”。 二、案例分享 1.樣本數據
圖2:功能位置 我們這里選擇的數據樣本是一部分學生的各科期末成績,使用快速聚類方法可以分析各個學生成績分布的差異和共性。 2.變量設置
圖3:功能位置 我們將學生的所有單科成績作為分析變量,移入到“變量”窗口中,將學生的編號變量移入到下側的“個案標記依據”窗口。 聚類數設置的是分類的數目,這個需要根據數據樣本的特點來設置,我們這里設置為4類。 聚類方法有兩類,即迭代和分類,前者較為復雜,會在分析過程中不斷移動凝聚點,后者則始終使用初始凝聚點,我們選擇兩類都有的第一種分析方法。 3.聚類中心
圖4:聚類中心 用戶可以選擇從外部文件或數據文件中寫入或讀取聚類中心,本案例中我們不使用這個功能。 4.迭代設置
圖5:迭代設置 我們可以設置迭代的終止條件,即到達設定的最大值后將停止迭代分析,輸出聚類分析結果。 收斂性標準設置的是凝聚點改變的最大距離小于初始凝聚點的比例,小于設定值時,也會停止迭代,輸出結果。 使用運行均值表示每次觀測后都重新計算凝聚點,這些設置保持默認即可。 5.保存
圖6:保存新變量 這是用來設置保存形式的,勾選“聚類成員”將保存SPSS的分類結果,勾選“與聚類中心的距離”將保存觀測值和所屬類別的歐氏距離,我們不做設置。 6.選項
圖7:選項設置 這個對話框設置的是輸出的統計量和個案缺失處理方法,勾選“初始聚類中心”和“每個個案的聚類信息”。 7.結果輸出
圖8:聚類結果 在輸出日志中可以看到,這些學生根據他們的單科成績被分成了四類,SPSS輸出了多個表格,包括初始聚類中心、迭代歷史記錄、聚類成員、最終聚類中心、最終聚類中心之間的距離和每個聚類中的個案數目,完整詳細,可信度較高。 三、小結 使用IBM SPSS Statistics進行快速聚類的方法和案例分享就是這么多啦,這是一個較為常用的分類分析法,適用程度很高,希望可以對大家有所幫助! 世界上許多有影響的報刊雜志就SPSS給予了高度的評價。 |
上一篇:SPSS的系統聚類區分該如何用
下一篇:SPSS如何進行二階聚類區分