2. 클러스터 분석은 독립적인 통계 기능 외에도 다른 통계 방법과 함께 데이터를 사전 처리하는 보조 기능이 있습니다.
예를 들어, 군중이 명확하지 않은 경우 원시 데이터를 클러스터링할 수 있으며, 클러스터 후 유사한 데이터를 기반으로 회귀 분석을 설정하면 분석 효과가 더 좋습니다. 또한 클러스터링이 사례 기반이 아니라 먼저 변수를 클러스터링하면 각 범주에서 가장 대표적인 변수를 추론하여 회귀 방정식에 들어가는 변수의 수를 줄일 수 있습니다.
3. 클러스터 분석은 여러 가지 통계 방법으로, 특정 특징에 따라 연구 대상을 분류하고, 특징과 변수 사이의 인과관계에 관심이 없다. 분류의 결과, 범주 간의 개인차는 커야 하고, 같은 범주 내의 개인차이는 상대적으로 작아야 한다.
확장 데이터:
클러스터링 효과 테스트;
첫째, 클러스터 분석에서 얻은 각 클래스가 효과적으로 명명될 수 있는지, 각 클래스의 피쳐가 실제 의미에 부합하는지 여부입니다. 연구원들이 전문 지식으로 각 클러스터 범주를 말할 수 있다면 클러스터 효과가 좋다는 것을 알 수 있다. 클러스터 범주의 이름을 지정할 수 없는 경우 클러스터 분석을 다시 고려해야 합니다.
둘째, 판별 분석법으로 판단한다. SPSS 에서 생성된 클러스터 범주 변수는 종속 변수 (Y) 로, 클러스터 변수는 인수 (X) 로 판별됩니다. 판별 분석은 클러스터 변수와 범주 간의 투영 관계를 구체적으로 분석합니다. 연구자들이 클러스터 분석의 효과에 대해 매우 신경을 쓴다면 판별 분석을 사용하여 분석할 수 있다.
셋째, 클러스터 분석 방법의 상세한 프로세스 설명, 클러스터 분석의 과학적 사용 과정을 명확하게 설명하고 클러스터 분석 방법의 과학적 사용은 좋은 결과를 얻기 위한 전제 조건입니다.
예, 클러스터 분석 후 범주당 샘플 수가 짝수인지 여부입니다. 클러스터 결과에 세 가지 범주가 표시되는데, 그 중 한 가지 샘플 양이 매우 작다면 (예: 30 미만) 클러스터 효과가 매우 나쁘다는 것을 알 수 있습니다. 클러스터 효과를 판단하기 위해 연구자들은 주로 전문 지식을 결합하여 클러스터 범주가 효과적으로 명명될 수 있는지 여부를 판단한다.
Baidu 백과 사전-클러스터 분석