컴퓨터 기술, 네트워크 기술, 통신 기술 및 인터넷 기술이 발전함에 따라 기업은 전자 상거래에서 대량의 비즈니스 데이터를 생성합니다. 풍부한 고객 데이터에서 귀중한 정보를 발굴하고 비즈니스 관리자에게 효과적인 의사 결정 지원을 제공하는 방법은 기업이 진정으로 염려하는 문제입니다. 이 중 고객 분류는 분석적 고객 관계 관리의 중요한 기능 중 하나입니다. 고객을 분류하고, 고객의 샤요도를 구분하고, 서로 다른 샤요 수준의 고객을 위한 전문 마케팅 계획과 고객 관계 관리 전략을 개발함으로써 기업이 마케팅 비용을 절감하고 이익과 경쟁력을 높이는 데 도움이 될 수 있습니다. 고객은 식품업계가 제정한 특별 마케팅 프로그램 및 고객 관계 관리 전략에서 적절한 거래 경험을 얻을 수도 있습니다. 데이터 마이닝은 분석 CRM 이 "분석" 기능을 구현하는 데 필요한 수단이자 고객 분류를 구현하는 효과적인 도구입니다.
1 고객 관계 관리 (CRM)
CRM (고객 관계 관리) 은 기업과 고객 관계를 개선하기 위한 새로운 관리 메커니즘입니다. 이 제품은 기업의 마케팅, 판매, 서비스, 기술 지원 등에 구현되어 있으며, 고객을 유치하고 유지할 수 있는 더 좋고 빠른 서비스를 제공하고 비즈니스 프로세스를 포괄적으로 관리하여 창고 비용을 줄이는 것을 목표로 하고 있습니다.
전자 상거래 환경에서 CRM 은 웹 사이트 기업이 고객의 요구를 더 잘 충족하고 각 비즈니스 단계에서 더 나은 서비스를 제공할 수 있도록 하여 웹 사이트 기업이 시간과 공간 차이가 없는 새로운 비즈니스 환경에서 기존 고객을 유지하고 잠재 고객을 발굴할 수 있도록 합니다. 시장 경쟁력을 높이다. 또한 CRM 은 고객 요구 사항, 시장 분포, 피드백 정보 등 중요한 정보를 제공하여 기업 및 비즈니스 활동에 대한 지능형 분석의 기초를 제공합니다. 따라서 CRM 은 기업이 전자 상거래를 성공적으로 실현할 수 있는 기반을 제공합니다.
맞춤형 서비스는 경쟁력을 높이는 강력한 무기이며, CRM 은 고객 중심적이며 고객에게 가장 적합한 서비스를 제공합니다. 인터넷은 이미 고객 관계 관리 애플리케이션을 구현하는 데 이상적인 채널이 되었다. 고객의 이름과 선호도를 기억하고 고객에 따라 다른 콘텐츠를 제공하면 고객이 다시 방문할 가능성이 크게 높아집니다. CRM 은 고객 충성도를 높이고, 구매 비율을 높이고, 고객당 더 많은 구매 수요와 더 긴 수요를 확보하고, 고객 만족도를 높일 수 있습니다.
2 데이터 마이닝 기술
이러한 방대한 양의 데이터를 분석하는 방법, 강력한 도구는 비즈니스 의사 결정에 귀중한 정보를 제공하고 기업이 이익을 얻을 수 있도록 하는 데이터 마이닝입니다.
분석형 CRM 시스템에서 데이터 마이닝은 핵심 기술입니다. 데이터 마이닝은 대량의 데이터에서 잠재적으로 가치 있는 지식, 모델 또는 규칙을 추출하는 프로세스입니다. 기업의 경우 데이터 마이닝은 비즈니스 발전 추세를 파악하고, 알려진 사실을 밝히고, 알 수 없는 결과를 예측하고, 기업이 작업을 완료하는 데 필요한 핵심 요소를 분석하여 수익을 늘리고, 비용을 절감하고, 기업을 더욱 유리한 경쟁 위치에 두는 데 도움이 됩니다.
2. 1 데이터 마이닝 공통 알고리즘
(1) 의사 결정 트리 결정 알고리즘. 의사 결정 트리는 순서도와 유사한 트리 구조입니다. 이러한 각 내부 노드는 속성 테스트를 나타내고, 각 분기는 테스트 출력을 나타내며, 각 리프 노드는 클래스 또는 클래스 분포를 나타냅니다. 의사 결정 트리 알고리즘에는 트리 구성과 트리 트리밍이 포함됩니다. 일반적인 가지 치기 방법에는 먼저 가지를 자른 다음 가지를 자르는 두 가지가 있다.
(2) 신경망. 신경 네트워크는 각 연결에 가중치가 있는 상호 연결된 입력 및 출력 단위 세트입니다. 학습 단계에서 신경망의 가중치를 조정하여 입력 샘플의 정확한 범주 라벨을 예측할 수 있습니다.
(3) 유전 알고리즘. 유전 알고리즘은 우승열태의 원칙에 따라 현재 집단에 가장 적합한 규칙과 이러한 규칙의 후손으로 구성된 새로운 집단을 형성한다. 유전 알고리즘은 분류 및 기타 최적화 문제에 사용됩니다.
(4) 거친 집합 방법. 러프 세트 방법의 기초는 주어진 교육 데이터에 동등한 클래스를 설정하는 것입니다. 지식을 데이터 분할로 해석합니다. 각 분할된 집합을 개념이라고 하며, 알려진 지식 기반을 사용하여 부정확하거나 불확실한 지식을 가공하거나 조각합니다. 러프 세트는 피쳐 감소 및 상관 분석에 사용됩니다.
(5) 퍼지 집합 방법. 규칙 기반 분류 시스템에는 연속 속성에 대한 가파른 절단이 있다는 단점이 있습니다. 블러 논리의 도입을 통해 "블러" 경계를 정의할 수 있으므로 높은 추상화 계층에서 쉽게 처리할 수 있습니다.
그 밖의 예로는 베이지안 네트워크, 시각화 기술, 인접 검색 방법 및 공식 검색 등이 있습니다.
2.2 데이터 마이닝에서 일반적으로 사용되는 분석 방법
(1) 분류 예측. 주로 고객 세분화 (클러스터) 처리에 사용됩니다 (예: 가치 고객 기반 분류). 분류와 예측은 중요한 데이터 범주를 설명하는 모델을 추출하거나 향후 추세를 예측하는 데 사용할 수 있는 두 가지 데이터 분석 형태입니다. 데이터 검증은 2 단계 프로세스입니다. 첫 번째 단계에서는 미리 결정된 데이터 클래스 또는 개념 세트를 설명하는 모델을 만들고 속성 설명이 있는 데이터베이스 튜플을 분석하여 모델을 구성합니다. 두 번째 단계는 모델을 사용하여 분류하는 것입니다. 첫째, 모델 쟁기의 예측 정확도를 평가합니다. 모형의 정밀도가 허용되는 경우 알 수 없는 범주 레이블이 있는 데이터 상위 또는 객체를 분류하는 데 사용할 수 있습니다.
예측 기술은 주로 고객의 미래 행동 (예: 고객 손실 분석, 신경 네트워크 방식으로 다양한 고객 손실 전 행동 변화를 학습하여 가치 있는 고객의 잠재적인 손실을 예측 (경보) 하는 데 사용됩니다. 예측기는 모델을 빌드 및 사용하여 태그가 지정되지 않은 샘플 클래스를 평가하거나 지정된 샘플의 가능한 속성 값 또는 값 간격을 평가합니다. 분류 및 예측은 신용 확인, 의료 진단, 성능 예측, 구매 옵션 등 다양한 응용 분야를 가지고 있습니다. 분류 예측에 일반적으로 사용되는 알고리즘으로는 의사 결정 트리 요약, 베이지안 분류, 베이지안 네트워크, 신경망, K 이웃 분류, 유전 알고리즘, 러프 세트 및 퍼지 세트 기술이 있습니다.
(2) 클러스터 분석. 클러스터링은 데이터 객체를 여러 클래스 또는 클러스터로 나누는 것입니다. 동일한 클러스터의 객체는 유사성이 높지만 클러스터의 객체는 크게 다릅니다. 클러스터 분석은 통계학의 한 분야로서 이미 여러 해 동안 광범위하게 연구되어 왔으며, 지금은 주로 거리 기반 클러스터 분석에 집중되어 있다. K-means, K-medoids 등의 클러스터 분석 도구도 많은 앱이 있습니다.
(3) 상호 관계 규칙. 상호 관계 규칙은 지정된 데이터 세트 항목 간의 흥미로운 관계를 마이닝합니다. I = {i 1, I2, ... im} 을 항목 세트로 설정하고, 작업 관련 데이터 d 를 데이터베이스 트랜잭션 세트로 설정합니다. 여기서 각 트랜잭션 t 는 항목 세트이므로 t 는 I 에 포함됩니다. 상호 관계 규칙은 A =>B 의 함의 형태로 포함됩니다. 여기서 a 마이닝 상호 관계 규칙은 두 단계로 나뉩니다. ① 미리 정의된 최소 지원 수와 동일한 빈도로 모든 빈번 항목 세트를 찾습니다. ② 빈번 항목 집합에서 강력한 연관 규칙을 생성합니다. 이러한 규칙은 최소 지원 및 최소 신뢰도를 충족해야 합니다.
(4) 시퀀스 모드. 시퀀스 패턴 분석은 관계형 규칙 분석과 유사하며 데이터 항목 간의 관계를 마이닝하는 것을 목적으로 하지만 시퀀스 패턴 분석은 시간 차원에서 데이터 항목의 순서 관계입니다. 예를 들어, 고객은 컴퓨터를 구입한 지 6 개월 후에 재무 분석 소프트웨어를 구입할 수 있습니다.
(5) 고립점 분석. 이상값은 측정 오차 또는 고유 데이터 가변성의 결과입니다. 많은 데이터 마이닝 알고리즘은 이탈값의 영향을 최소화하거나 제거하려고 합니다. 어떤 경우에는 한 사람의 소음이 다른 사람의 신호일 수 있다. 고립된 점이 유용합니다. 아웃 라이어 마이닝은 주어진 N 개의 데이터 포인트 또는 개체 세트 및 예상 K 수의 이탈로 설명될 수 있으며, 나머지 데이터와 현저히 다르거나 일치하지 않는 상위 K 개 개체를 찾을 수 있습니다. 이탈 감지 방법은 통계 방법, 거리 기반 방법 및 오프셋 기반 방법의 세 가지 범주로 나눌 수 있습니다.
3 적용 방법
3. 1 비즈니스 이해
초기 단계에서는 비즈니스 특성을 이해하고 데이터 분석을 위한 조건과 매개변수로 단순화하는 데 중점을 두었습니다. 예를 들어 소매업의 첫 번째 단계는 고객의 구매 빈도, 구매 빈도, 각 소비 금액에 뚜렷한 연관성이 있는지 여부를 이해하는 것입니다.
3.2 데이터 분석
이 단계의 중점은 기존 데이터를 규범화하는 것이다. 많은 업계에서 분석 가능한 데이터가 위에서 언급한 분석 목표와 일치하지 않는다는 것을 알게 되었습니다. 예를 들어 소비자의 월소득 수준은 많은 구매 행위와 관련이 있을 수 있지만, 원시 데이터 축적에 반드시 사마귀 데이터가 있는 것은 아니다. 이 문제를 해결하는 방법은 다른 관련 데이터에서 추리하는 것이다. 예를 들어, 샘플링 조사를 통해 한 번에 대량의 휴지를 구매하는 고객의 월 소득 수준이 1000-3000 위안에 집중된 것으로 나타났다. 만약 이 결론이 기본적으로 성립된다면. 우리는 소비 습관에서 이번 달 소득 수준에 대한 고객의 비율을 추론할 수 있습니다. 또 샘플링 조사 방법에 따라. 설문조사를 기초로 전체 샘플 인구의 소득 수준 곡선을 추론해 내다.
3.3 데이터 준비
이 단계에서는 여러 데이터 소스에서 추출한 다음 결합하여 하나의 데이터 큐브를 형성할 수 있는 데이터 변환, 정리 및 가져오기에 중점을 둡니다. 소량의 누락된 데이터의 경우 평균으로 채우거나, 무시하거나, 기존 샘플에 따라 분산되는지 여부는 현재 단계에서 처리해야 할 문제 중 하나입니다.
3.4 모델링
이제 다양한 모델 방법을 사용할 수 있습니다. 우리가 주목해야 할 주요 문제에 가장 좋은 것을 적용하게 하라. (존 F. 케네디, 공부명언) 이 단계의 주요 임무이다. 예를 들어, 이익 예측이 회귀법을 채택할지 여부, 예측의 근거가 무엇인지 등을 예측한다. , 이러한 문제는 업계 전문가와 데이터 분석가 간의 협상이 필요합니다.
3.5 평가 및 적용
한 가지 좋은 평가 방법은 서로 다른 기간을 이용해 이미 발생한 소비를 예측할 수 있도록 한 다음 예측 결과를 실제 상황과 비교함으로써 모델을 쉽게 평가할 수 있도록 하는 것이다. 위 단계를 완료한 후 대부분의 분석 도구는 설정된 모델의 저장 및 재사용을 지원합니다. 더 중요한 것은 이 과정에서 데이터 분석 방법 및 지식은 고객의 시장 분석가 또는 의사결정권자가 이미 이해하고 있어야 한다는 것입니다. 우리는 최종 결과뿐만 아니라 그 결과를 얻을 수 있는 방법도 제공한다. 금침을 사람에게 찔러야 한다' 는 것은 TurboCRM 컨설팅 서비스와 순수 소프트웨어 제공자의 차이다.
마지막으로 소프트웨어 아키텍처에서는 분석 데이터베이스와 운영 데이터베이스를 분리하여 운영 데이터베이스의 실시간 응답 속도에 영향을 주지 않도록 해야 합니다.
4 결론
데이터 마이닝은 많은 고객을 범주로 나눌 수 있습니다. 각 범주의 고객 속성은 비슷하지만 범주별로 고객 속성이 다릅니다. 이 두 가지 유형의 고객에게 완전히 다른 서비스를 제공하여 고객 만족도를 높일 수 있습니다. 상세하고 실용적인 고객 분류는 기업의 경영 전략에 큰 도움이 된다.