의사 결정 트리는 분류와 예측을 해결할 수 있는 강력한 능력을 가지고 있다. 그것은 규칙의 형태로 표현되며, 이 규칙들은 일련의 질문으로 표현되며, 끊임없는 질문을 통해 결국 원하는 결과를 얻을 수 있다. 일반적인 의사 결정 트리에는 맨 위에 뿌리가 있고 맨 아래에는 많은 나뭇잎이 있습니다. 레코드를 하위 세트로 분할합니다. 각 하위 세트의 필드에는 간단한 규칙이 포함될 수 있습니다. 또한 의사 결정 트리는 이진 트리, 트리 또는 혼합 의사 결정 트리와 같은 다양한 모양을 가질 수 있습니다.
2. 신경망 방법
신경망 방법은 생물학적 신경계의 구조와 기능을 시뮬레이션하는 비선형 예측 모델입니다. 각 연결을 처리 단위로 간주하여 인간 뇌 뉴런의 기능을 시뮬레이션하여 분류, 클러스터링, 피쳐 마이닝 등의 다양한 데이터 마이닝 작업을 수행할 수 있습니다. 신경 네트워크의 학습 방법은 주로 가중치의 수정에 나타난다. 그 장점은 간섭 방지, 비선형 학습 및 Lenovo 기억이며 복잡한 상황에 대해 정확한 예측 결과를 얻을 수 있다는 것입니다. 단점: 우선 고차원 변수 처리에 적합하지 않고 중간 학습 과정을 관찰할 수 없습니다. 블랙박스? 성, 출력 결과도 설명하기 어렵다. 둘째, 학습 시간이 오래 걸린다. 신경망 방법은 주로 데이터 마이닝의 클러스터 기술에 사용됩니다.
3. 상호 관계 규칙 방법
상호 관계 규칙은 데이터베이스의 데이터 항목 간의 관계를 설명하는 규칙입니다. 즉, 한 트랜잭션의 일부 항목에 따라 다른 항목도 동일한 트랜잭션에 나타납니다. 즉, 데이터 간에 숨겨진 상호 관계 또는 상호 관계입니다. 고객 관계 관리에서 기업 고객 데이터베이스의 대량의 데이터를 마이닝하여 대량의 기록에서 흥미로운 관계를 발견하고 마케팅 효과에 영향을 미치는 핵심 요소를 찾아내며 제품 포지셔닝, 고객 기반 가격 및 맞춤형 구성, 고객 추구, 분석 및 유지 보수, 마케팅 및 마케팅, 마케팅 위험 평가, 사기 예측 등의 의사 결정 지원에 대한 참고 자료를 제공합니다.
4. 유전 알고리즘
유전 알고리즘은 자연 선택과 유전적 번식, 짝짓기, 유전자 돌연변이 등의 현상을 시뮬레이션했다. 진화 이론에 기반한 유전 조합, 유전자 교차 변이, 자연 선택 생성 규칙을 이용하는 기계 학습 방법이다. 그것의 기본 관점은 무엇입니까? 적자생존? 원리, 암시적 병렬 처리, 다른 모델 및 기타 속성과 쉽게 결합할 수 있습니다. 주요 장점은 여러 데이터 유형과 다양한 데이터를 병렬로 처리할 수 있다는 것입니다. 단점은 필요한 매개변수가 너무 많고 코딩이 어렵고 일반 계산이 크다는 것이다. 유전 알고리즘은 신경 네트워크를 최적화하는 데 자주 사용되며 다른 기술로 해결하기 어려운 문제를 해결할 수 있습니다.
클러스터 분석 방법
클러스터 분석은 유사성과 차이에 따라 데이터 세트를 여러 범주로 나누는 것으로, 동일한 범주에 속하는 데이터 간의 유사성을 최대한 크게 하고 서로 다른 범주의 데이터 간 유사성을 최대한 작게 만들기 위한 것입니다. 정의에 따르면 네 가지 범주로 나눌 수 있습니다: 계층 적 클러스터링 방법; 파티션 클러스터링 알고리즘 밀도 기반 클러스터링 알고리즘 그리드 클러스터링 알고리즘 일반적으로 사용되는 클래식 클러스터링 방법에는 K-mean, K-medoids, ISODATA 등이 있습니다.
6. 퍼지 집합 방법
퍼지 집합 방법은 퍼지 평가, 퍼지 결정, 퍼지 패턴 인식 및 퍼지 클러스터링 분석을 위해 퍼지 집합 이론을 사용하는 것입니다. 모호한 세트 이론은 예속도를 사용하여 모호한 사물의 속성을 묘사한다. 시스템의 복잡성이 높을수록 모호성이 강해집니다.
7. 웹 페이지 마이닝
웹 마이닝을 통해 웹의 방대한 데이터를 활용하여 정치, 경제, 정책, 기술, 금융, 다양한 시장, 경쟁 업체, 공급 및 수요 정보, 고객 등에 대한 정보를 수집할 수 있습니다. , 기업에 중대하거나 잠재적으로 중대한 영향을 미칠 수 있는 외부 환경 정보 및 내부 경영 정보를 분석 및 처리하고, 분석 결과에 따라 기업 경영 과정에서 위기를 일으킬 수 있는 다양한 문제와 전조를 찾아내며, 이를 분석하고 처리하여 식별할 수 있도록 합니다.
8. 논리적 회귀 분석
트랜잭션 데이터베이스에서 속성 값의 시간 특성을 반영하고, 데이터 항목을 실제 예측 변수에 매핑하는 함수를 생성하며, 변수 또는 속성 간의 종속성을 찾습니다. 주요 연구 문제에는 데이터 시퀀스의 추세 특성, 데이터 시퀀스 예측 및 데이터 간의 상관 관계가 포함됩니다.
9. 거친 집합 방법
데이터 감소, 데이터 관련성 발견, 데이터 의미 평가 등을 처리할 수 있는 새로운 모호함, 부정확성 및 불완전한 문제를 처리하는 수학 도구입니다. 그 장점은 알고리즘이 간단하여 처리 과정에서 데이터의 선험적 지식이 없어도 문제의 내재적 법칙을 자동으로 발견할 수 있다는 것이다. 단점은 연속 속성을 직접 처리하기 어렵기 때문에 먼저 속성을 이산화해야 한다는 것이다. 따라서 연속 속성의 이산화는 거친 집합 이론의 실용화를 제한하는 난점이다.
10, 연결 분석
관계를 바탕으로 사람, 사물, 사물, 사람, 사물과의 관계에서 상당한 응용을 개발했다. 예를 들어, 통신 서비스 업계는 링크 분석을 통해 고객이 전화를 사용하는 시기와 빈도를 수집하여 고객의 선호도가 무엇인지 추론하고 회사에 유리한 방안을 제시할 수 있습니다. 통신업계 외에도 점점 더 많은 마케팅 담당자들이 링크 분석을 사용하여 기업에 유리한 연구를 하고 있습니다.