현재 위치 - 회사기업대전 - 정보 컨설팅 - 데이터 마이닝의 기원과 개발

데이터 마이닝의 기원과 개발

데이터 마이닝이란 무엇입니까?

데이터 마이닝은 대량의 데이터에서 효과적이고 참신하며 잠재적으로 유용하며 결국 이해할 수 있는 패턴을 얻는 비범한 과정입니다. 데이터 마이닝의 광범위한 관점: 데이터 마이닝은 데이터베이스, 데이터 웨어하우스 또는 기타 저장소에 저장된 대량의 데이터에서 관심 있는 지식을 "마이닝" 하는 프로세스입니다. 데이터베이스의 지식 발견 (KDD) 이라고도 하는 데이터 마이닝은 데이터베이스의 지식 발견 프로세스의 기본 단계로 간주되는 사람들도 있습니다. 지식 발견 프로세스는 (1) 데이터 정리, (2) 데이터 통합, (3) 데이터 선택, (4) 데이터 변환, (5) 데이터 마이닝, (6) 패턴 평가 및 (7) 단계로 구성됩니다 데이터 마이닝은 사용자 또는 지식 기반과 상호 작용할 수 있습니다.

모든 정보 검색 작업이 데이터 마이닝으로 간주되는 것은 아닙니다. 예를 들어, 데이터베이스 관리 시스템을 사용하여 단일 레코드를 찾거나 인터넷의 검색 엔진을 통해 특정 웹 페이지를 찾는 것은 정보 검색 분야의 작업입니다. 이러한 작업은 매우 중요하며 복잡한 알고리즘과 데이터 구조의 사용이 관련될 수 있지만, 주로 기존 컴퓨터 과학과 기술 및 데이터의 뚜렷한 특징에 의존하여 인덱스 구조를 만들어 정보를 효과적으로 구성하고 검색합니다. 그러나 데이터 마이닝 기술은 정보 검색 시스템의 기능을 향상시키는 데도 사용됩니다.

[이 단락 편집] 데이터 마이닝의 기원

필요는 발명의 어머니이다. 최근 몇 년 동안 데이터 마이닝은 정보 산업의 큰 관심을 불러일으켰다. 주된 이유는 널리 사용할 수 있는 대량의 데이터가 있어서 유용한 정보와 지식으로 전환해야 하기 때문이다. 얻은 정보와 지식은 비즈니스 관리, 생산 관리, 시장 분석, 엔지니어링 설계, 과학 탐구 등 다양한 애플리케이션에 널리 사용될 수 있습니다.

데이터 마이닝은 (1) 통계학의 샘플링, 추정 및 가설 검증을 사용합니다. (2) 인공지능, 패턴 인식 및 기계 학습을 위한 검색 알고리즘, 모델링 기술 및 학습 이론. 데이터 마이닝은 최적화, 진화 컴퓨팅, 정보론, 신호 처리, 시각화, 정보 검색 등 다른 분야의 아이디어도 빠르게 받아들였다. 다른 분야들도 중요한 보조작용을 하고 있다. 특히 데이터베이스 시스템은 효과적인 저장, 인덱싱 및 쿼리 처리 지원을 제공해야 합니다. 고성능 (병렬) 컴퓨팅에서 파생된 기술은 대용량 데이터 세트를 처리할 때 일반적으로 중요합니다. 분산 기술은 또한 대량의 데이터를 처리하는 데 도움이 되며, 데이터를 함께 처리할 수 없을 때 더욱 중요합니다.

[이 단락 편집] 데이터 마이닝은 무엇을 할 수 있습니까?

1) 데이터 마이닝은 다음과 같은 6 가지 다른 작업 (분석 방법) 을 수행할 수 있습니다.

분류 (분류)

추정 (추정)

예측 (예측)

연관 그룹 또는 연관 규칙.

클러스터 (클러스터)

설명 및 시각화.

복잡한 데이터 유형 (텍스트, 웹, 그래픽 및 이미지, 비디오, 오디오 등) 을 발굴합니다. ) 을 참조하십시오

2) 데이터 마이닝 분류

위의 6 가지 데이터 마이닝 분석 방법은 직접 데이터 마이닝의 두 가지 범주로 나눌 수 있습니다. 간접 데이터 마이닝

직접 데이터 마이닝

목표는 사용 가능한 데이터를 사용하여 나머지 데이터와 특정 변수 (데이터베이스의 테이블 속성, 즉 열로 해석될 수 있음) 를 설명하는 모델을 만드는 것입니다.

간접 데이터 마이닝

대상에서 특정 변수를 선택하지 않고 모델로 설명됩니다. 대신 모든 변수 사이에 관계를 설정합니다.

분류, 평가, 예측은 직접 데이터 마이닝입니다. 마지막 세 가지는 간접 데이터 마이닝입니다.

3) 다양한 분석 방법에 대한 간략한 소개

분류 (분류)

먼저 데이터에서 분류된 교육 세트를 선택합니다. 이 교육 세트에서는 데이터 마이닝 분류 기술을 사용하여 분류 모델을 만들고 분류되지 않은 데이터를 분류합니다.

예:

A 신용 카드 신청자는 낮음, 중간, 고위험으로 나뉜다.

B. 사전 정의된 고객 기반에 고객 할당

참고: 클래스 수는 고정되고 미리 정의됩니다.

추정 (추정)

추정은 분류와 비슷하지만 분류는 이산 변수의 출력을 설명하고 추정은 연속 값의 출력을 처리합니다. 분류의 범주 수는 확정되고, 평가된 금액은 불확실하다.

예:

A. 구매 패턴에 따라 한 가정의 자녀 수를 추정합니다

B. 구매 모델에 따라 한 가정의 수입을 추정합니다.

C. 부동산의 가치 추정

일반적으로 평가는 분류의 이전 단계로 사용될 수 있습니다. 일부 입력 데이터는 알 수 없는 연속 변수의 값을 추정한 다음 사전 설정된 임계값에 따라 분류됩니다. 예를 들어, 가계대출 업무, 은행은 평가로 각 고객에게 점수를 매긴다 (0~ 1 점). 그런 다음 문턱에 따라 대출 등급을 분류한다.

예측 (예측)

일반적으로 예측은 분류 또는 추정을 통해 작동합니다. 즉, 모델을 분류하거나 추정하여 알 수 없는 변수를 예측하는 데 사용됩니다. 이런 의미에서 예언을 별도의 범주로 나눌 필요는 없다. 예측의 목적은 미래의 알 수 없는 변수를 예측하는 것이다. 이 예측은 검증하는 데 시간이 걸립니다. 즉, 예측의 정확성을 아는 데 시간이 걸립니다.

연관 그룹 또는 연관 규칙.

함께 무슨 일이 일어날지 결정하다.

예:

A. 슈퍼마켓의 고객은 종종 A 를 사면서 B, 즉 A =>b (연관 규칙) 를 산다.

B. 고객이 a 를 구입한 후 일정 간격으로 b (시퀀스 분석) 를 구매합니다.

클러스터 (클러스터)

합산은 레코드를 그룹화하고 유사한 레코드를 합산에 넣는 것입니다. 집계와 분류의 차이점은 집계가 미리 정의된 클래스에 종속되지 않으며 트레이닝 세트가 필요하지 않다는 것입니다.

예:

A. 특정 증상의 수집은 특정 질병을 예시할 수 있다.

B. 서로 다른 유형의 VCD 를 대여하는 고객이 모여 멤버들이 서로 다른 하위 문화 집단에 속한다는 것을 암시할 수 있다.

집계는 일반적으로 데이터 마이닝의 첫 번째 단계입니다. 예를 들어, "어떤 프로모션이 고객에게 가장 좋은 응답입니까?" " 이러한 문제의 경우 먼저 전체 고객을 모아 고객을 자체 모음으로 그룹화한 다음 각 개별 집합에 대한 질문에 답하는 것이 좋습니다.

설명 및 시각화 (설명 및 시각화)

데이터 마이닝 결과를 표현한 것입니다.

[이 세그먼트 편집] 데이터 마이닝의 연관 규칙

1. 상호 관계 규칙이란 무엇입니까?

상호 관계 규칙에 대한 세부 사항을 설명하기 전에 먼저' 기저귀와 맥주' 라는 재미있는 이야기를 살펴봅시다.

한 슈퍼마켓에서, 한 가지 재미있는 현상이 있다: 종이기저귀와 맥주가 함께 팔린다. 하지만 이 이상한 행동은 종이 기저귀와 맥주의 판매량을 증가시켰다. 이것은 농담이 아니라 미국 월마트 체인 마트에서 발생한 실제 사례로, 줄곧 상가들이 흥미진진하게 이야기하고 있다. 월마트는 세계에서 가장 큰 데이터웨어 하우스 시스템을 보유하고 있습니다. 월마트는 고객의 쇼핑 습관을 정확하게 파악하기 위해 고객의 쇼핑 행동에 대한 장바구니 분석을 하고 고객이 자주 함께 구매하는 제품을 알고 싶어 한다. 월마트의 데이터 웨어하우스에는 그 매장의 상세한 원시 거래 데이터가 집중되어 있다. 이러한 원시 거래 데이터를 바탕으로 월마트는 데이터 마이닝 방법을 사용하여 이러한 데이터를 분석하고 발굴합니다. 한 가지 뜻밖의 발견은' 종이 기저귀로 가장 많이 구매하는 제품은 맥주다!' 입니다. " 대량의 실제 조사 분석을 통해' 기저귀와 맥주' 뒤에 숨어 있는 미국인의 행동 패턴이 드러났다. 미국에서는 일부 젊은 아버지들이 퇴근 후 마트에 가서 아기 기저귀를 사는 경우가 많은데, 그 중 30 ~ 40% 는 맥주를 사주기도 한다. 이런 현상을 초래한 이유는 미국의 아내가 퇴근 후 아이에게 기저귀를 사 달라고 남편에게 자주 알려주기 때문이다. 남편이 기저귀를 사면 자신이 좋아하는 맥주를 가져다 주기 때문이다.

통상적인 사고에 따르면 종이 기저귀는 맥주와 무관하다. 데이터 마이닝 기술을 사용하지 않고 대량의 거래 데이터를 발굴하지 않으면 월마트는 데이터 내부의 이런 가치 있는 법칙을 발견할 수 없다.

데이터 연관은 데이터베이스에서 중요한 발견 지식입니다. 두 개 이상의 변수 값 사이에 일정한 규칙성이 있는 경우 관련성이라고 합니다. 종속성은 단순 종속성, 시계열 종속성 및 인과 종속성으로 나눌 수 있습니다. 관계형 분석의 목적은 데이터베이스에서 숨겨진 관계형 네트워크를 찾는 것입니다. 때때로 우리는 데이터베이스의 데이터에 대한 연관 함수를 알지 못하고, 알고 있어도 불확실하기 때문에, 연관 분석에 의해 생성된 규칙은 믿을 만하다. 연결 규칙 마이닝은 대량의 데이터에서 항목 세트 간의 흥미로운 연결 또는 관련 관계를 찾습니다. 아그라발은 1993 과 같습니다. 먼저 고객 거래 데이터베이스의 항목 세트 간 연관 규칙을 마이닝하는 문제를 제기했습니다. 나중에 많은 연구자들이 연관 규칙 발굴에 대해 많은 연구를 했다. 이들의 업무는 랜덤 샘플링 및 병렬 아이디어 도입과 같은 기존 알고리즘을 최적화하여 알고리즘 마이닝 규칙의 효율성을 높이는 것입니다. 연관 규칙의 적용을 촉진합니다. 연관 규칙 마이닝은 데이터 마이닝의 중요한 과제로, 최근 몇 년 동안 업계에서 광범위하게 연구되었다.

연관 규칙 마이닝 프로세스, 분류 및 관련 알고리즘.

2. 1 상호 관계 규칙 마이닝 프로세스

상호 관계 규칙을 마이닝하는 프로세스는 주로 두 단계로 구성됩니다. 첫 번째 단계는 데이터 세트에서 모든 고주파 항목 세트를 찾아야 하고, 두 번째 단계는 이러한 고주파 항목 세트에서 상호 관계 규칙을 생성해야 합니다.

상호 관계 규칙 마이닝의 첫 번째 단계에서는 원본 데이터 세트에서 모든 큰 항목 세트를 찾아야 합니다. 고주파수는 한 프로젝트 그룹이 모든 레코드에 대해 일정한 수준에 도달해야 한다는 것을 의미합니다. 프로젝트 그룹이 나타나는 빈도를 지원이라고 합니다. 두 개의 프로젝트 A 와 B 가 포함된 2- 항목 세트의 경우 공식 (1) 을 통해 {A, B} 가 포함된 프로젝트 그룹의 지원을 받을 수 있습니다. 지지도가 설정된 최소 지지도 임계값보다 크거나 같으면 {A, B} 를 고주파 프로젝트 그룹이라고 합니다. 최소 지지도를 만족하는 k- 항목 세트를 빈번한 k- 항목 세트라고 하며, 일반적으로 큰 K 또는 빈번한 K 로 표시되며, 알고리즘은 더 이상 고주파 프로젝트 그룹을 찾을 수 없을 때까지 큰 k+ 1 에서 큰 K+1을 생성합니다.

상호 관계 규칙 마이닝의 두 번째 단계는 상호 관계 규칙을 생성하는 것입니다. 고주파 항목 그룹에서 연관 규칙을 생성하는 것은 이전 단계의 고주파 K 항목 그룹을 사용하여 규칙을 생성하는 것입니다. 최소 신뢰도에 대한 조건 임계값에서 규칙의 신뢰도가 최소 신뢰도를 충족하는 경우 이 규칙을 상호 관계 규칙이라고 합니다. 예를 들어 고주파 K 항목 그룹 {A, B} 에 의해 생성된 규칙 AB 의 신뢰도는 공식 (2) 을 통해 얻을 수 있습니다. 신뢰도가 최소 신뢰도보다 크거나 같으면 AB 를 상호 관계 규칙이라고 합니다.

Vuormaa 의 경우 상호 관계 규칙 마이닝 기술을 사용하여 트랜잭션 데이터베이스의 레코드를 마이닝하려면 먼저 최소 지원 및 최소 신뢰 두 개의 임계값을 설정해야 합니다. 최소 지원 정도 min_support=5%, 최소 신뢰 min_confidence=70% 라고 가정합니다. 따라서 이 슈퍼마켓의 수요에 부합하는 연관 규칙은 위의 두 가지 조건을 모두 충족해야 한다. 발굴 과정을 통해 발견된 연관 규칙' 기저귀, 맥주' 가 다음 조건을 충족하면 기저귀, 맥주에 대한 연관 규칙이 적용됩니다. 지원 (기저귀, 맥주) 은 공식 >: =5%, 자신감 (기저귀, 맥주) > =70% 로 묘사할 수 있다. 이 중 지원 (종이 기저귀, 맥주) >: 이 응용 사례에서 =5% 의 중요도는 모든 거래 기록의 최소 5% 가 종이 기저귀와 맥주를 동시에 구입했다는 것을 보여준다. 이 응용 사례에서 신뢰도 (기저귀, 맥주) > =70% 는 기저귀를 포함한 모든 거래 기록의 최소 70% 가 동시에 맥주를 구매한다는 의미입니다. 이에 따라 소비자들이 앞으로 기저귀를 구입하면 슈퍼마켓은 이 소비자들에게 맥주 구입을 동시에 추천할 수 있게 된다. 이런 상품 추천 행위는' 종이기저귀, 맥주' 연관 규칙에 근거한다. 슈퍼마켓의 과거 거래 기록은' 종이기저귀를 구입하는 대부분의 거래는 맥주를 동시에 구매한다' 는 소비 행위를 지원하기 때문이다.

위의 설명에서 알 수 있듯이 상호 관계 규칙 마이닝은 일반적으로 레코드의 지표가 불연속 값을 취하는 경우에 더 적합합니다. 원본 데이터베이스의 인덱스 값이 연속 데이터인 경우 상호 관계 규칙을 마이닝하기 전에 데이터를 적절히 불연속화해야 합니다 (실제 간격 값은 값에 해당). 데이터의 이산화는 데이터 마이닝 전의 중요한 부분이며, 이산화 프로세스가 합리적인지 여부는 상호 관계 규칙의 마이닝 결과에 직접적인 영향을 미칩니다.

2.2 상호 관계 규칙의 분류

상황에 따라 상호 관계 규칙은 다음과 같이 분류할 수 있습니다.

1. 상호 관계 규칙은 규칙에서 변수를 처리하는 범주에 따라 부울 및 숫자 값으로 나눌 수 있습니다.

부울 연관 규칙에서 처리하는 값은 불연속적이고 분류되며 이러한 변수 간의 관계를 보여 줍니다. 숫자 상호 관계 규칙은 다차원 상호 관계 규칙 또는 다중 계층 상호 관계 규칙과 결합하여 숫자 필드를 처리하고 동적으로 분할하거나 원시 데이터를 직접 처리할 수 있습니다. 물론 숫자 연관 규칙에는 범주 변수도 포함될 수 있습니다. 예: gender = "female" => 직업 = "비서", 부울 상호 관계 규칙입니다. Gender = "female" = & gtavg (income) = 2300, 관련 수익은 숫자 값이므로 숫자 연관 규칙입니다.

2. 규칙의 데이터 추상화 계층에 따라 단일 레벨 상호 관계 규칙과 복수 레벨 상호 관계 규칙으로 나눌 수 있습니다.

단일 레벨 연관 규칙에서 모든 변수는 실제 데이터의 다양한 계층을 고려하지 않습니다. 다중 레이어 연관 규칙에서 데이터의 다중 레이어 특성이 충분히 고려되었습니다. 예: IBM 데스크탑 => 소니 프린터는 상세 데이터에 대한 단일 레이어 연관 규칙입니다. Desktop => Sony 프린터는 상위 수준과 세부 수준 사이의 다중 레이어 연결 규칙입니다.

3. 규칙과 관련된 데이터의 차원에 따라 연결 규칙은 1 차원 및 다차원으로 나눌 수 있습니다.

1 차원 연관 규칙에서, 우리는 사용자가 구매한 물품과 같은 한 차원의 데이터만 다루고 있습니다. 다차원 연결 규칙에서 처리할 데이터에는 여러 차원이 포함됩니다. 즉, 1 차원 연관 규칙은 단일 속성의 일부 관계를 처리합니다. 다차원 상호 관계 규칙은 다양한 속성 간의 일부 관계를 처리합니다. 예: 맥주 => 기저귀, 이 규칙은 사용자가 구매한 물품에만 적용됩니다. Gender = "female" => 직업 = "비서", 이 규칙은 두 영역에 대한 정보를 포함하며 2 차원 상호 관계 규칙입니다.

2.3 연관 규칙 마이닝 알고리즘

1.Apriori 알고리즘: 후보 세트를 사용하여 빈번 항목 세트를 검색합니다.

Apriori 알고리즘은 부울 연관 규칙 빈번 항목 집합을 마이닝하는 가장 영향력 있는 알고리즘입니다. 핵심은 2 단계 주파수 세트 사상을 기반으로 하는 재귀 알고리즘입니다. 이 상호 관계 규칙은 분류에서 단일 차원, 단일 레벨, 부울 상호 관계 규칙에 속합니다. 여기서 최소 지지도보다 큰 모든 항목 세트를 빈번 항목 세트 (주파수 세트라고 함) 라고 합니다.

알고리즘의 기본 아이디어는 먼저 미리 정의된 최소 지원 정도와 동일한 빈도로 모든 주파수 세트를 찾는 것입니다. 그런 다음 빈도 세트에서 최소 지원 및 최소 신뢰도를 충족해야 하는 강력한 상호 관계 규칙을 생성합니다. 그런 다음 1 찾은 빈도 세트를 사용하여 원하는 규칙을 생성하고, 집합 항목만 포함된 모든 규칙을 생성합니다. 각 규칙의 오른쪽 절반에는 중간 규칙의 정의가 적용됩니다. 이러한 규칙이 생성되면 사용자가 지정한 최소 신뢰도보다 큰 규칙만 남습니다. 모든 주파수 세트를 생성하려면 재귀 방법을 사용합니다.

많은 후보 세트가 있을 수 있으며 데이터베이스를 반복적으로 스캔해야 할 수도 있습니다. 이는 Apriori 알고리즘의 두 가지 주요 단점입니다.

2. 분할 기반 알고리즘

Savasere 등은 분할 기반 알고리즘을 설계했다. 이 알고리즘은 먼저 데이터베이스를 여러 개의 교차하지 않는 블록으로 논리적으로 분할하고, 한 번에 하나의 블록을 개별적으로 고려하고, 모든 빈도 세트를 생성합니다. 그런 다음 생성된 빈도 세트를 생성하고 가능한 모든 빈도 세트를 생성하고, 마지막으로 이러한 항목 세트에 대한 지원을 계산합니다. 여기서 각 블록의 크기를 선택하여 각 블록을 주 스토리지에 배치하고 각 단계에서 한 번만 스캔하면 됩니다. 가능한 각 주파수 세트는 하나 이상의 블록에 있는 주파수 세트이며, 이 사실은 알고리즘의 정확성을 보장합니다. 이 알고리즘은 매우 병렬로 작동할 수 있으며 각 블록을 프로세서에 할당하여 주파수 세트를 생성할 수 있습니다. 주파수 세트의 각 주기가 생성된 후 프로세서는 서로 통신하여 글로벌 후보 K 항목 세트를 생성합니다. 일반적으로 통신 프로세스는 알고리즘 실행 시간의 주요 병목입니다. 반면, 각 독립 프로세서가 주파수 세트를 생성하는 시간도 병목 현상입니다.

3 FP-트리 주파수 세트 알고리즘

Apriori 알고리즘의 고유 결함에 대해 J. Han 등은 후보 마이닝 빈번 항목 집합을 생성하지 않는 방법, 즉 FP- tree 주파수 집합 알고리즘을 제안했다. 분열과 통치의 전략을 취하다. 첫 번째 스캔 후 데이터베이스의 주파수 세트는 자주 패턴 트리 (FP-tree) 로 압축되고 관련 정보는 그대로 유지됩니다. 그런 다음 FP-tree 를 각각 길이가 1 인 빈도 세트와 관련된 여러 조건 기준으로 나눈 다음 이러한 조건 기준을 개별적으로 마이닝합니다. 원시 데이터의 양이 많은 경우 분할 방법과 함께 FP-tree 를 주 스토리지에 저장할 수 있습니다. 실험에 따르면 FP-growth 는 길이가 다른 규칙에 대해 적응성이 뛰어나며 Apriori 알고리즘보다 효율성이 크게 향상되었다.

3. 국내외 이 분야의 응용

3. 1 국내외 연관 규칙 마이닝 기술 적용

현재 상호 관계 규칙 마이닝 기술은 서구 금융 기업에 널리 사용되고 있으며 은행 고객의 수요를 성공적으로 예측할 수 있습니다. 일단 이 정보를 얻으면 은행은 그들의 마케팅을 개선할 수 있다. 현재 은행은 매일 고객과 소통하는 새로운 방식을 개발하고 있다. 각 은행은 고객이 관심을 가질 수 있는 본업 제품 정보를 자신의 ATM 기계에 묶어 사용자가 이해할 수 있도록 합니다. 데이터베이스에 높은 신용 한도를 가진 고객이 주소를 변경했다고 표시되면 이 고객이 최근 더 큰 집을 샀을 가능성이 높기 때문에 더 높은 신용 한도, 새로운 고급 신용 카드 또는 주택 개선 대출이 필요할 수 있습니다. 이 제품들은 신용카드 계산서를 통해 고객에게 우편으로 보낼 수 있다. 고객이 문의를 할 때 데이터베이스는 텔레세일즈 담당자를 효과적으로 도울 수 있다. 영업 담당자의 컴퓨터 화면에는 고객의 특성과 고객이 어떤 제품에 관심이 있는지 표시할 수 있습니다.

동시에, 몇몇 유명한 전자 상거래 사이트들도 강력한 연관 규칙 마이닝의 혜택을 받는다. 이러한 온라인 쇼핑 사이트는 상호 관계 규칙의 규칙을 사용하여 마이닝한 다음 사용자가 함께 구매할 번들을 설정합니다. 일부 쇼핑 사이트는 이를 이용해 교차 판매를 하는 경우도 있다. 즉, 한 제품을 구매하는 고객은 다른 관련 제품의 광고를 볼 수 있다.

그러나 현재 중국에서는' 데이터 대량, 정보 부족' 이 상업은행이 데이터 집중 이후 보편적으로 직면하고 있는 난처함이다. 현재 금융업계에서 구현되고 있는 대부분의 데이터베이스는 데이터 입력, 조회, 통계 등의 기본 기능만 실현할 수 있으며, 데이터에서 다양한 유용한 정보를 찾을 수 없습니다. 예를 들어, 이러한 데이터를 분석하고, 데이터 패턴과 특징을 발견하고, 고객, 소비자 그룹 또는 조직의 금융 및 상업적 이익을 발견하고, 금융 시장의 변화 추세를 관찰할 수 있습니다. 국내에서 연관 규칙 발굴 기술에 대한 연구와 응용은 아직 광범위하고 깊지 않다고 할 수 있다.

3.2 최근 몇 년간 연관 규칙 마이닝 기술에 대한 연구

많은 응용 문제가 슈퍼마켓 구매 문제보다 더 복잡하기 때문에 많은 연구가 서로 다른 각도에서 상호 관계 규칙을 확장하고 상호 관계 규칙 마이닝 방법에 더 많은 요소를 통합하여 상호 관계 규칙의 적용 영역을 풍부하게하고 관리 의사 결정을 지원하는 범위를 넓힙니다. 예를 들어 속성 간의 계층 관계, 시제 관계, 다중 테이블 마이닝 등을 고려합니다. 최근 몇 년 동안 상호 관계 규칙에 대한 연구는 주로 두 가지 측면에 초점을 맞추고 있습니다. 즉, 고전적인 상호 관계 규칙을 확장하면 문제의 범위를 해결하고 고전적인 상호 관계 규칙 마이닝 알고리즘의 효율성과 흥미를 높일 수 있습니다.

저는 바이두입니다. 이 사이트를 참고할 수 있어요.

행운을 빕니다

copyright 2024회사기업대전