58 부족 다양성 알고리즘의 실천과 사고

독서를 지도하다

이 문서에서는 "권장 시스템의 개별 다양성 최적화" 라는 주제를 명확하게 파악한 후 전체 아키텍처에서 리콜, 규칙 및 다양성 계층의 최적화 세부 사항을 명확하게 설명합니다. MMR 및 DPP 알고리즘에는 원리와 실천이 모두 있습니다. 마지막으로 차트를 통해 효과 비교를 보여주고 자신의 비즈니스 특성에 따라 용도에 맞는 거리 설계를 수행합니다.

배경

추천 시스템에서 다양성은 관련성뿐만 아니라 시스템의 좋고 나쁨을 측정하는 중요한 지표 중 하나이다. 그러나 다양성과 관련성 사이에는 종종 모순이 있다. 비즈니스 지표의 관점에서 다양성과 관련성을 가늠할 수 있는 사고 방법을 살펴보고 다양성 알고리즘의 실용적인 방안을 소개하며, 결국 다양성 수단을 통해 비즈니스 지표를 개선하는 목적을 달성했습니다. (윌리엄 셰익스피어, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성)

1. 다양성 알고리즘의 의미와 어려움

추천 시스템에서 정확도는 항상 시스템의 좋고 나쁨을 측정하는 가장 중요한 지표였으며, 대부분의 업무는 정확도를 높이는 방법을 연구하고 있다. 그러나 권장 결과의 품질은 여러 차원으로 측정됩니다. 정확도에 기반한 추천은 사용자의 경험과 만족도를 높이는 것이 아니라 정보 고치의 출현을 촉진하는 것으로 나타났다. 따라서 정확도와 다양성의 균형을 조정하고 최적화하여 비즈니스의 전체 데이터 지표를 향상시키는 방법은 추천 시스템의 또 다른 최적화 방향이 되었습니다.

실제로 다양성 알고리즘의 몇 가지 문제점을 요약했습니다.

1) 모델의 최적화 목표는 모호합니다.

우리 모두 알고 있듯이, 다양한 사용자 행동 (클릭, 변환, 체류, 공유 등) 이 있습니다. ) 를 정밀도 최적화의 목표로 사용할 수 있습니다. 사용자 동작을 모형의 목표 레이블로 명확하게 수집하여 모형을 설계하고 최적화할 수 있습니다. 다양성 자체가 집합 통계이기 때문에 직접 사용자 동작을 모델 최적화의 목표로 찾기가 어렵습니다.

2) 운영 지표와 다양성 지표 간의 충돌

비즈니스 관심 지표 (변환율, 체류 시간 등). ) 및 다양성 지표는 단순한 양수 또는 음수가 아닙니다. 단순히 다양성 지수를 높이기 위해 다양성을 하면 최종 결과가 비즈니스 목표와 편향되어 권장 품질을 낮출 수 있다.

요약하자면, 58 부락 추천 시스템의 다양성 실천에서 우리는 단순히 다양성 지표를 평가 알고리즘으로 사용하는 방법을 배제했다. 부족의 비즈니스 특성과 결합하여 Dell 은 다양성을 비즈니스 지표를 향상시키는 수단으로 삼아 여러 비즈니스 지표와 다양성 지표를 통해 알고리즘의 효과를 종합적으로 평가하여 결국 두 지표가 함께 향상되는 목적을 달성하여 사용자 경험을 높이는 것을 목표로 하고 있습니다.

58 부족 다양성 알고리즘 실습

다이버시티 알고리즘 연구에서 다이버시티는 일반적으로 두 가지 유형으로 나뉩니다.

개인 사용자의 다양성에 따라 단일 사용자에게 유사한 상품을 추천하지 않도록 설계되어 사용자 환경을 개선하고 사용자 만족도를 높입니다.

모든 사용자의 다양성을 바탕으로 롱테일 상품의 배포 효과를 최적화하도록 설계되었습니다.

이 단계의 주요 목표는 개인 사용자 경험이기 때문에 개별 사용자의 다양성을 실천 방향으로 선택합니다.

1. 권장 시스템 맵

추천 시스템의 온라인 계층 다이어그램

추천 데이터의 다양성을 보장하기 위해 다음 세 곳에서 최적화했습니다.

1) 리콜 계층: 데이터 소스에서 다양한 후보 세트를 제공하여 거친 후보 풀의 주제, 범주, 작성자의 적용 범위를 높여 데이터 소스의 다양성을 보장합니다.

2) 규칙 계층: 관련성 손실이 적은 경우 미세 정렬 후보 풀의 주제 및 범주 적용 범위를 늘려 미세 정렬 풀에 들어가는 데이터의 다양성을 보장합니다.

3)? 다양성 계층: 데이터를 통일하고 다양화하여 데이터 출력의 다양성을 보장합니다.

데이터는 효과의 상한선을 결정하는데, 알고리즘은 단지 이 상한선에 접근할 뿐이다. 다양성 계층에서 가능한 한 세밀하게 정렬된 데이터 다양성만 보장합니다. 결과 수정 라인 후보 풀의 데이터 다양성의 영향으로 리콜 계층의 데이터 소스에서 후보 세트의 다양성을 유지할 수 있다면 더 좋을 것이다.

2. 데이터 소스의 다양 화

2. 1 리콜 계층의 다양한 구현

추억 계층 구조도

리콜 단계에서 우리는 다 채널 리콜을 채택했다. 데이터의 다양성을 보장하기 위해 다음과 같은 다양한 리콜 정책을 추가하여 데이터 소스를 풍부하게 합니다.

다양성 알고리즘을 통해 사용자 개인화, 다양한 주제, 범주 및 저자가 리콜할 수 있도록 하여 리콜이 다양성과 관련성을 모두 고려하도록 합니다.

긴 꼬리, 시간, 깜짝 추억을 통해 데이터의 참신함과 다양성을 높인다.

관계 및 속성을 기반으로 한 협업 리콜 분기를 통해 데이터의 다양성을 높였습니다.

다양성과 참신한 리콜을 늘림으로써 거친 후보 풀의 데이터 커버율은 약 120%, 범주 기반 커버리지는 약 100% 증가했습니다.

2.2 규칙 계층의 다양 화 실현

규칙 계층 구조 다이어그램

권장되는 데이터는 다양한 이기종 엔티티이므로 가는 라인 (규칙 레벨) 에 들어가기 전에 유형을 버킷으로 처리합니다. 각 유형은 굵은 줄에서 가는 줄에 이르는 데이터 차단 단계를 거칩니다. 주요 차단 지표는 일반적으로 굵은 행과 관련된 점수입니다. 리콜 레이어의 데이터 소스에 대한 다양성 최적화를 차단하기 위해 먼저 이러한 굵직한 결과를 범주별로 배럴로 나눈 다음 다양성을 제어합니다. 마지막으로, 다양한 유형의 축척을 조정하고, 데이터를 보완하고, 필요한 필터링을 한다. 관련성이 크지 않은 경우 가는 데이터의 다양성을 높입니다.

규칙 레이어 다양성 알고리즘은 유형별로 분할되므로 다양한 이기종 유형의 엔티티 혼합 배열의 영향을 받지 않고 다양한 다양성 알고리즘에 적용됩니다.

규칙 계층에 다양성 알고리즘의 개입을 포함시킨 후 후보 풀의 데이터를 세밀하게 정렬하는 범위는 주제에 따라 약 80%, 범주에 따라 약 70% 증가했습니다. -응?

일반 레이어에 다양성을 추가한 후 online CTR 및 uvctr 의 변환 효과는 다음 그림과 같습니다.

규칙 계층 알고리즘의 효과 비교

위의 그림에서 볼 수 있듯이, 각 알고리즘은 차이가 크지 않고 성능이 약간 뛰어나다. 일반적으로 알고리즘은 약간 더 잘 실행됩니다. 규칙 계층은 주로 이전 휴리스틱 규칙 대신 다양성 알고리즘을 사용하여 데이터 소스의 다양성을 자동화합니다.

3. 재정렬 방법에 기반한 다양한 레이어

알고리즘 매개변수 조정의 경우 세 가지 업무 지표를 주로 참조합니다.

Pvctr 은 PV 클릭률을 나타냅니다. Uvctr 은 uv 클릭률을 나타냅니다. Avgpv 는 1 인당 관람 횟수를 나타냅니다.

다양성 알고리즘을 적용하는 장면의 경우 binomal, EE, DPP, XQUAD, PM2, Bayes 및 MMR 과 같은 일반 다양성 알고리즘이 규칙 레이어의 단일 유형에서 사용되지만 58 개 부족이 다양성과 이질성을 가지고 있기 때문에 일반적인 알고리즘은 다양성 레이어의 다양한 이기종 유형 엔티티에 적합하지 않습니다.

3. 1 다이버시티 맵

다양성 계층 구조 맵

편폭, 업무 포트폴리오의 중요성, 시효성 등으로 제한되며, 다음은 MMR 과 DPP 의 엔지니어링 실무에서의 응용에 초점을 맞추고 있습니다.

3.2MMR? 의 원칙

MMR 원리의 전체 이름은 MaximalMarginal Relevance 로 중복성을 줄이고 관련성을 보장하는 욕심 많은 정렬 알고리즘입니다. 추천 시나리오에서는 추천 결과의 다양성을 보장하면서 관련 제품을 사용자에게 추천할 수 있습니다. 공식:

S 는 선택한 문서의 정렬된 집합이며 일반적으로 관련 정렬의 결과입니다.

R 은 다음 후보 문서를 나타냅니다.

Di 는 다음 후보 문서를 나타냅니다.

Dj 는 s 의 문서를 나타냅니다.

Sim 함수: 유사성과 같은 유사성 측정 함수입니다.

후보 문서와 질의 문서 간의 상관 관계를 나타냅니다.

문서와 기존 문서 간의 최대 유사성을 나타냅니다.

-응? 가중치 계수, 권장 결과의 관련성과 다양성을 조정합니다.

욕심 많은 알고리즘으로서 각 계산 공식에서 가장 큰 값이며, 정렬된 결과 세트에 배치되고, 후보 세트에서 선택한 항목을 제거하고, 매개 변수를 갱신한 다음 결과 세트의 데이터가 요구 사항을 충족하거나 선택할 데이터가 없을 때까지 다음 라운드에서 계속 선택합니다.

구현 프로세스

Mmmr 알고리즘 흐름도

실험 효과

MMR 매개 변수 효과 비교 차트

알고리즘 흐름을 통일하기 위해 우리는 원래 논문에서 공식의 합을 바꾸었다. 같은 그림에서 몇 개의 지표를 비교하기 위해 그림의 및 는 어느 정도 확대 및 축소되었습니다. 그림에서 볼 수 있듯이 다양성 매개변수는 점차 조정되고, 점차 낮아지고, 당시의 최고점에 도달한다. 작을수록 결과가 더 관련성이 높아지기 때문이다. (마하트마 간디, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성, 다양성) 또한 1 인당 관람 횟수가 꾸준히 상승하면서 다양성이 증가함에 따라 일부 사람들이 클릭하게 되고, 더 많은 내용을 훑어보며, 집에서는 가장 효과적이며, 집에서는 가장 높은 지점에 도달한다는 것을 보여준다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 가족명언)

-응? 공사 실현 문제

거리를 계산할 때 현재 문서와 선택한 문서 간의 평균 거리를 실현하여 최대 거리를 사용하여 권장 결과에 있는 후속 문서 간의 높은 유사성을 방지합니다.

문장 간 유사성 함수의 정의는 텍스트에 언급된 유사성을 기준으로 할 수 있습니다. 그러나 이를 위해서는 후보 목록 사이에 균일한 항목 벡터가 있어야 벡터가 임의로 쌍을 이루도록 할 수 있습니다. 많은 유형의 권장 결과가 있고 이질적이기 때문에 이 경우 유사성은 잘 해석되지 않습니다. Dell 의 접근 방식은 맞춤형 거리로 비즈니스를 결합하는 것입니다. 아래에 자세히 설명되어 있습니다.

3.3 DPP 의 원칙

행열식 점 프로세스의 전체 이름은 이산 점 세트의 전력 세트에 정의된 확률 분포입니다. 임의 샘플링의 하위 집합이며, 어느 것이든 있습니다.

공식에서 변수의 의미:

Y? 결정 요인 포인트 프로세스의 무작위 샘플링으로 얻은 무작위 하위 집합;

Y 의 하위 세트입니다.

히트 샘플의 모든 요소에 대한 확률을 나타냅니다.

-응? K 는 실제 대칭 방진, 일명 핵 행렬, 각 원소입니까? 컬렉션의 첫 번째 요소 간의 유사성으로 간주할 수 있으며 샘플링 확률에 반비례합니다. 물품과 사용자의 관련성으로 볼 수 있으며 샘플링 확률에 비례합니다.

카? K 의 주요 공식이고, 순서는 그 안에 있는 요소의 수입니다.

다음 그림은 점 결정 과정을 시각적으로 보여줍니다.

결정 점 프로세스 다이어그램

프로젝트 I 와 j 가 동시에 샘플링될 확률을 나타냅니다. 공식에서 볼 수 있듯이 유사한 항목이 많을수록 동시에 샘플링될 확률이 적다.

이 알고리즘의 아이디어는 순서 변경 문제를 하위 집합 선택 문제로 간주하는 것입니다. 목표는 원본 데이터 세트에서 고품질이지만 다양한 하위 집합을 선택하고 DPP 를 통해 고품질과 다양성 간의 균형을 유지하는 것입니다. DPP 는 행렬식을 통해 복잡한 확률 계산을 단순화하는 고성능 확률 모델입니다. DPP 는 또한 하나의 샘플링 프로세스로 해석될 수 있으며, 두 요소가 하위 세트로 추출될 확률은 단일 요소가 추출될 확률과 두 요소 간의 유사성과 관련이 있습니다.

DDP 구현 시나리오

-응? 첫 번째는 구글이 제안한 윈도우 기반 재정렬 체계입니다. 이 기사에서 언급 된 핵 매트릭스 구축 프로그램은 다음과 같습니다.

Dij 는 프로젝트 I 와 J 사이의 거리를 나타내며 자유 변수입니다. A= 1 이면 표준 RBF 코어와 같습니다. 언제 ...

행렬의 비스듬한 대각선이 축소되어 기본적으로 모든 항목을 다양화하는 것에 해당한다. A> 1, 행렬의 대각선이 비례적으로 확대되면 모든 항목을 더 비슷하게 만드는 역효과를 냅니다.

컬렉션이 증가함에 따라 작은 컬렉션의 확률이 증가하고 큰 컬렉션의 확률이 감소합니다. 하나의> 가 1 에 있기 때문에 L 은 비정규일 수 있습니다. 핵 행렬이 매번 반정임을 보장하기 위해 이 문서는 핵 행렬을 매핑하고 L 의 피쳐 분해를 계산하고 임의의 음수 피쳐 값 대신 0 을 사용합니다.

또한 깊이 Gram 코어 매트릭스에 기반한 심도 있는 학습 모델 최적화 방법을 제시하여 그리드 검색 매개변수의 복잡성을 줄입니다.

두 번째는 펜실베이니아 대학이 제공하는 방안으로 DDP 의 최대 후험 추정의 일반 솔루션이지만, 각 항목마다 계산을 통해 핵 매트릭스를 재구성해야 하며 지연은 낙관적이지 않다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 과학명언)

셋째, 부족 호랑이 동영상이 제시한 가장 큰 후험 추론 솔루션. 전통적인 지도의 시간 복잡도가 높은 문제에 대해 개선된 빠른 해결을 위한 탐욕 알고리즘이 제시되었습니다.

공사로?

매핑된 하위 모듈 함수는 하위 모듈 함수 최대화 문제로 변환됩니다. 욕심 많은 알고리즘을 사용하여 하위 모드 함수 극대화로 인한 NP 난문제를 해결합니다.

곱을 한 번에 하나씩 선택하여 결과 세트 Yg 에 추가하면 Yg 는 조건이 충족될 때까지 빈 세트로 초기화됩니다. 곱은 다음 등식을 충족해야 합니다.

계산 행렬식의 복잡성이 높기 때문에 이 문서는 이를 Cholesky 로 분해하고, 초기화를 null 로 하여 일부 열 변환을 통해 얻을 수 있습니다.

저자는 또한 증분 업데이트를 제안하고 파생을 통해 최종 증분 업데이트 공식을 얻습니다 (특정 파생 프로세스는 원본 논문을 참조함).

우리는 세 가지 방안을 달성했는데, 두 번째 방안은 지연이 커서 온라인에 적용할 수 없다. 첫 번째 시나리오에서 구현하는 간단한 모드는 세 번째 시나리오보다 지연이 큰 결정 요인을 직접 계산하는 것입니다. 시나리오 3 은 핵 매트릭스 수정 없이 정렬 결과가 예상보다 작을 수 있습니다. 실제 응용 프로그램에서는 데이터 양과 효율성의 요구 사항을 결합하여 Hulu 가 제안한 세 번째 구현 시나리오를 선택했습니다.

DPP 구축 프로세스

DPP 알고리즘 흐름도

실험 효과

DPP 매개 변수 변경 맵

여러 지표가 같은 그림에서 서로 비교되도록 pvctr 과 avgpv 모두 어느 정도 확대 축소되었다. 위 그림에서 볼 수 있듯이 다이버시티 매개변수를 점진적으로 조정하면 pvctr 이 점점 커지고 0.7 정도에서 가장 높습니다. Uvtr 과 1 인당 관람 횟수가 꾸준히 상승하면서 다양성이 늘어남에 따라 클릭하지 않는 사람들이 끌리며 더 많은 내용을 찾아볼 수 있다는 것을 보여준다. 그리고 Uvtr 은 0.7 에서 최고치를 기록했습니다. 0.7 이 가장 효과적입니다. DDP 각 곡선의 마지막 매개변수 값은 0.999 에서 핵 매트릭스를 구성할 때 A 의 값이 커지기 때문에 매우 낮습니다. 지수가 변한 후 많은 핵 행렬이 최대값을 가지고 있어서 행렬이 만족스럽지 못하다. 소량의 데이터만 반환됩니다. 예외적인 상황입니다. 모든 지표가 떨어지고 있습니다. 이는 알고리즘 디버깅 중에 피해야 할 사항입니다.

공사 실현 문제

구현에서는 현재 시도중인 비교적 효율적인 라이브러리인 효율적인 오픈 소스 Java 매트릭스 컴퓨팅 라이브러리인 EJML 을 주로 사용합니다.

엔지니어링 구현에서는 주요 참고 문헌에 언급된 사용을 참조합니다.

Exp(αr_u)

Ru 대신 다이버시티와 상관 관계를 조정하여

α=θ/((2( 1-θ)))

이 글에서 언급한 반양성 보증은 수정할 수 있다.

S_ij=( 1+? F_i, f_j? ) /2

우리의 응용 프로그램에서는 영향이 크지 않다. 주로 우리의 유사성 매트릭스가 사용자 정의되기 때문이다.

DPP 의 주요 최적화 지점은 효율성입니다. Dell 은 타이거 비디오의 최적화 방안을 채택하여 행렬식을 거치지 않고 전체 100 항목의 순서 변경 프로세스의 평균 지연은 4 ms 에 불과합니다.

핵심 매트릭스의 구축은 사용자 정의 거리, 보다 설명적이고 비즈니스와 밀접하게 결합될 수 있는 사용자 정의 거리가 필요하기 때문에 유사성 매트릭스와 핵심 매트릭스도 사용자 정의됩니다.

전체 목록을 창별로 일괄 정렬합니다. 하위 모듈 함수의 특성에 따라 작은 데이터 세트는 큰 데이터 세트보다 배타적이며 창 효과가 더 좋습니다.

DPP 매개 변수 조정의 경우 먼저 사용자 정의 거리 매개 변수를 고정하여 적절한 거리 매개 변수를 찾은 다음 고정 및 거리 매개 변수를 순환하고 그리드 검색을 통해 매개 변수를 최적화합니다.

-응? 핵 매트릭스가 만족스럽지 않기 때문에 반환된 데이터의 양이 예상보다 적을 수 있으며 업무에 큰 영향을 주지 않고 정상적으로 사용할 수 있습니다. 반환된 데이터의 양에 대한 엄격한 요구 사항이 있는 경우 핵 매트릭스 수정을 고려해야 합니다. 구글이 제안한 핵 매트릭스 수정 방법을 참고할 수 있으며 지연에 약간의 영향을 미칠 수 있으며 지연은 약 두 배가 될 것입니다.

3.4 차이 계층 알고리즘 효과 비교 차트

원시 알고리즘, MMR 및 DPP 비교

다양성 계층은 주로 안정성과 적시성을 고려합니다. 우리의 주요 트래픽은 MMR 과 DDP 라는 두 개의 암시적 다이버시티 알고리즘이며, 우리의 원래 알고리즘은 휴리스틱 규칙에 의해 제어됩니다. 최적의 매개변수 아래의 알고리즘을 비교해 보면 DDP 의 전반적인 효과가 MMR 보다 우수하며 원래 알고리즘에 비해 크게 향상되었다는 것을 알 수 있습니다. 다음 표는 두 알고리즘이 원래 알고리즘과 비교하여 어떻게 변경되었는지 보여줍니다.

표시기 \ 알고리즘 레지스터

디지털 데이터 프로세서

Pvctr+3.4%+5.8%

Vvctr

+5.4%+7.9%

Avgpv

+4.2%+6.0%

-응? 각 알고리즘 비즈니스 지표 변경 차트

사용자 거리

비즈니스를 더 잘 설명하고 긴밀하게 통합하기 위해 사용자 정의 거리를 사용합니다. 사용자 정의 거리의 장점은 다음과 같습니다.

-응? 해석성이 강하고, 사용자 정의 거리가 사람들이 이해할 수 있는 목적에 편향되어, 거리를 더욱 해석할 수 있게 한다.

또한 비즈니스 결합이 더욱 긴밀하게 이루어지고, 맞춤형 거리는 비즈니스 관련 정보를 활용하여 비즈니스를 긴밀하게 결합합니다.

일반적이며 다른 이기종 엔티티 간에 사용할 수 있습니다. 이는 다른 거리에서는 할 수 없습니다.

연습한 사용자 거리는 다음과 같습니다.

1. 자카드 거리/한명 거리

이 사용자 정의 거리는 Hamming-Jakad 거리 타일링 근사법을 통해 이루어집니다.

사용자 정의 거리-jackard/한명 거리

서비스를 결합하여 한명 벡터를 구성하고, 먼저 한명 거리를 계산한 다음 야코비 유사성을 통해 정규화하는 것이다.

2.? 사용자 거리-트리 모형 거리

사용자 정의 트리 모델의 거리는 트리 계층 감쇠와 하향식 비즈니스 조합으로 이루어집니다.

사용자 거리 트리 모델

나무의 리프 노드는 거리의 분산 값입니다.

위의 세 가지 사용자 정의 거리 방법을 시도했습니다. 설명 가능한 비즈니스 조합 및 온라인 실험 효과로 볼 때 트리 모델이 현재 가장 적합한 모델입니다.

총화와 전망

추천 시스템의 다양성을 평가하는 데는 여러 가지 측면이 있다. 이 문서에서는 다양성 지수를 사용하여 알고리즘의 좋고 나쁨을 측정할 뿐만 아니라, 비즈니스 지표를 기준으로 다양성 결과를 종합적으로 고려하고 다양성과 비즈니스 관심 지표를 저울질하며, 결국 다양성 알고리즘을 통해 비즈니스 지표를 개선하는 목적을 달성합니다. 엔지니어링 구현의 경우 이 문서에서는 특히 가장 중요한 재정렬 단계에서 리콜, 규칙, 재정렬 등에서 다양성을 실현하려는 알고리즘에 대해 설명합니다. MMR 및 DDP 알고리즘을 기반으로 컴퓨팅 효율성을 최적화하고 비즈니스 데이터 특성에 따라 거리를 사용자 정의하여 다차원 측정 프로젝트의 유사성에 대한 비즈니스 요구 사항을 충족합니다.

현재, 문헌의 효과에 있어서 학습 다양성 알고리즘은 비학습 알고리즘보다 더 효과적이며, 눈에 띄는 것이 보이지 않는 것보다 더 효과적이다. 그러나 다중 카테고리 이기종 엔티티 간의 관계는 그렇게 직관적이지 않습니다. 나중에 비즈니스 특성과 결합하여 시도해 보겠습니다. 또한 강화 학습에 기반한 다양성 알고리즘도 다양성 연구의 한 방향이며, 현재 우리는 다시 시도하고 있다.

참고 자료:

1.C.-n. 지글러, s.m. 맥케니, j.a. 콘스탄스, g 로젠. 주제 다양성을 통해 추천 목록을 개선하다. WWW2005

2.? J. 카포넬과 J. 골츠탄. 다양성 기반 재정렬 방법을 사용하여 문서의 순서를 다시 지정하고 요약을 생성합니다. SIGIR 1998

3.? 제니퍼 길렌워트 알렉스 쿨러사 벤 타스카입니다. 점 프로세스의 근사 최적 매핑 추론을 결정합니다. -응? 젖꼭지? 20 12

4. 마크 윌리엄, 아길트 쿠마르 라만나단, 알렉산더 보노모, 사갈 제인, 에드 H 치, 제니퍼 길렌워터. 유튜브에서 결정적인 포인트 프로세스에 대한 실용적 다양성 추천입니다. CIKM' 18 20 18

5.? 첸 라밍, 저우 한닝. 추천 다양성의 결정적인 포인트 프로세스를 높이는 빠른 욕심 매핑 추리. NeurIPS 20 18

6.CSDN 블로거 조영성. 행열식 정점 과정 소개. Csdn, 20 19.

작성자 정보:

유발 잘생긴, 58 장장 그룹, 고급 알고리즘 엔지니어.

주건빈, 58 장 그룹, 알고리즘 설계자, 기술위원회 위원.