공유 게스트: 메이투안 알고리즘 전문가 Zhang Hongzhi 박사
편집 및 편집: Liao Yuanyuan Meituan Group
제작 플랫폼: DataFunTalk
소개: 메이투안(Meituan) 중국 최대 온라인 지역생활 서비스 플랫폼인 투안(Tuan)은 수억 명의 사용자와 수천만 명의 가맹점을 연결하고, 그 이면에는 생활과 관련된 풍부한 지식이 담겨 있습니다. Meituan의 지식 그래프 팀은 2018년부터 그래프 구성에 중점을 두고 지식 그래프를 사용하여 비즈니스를 강화하고 사용자 경험을 개선해 왔습니다. 구체적으로 "메이투안 브레인"은 사용자를 구축하고, 상인, 상품, 장면 간의 지식 연관을 통해 생활 서비스 분야의 지식 두뇌를 형성합니다. 현재 '메이투안 브레인'은 수십억 개의 기업과 수백억 개의 트리플을 포괄하며 케이터링, 테이크아웃, 호텔, 종합 서비스 및 기타 분야에서 지식 그래프의 효율성을 검증했습니다. 오늘 우리는 주로 다음 세 가지 측면에 초점을 맞춘 Meituan Brain의 생활 서비스 지식 그래프의 구축 및 적용을 소개합니다.
--
"Meituan Brain"이란 무엇입니까?
다음은 "Meituan Brain"이 구축한 전체 로드맵입니다. 2018년에 처음으로 케이터링 지식 맵 구축을 시작했으며 Meituan의 풍부한 구조화된 데이터와 사용자 행동 데이터에 대한 예비 마이닝을 수행했으며 일부 중요한 행위를 수행했습니다. 식사에 대한 사용자 리뷰의 감성 분석 등 데이터 차원에 대한 심층 마이닝. 2019년에는 태그 그래프로 표현되는 구조화되지 않은 사용자 댓글에 대한 심층 마이닝에 중점을 두었습니다. 2020년 이후에는 각 분야의 특성을 결합하여 상품, 식품, 와인 및 여행, 종합 및 교차 지도 등 각 분야에 대한 심층적인 데이터 마이닝 및 구축을 수행할 예정입니다.
--
검색에서 사용자는 일반적으로 검색 엔진이 지원할 수 있는 일련의 세련된 검색 키워드로 자신의 의도를 추상화해야 합니다. 태그 지식 그래프는 "태그"를 사용하여 사용자 요구를 전달함으로써 사용자 검색 경험을 향상시킵니다. 예를 들어, 태그 지식 그래프를 통해 사용자는 '아이 돌보기', '커플 데이트' 등을 직접 검색할 수 있으며, 해당 가맹점/컨텐츠 제공자를 검색할 수 있다. 정보 획득의 관점에서 볼 때 사용자 리뷰와 같은 비정형 텍스트에는 많은 양의 지식(예: 특정 판매자에게 적합한 장면, 군중, 환경 등)이 포함되어 있습니다. 라이프 서비스 분야의 대규모 리뷰 데이터를 지식의 주요 원천으로 활용하고, 태그 마이닝, 태그 간 관계 마이닝, 태그-가맹점 연계 등 핵심 기술을 활용해 사용자의 니즈와 시나리오, 주요 관심사를 정리합니다. 지도 구성을 완료하려면 아래를 위로 올리세요.
태그 지식 그래프의 구성은 지식 추출, 관계 마이닝, 그래프 마킹, 그래프 적용의 네 부분으로 나누어진다.
① 지식 추출
태그 마이닝은 단일 범위 태그 마이닝, 건너뛰기 단어 태그 마이닝을 포함하는 간단한 시퀀스 태깅 아키텍처를 채택합니다. 또한 의미 판별 또는 컨텍스트와 결합됩니다. 더 정확한 라벨을 얻으려면 차별을 배우고 원격 감독을 사용하세요.
②관계 마이닝
동의어 마이닝: 동의어 마이닝은 N 단어, M 비즈니스 태그 단어를 포함하는 풀이 주어지고 M의 각 단어에 대해 N에서 단어를 찾는 것으로 정의됩니다. 동의어. 기존 동의어 마이닝 방법에는 검색 로그 마이닝, 백과사전 데이터 추출, 규칙 기반 유사성 계산 등이 포함되어 있어 융통성이 부족합니다. 우리의 현재 목표는 다목적이며 대규모 데이터 세트에 널리 적용할 수 있는 태그 동의어 마이닝 방법을 찾는 것입니다.
저자가 제시한 동의어 마이닝에 대한 구체적인 해결 방법은 다음과 같습니다. 먼저 오프라인 태그 풀이나 온라인 쿼리 태그를 벡터로 표현하여 벡터 인덱스를 얻은 후 벡터 해시 리콜을 수행합니다. 추가로 태그의 TopN을 생성하고 동의어 판별 모델을 사용합니다. 이 솔루션의 장점은 역색인 후보 생성에 비해 계산 복잡도를 줄이고 작업 효율성을 향상시키며, 중복 없이 동의어를 호출할 수 있고 정확도가 높으며 매개변수 제어가 간단하다는 것입니다.
레이블이 있는 데이터의 경우 주류 레이블 단어 임베딩 표현 방법으로는 word2vec, BERT 등이 있습니다. word2vec 방법은 단어 벡터의 평균을 취하고 단어 순서를 무시하여 구현하기가 비교적 간단합니다. BERT는 사전 학습 프로세스를 통해 더 풍부한 의미 표현을 캡처할 수 있지만 [CLS] 플래그 벡터를 직접 사용하며 그 효과는 동일합니다. word2vec에. Sentence-Bert는 Twin Towers 사전 학습 모델을 통해 태그 tagA 및 tagB 표현 벡터를 얻은 다음 코사인 유사성을 통해 두 벡터의 유사성을 측정하여 두 벡터의 의미를 얻습니다. 태그.
레이블이 지정되지 않은 데이터의 경우 대조 학습을 통해 문장의 표현을 얻을 수 있습니다. 그림에서 볼 수 있듯이, 유사성이 서로 다른 문장에 대한 Bert의 원래 모델의 벡터 유사성은 대조 학습을 통해 조정한 후 텍스트 유사성을 더 잘 반영할 수 있습니다.
비교 학습 모델 설계: 먼저 주어진 문장에서 이 샘플을 교란하여 샘플 쌍을 생성합니다. 일반적으로 임베딩 레이어에 적대적 공격을 추가하거나 어휘 수준에서 셔플링을 수행하거나 일부 단어를 삭제합니다. 등 쌍; 훈련 과정에서 배치 내 동일한 샘플의 유사성을 최대화하고 배치 내 다른 샘플의 유사성을 최소화합니다. 최종 결과는 비지도 학습이 어느 정도 지도 학습의 효과를 달성할 수 있으며, 비지도 학습 + 지도 학습의 효과가 지도 학습에 비해 크게 향상되었음을 보여줍니다.
동의어 식별 모델 설계: 두 개의 태그 단어를 Bert 모델에 연결하고 다층 의미 상호 작용을 통해 태그를 얻습니다.
태그 하위어 마이닝: 어휘 포함 관계는 하위어 관계 마이닝의 가장 중요한 소스입니다. 또한 의미나 통계를 결합한 마이닝 방법도 사용할 수 있습니다. 그러나 현재 어려운 점은 상위와 하위 기준을 통일하기 어렵고, 알고리즘 마이닝 결과를 현장의 필요에 따라 수정하는 경우가 많다는 점이다.
③ 지도 표시: 태그와 판매자 공급 간의 관계를 어떻게 구축할 것인가?
태그 세트가 주어지면 후보 태그 POI를 얻기 위해 판매자의 UGC/그룹 주문에 나타나는 태그의 빈도와 동의어를 기반으로 임계값이 설정됩니다. 발생하는 문제는 빈도가 높아도 반드시 관련이 있는 것은 아니기 때문에 불량 사례를 필터링하려면 가맹점 표시 및 식별 모듈을 사용해야 한다는 것입니다.
판매자 표시에서는 태그 및 판매자, 사용자 리뷰, 판매자 분류라는 세 가지 수준의 정보를 고려합니다. 구체적으로 라벨-판매자 입도에서는 라벨과 판매자 정보(판매자 이름, 판매자 3차 카테고리, 판매자 최상위 라벨)를 접합하여 Bert 모델에 입력하여 판단합니다.
사용자 댓글의 미시적 세분화를 통해 각 태그와 해당 태그를 언급하는 댓글(증거라고 함) 사이의 관계가 긍정적인지, 부정적인지, 관련성이 없거나 불확실한지 여부를 판단하므로 4가지 범주 판별 모델로 간주할 수 있습니다. 선택할 수 있는 옵션은 두 가지가 있습니다. 첫 번째는 다중 작업 학습을 기반으로 하는 방법입니다. 이 방법의 단점은 새 레이블을 추가하는 데 드는 비용이 높다는 것입니다. 예를 들어 레이블을 추가하려면 일부 훈련 데이터를 추가해야 합니다. 라벨을 위해. 저자는 마침내 의미론적 상호작용 기반의 식별 모델을 채택하고 레이블을 매개변수로 입력하여 모델이 의미론적 식별을 기반으로 하고 새 레이블을 동적으로 추가할 수 있도록 지원합니다.
의미적 상호작용 기반 판별 모델은 먼저 벡터 표현을 수행한 후 상호작용한 후 최종적으로 비교 결과를 집계하는 방식으로, BERT 기반 방식은 계산량이 많지만 계산 속도가 더 빠릅니다. 더 높은 정확도를 가지고 있습니다. 예를 들어, POI에 30개 이상의 증거가 있는 경우에는 경량 방법을 사용하는 경향이 있습니다. 식별에 사용됩니다.
거시적 관점에서 보면 태그와 카테고리가 일치하는지 여부에 따라 주로 세 가지 관계가 있습니다. 확실히 그렇지 않습니다, 아마도 그렇습니다, 그리고 확실히 그렇습니다. 일반적으로 투표 결과는 가맹점 연계 결과를 통해 결정되며, 정확도 요구사항이 높을 경우 일부 규칙이 추가될 예정입니다.
④ 그래프 적용 : 채굴된 데이터를 직접 적용하거나 지식 벡터 표현 적용
가맹점 지식 Q&A 관련 시나리오에서 태그에 해당하는 가맹점 마킹 결과 및 증거를 기반으로 사용자에게 답변합니다. 질문.
먼저 사용자 쿼리에서 태그를 식별하고 이를 ID에 매핑한 다음 검색 호출 또는 정렬 레이어를 통해 투명하게 인덱스 레이어로 전송하여 표시된 결과로 판매자를 호출하고 표시합니다. C 최종 사용자에게 제공합니다. A/B 실험에 따르면 사용자의 롱테일 수요 검색 경험이 크게 향상되었습니다. 또한, 호텔 검색 분야에서도 일부 온라인 실험이 진행되었으며, 동의어 매핑 등의 보완적인 회상 방법을 통해 검색 결과가 크게 향상되었습니다.
주로 GNN 모델을 사용하여 구현되며, Query-POI 클릭 동작과 Tag-POI 관련 정보를 학습 목표로 사용합니다. Tag와 POI 사이에 연관 관계가 있는지, Query와 POI 사이에 클릭 관계가 있는지를 판단하고, 연관 강도에 따라 추가 샘플링을 수행합니다. 온라인화 후 Query-POI 정보만을 활용하여 사진을 구성하는 경우에는 온라인상의 이점이 없는 것으로 나타났다. Tag-POI 관련 정보를 도입한 후 온라인 효과가 크게 향상되었다. 이는 순위 모델이 Query-POI 클릭 행동 정보에 의존하여 학습하기 때문일 수 있습니다. Graph Sage 학습의 도입은 정보 획득이 상대적으로 적은 다른 학습 방법과 동일합니다. 새로운 지식 정보를 제공하므로 상당한 개선이 이루어질 것입니다.
또한 Query-POI 벡터 유사성만 추가하는 것만으로는 온라인 효과가 잘 향상되지 않습니다. Query 및 POI 벡터를 추가한 후에는 효과가 크게 향상됩니다. 이는 검색의 특징 차원이 높고 벡터 유사성 특징이 쉽게 무시되기 때문일 수 있습니다. 따라서 Query 벡터와 POI 벡터를 접합한 후 특징 차원이 증가합니다.
이 작업은 현재 알려진 항목을 사용하여 사용자가 클릭한 마스크된 항목을 예측합니다. 예를 들어, Item의 컨텍스트 표현을 얻을 때, 해당 Item에 Attribute 정보가 있는지 여부를 결정하기 위해 관련 Attribute 정보도 벡터로 표현됩니다.
또한, Masked Item 속성 예측을 통해 태그의 지식 그래프 정보를 시퀀스 추천 작업에 통합할 수도 있습니다. 실험 결과는 다양한 데이터 세트에서 지식 정보를 도입한 후 정확도가 몇 배나 향상되었음을 보여줍니다. 동시에 우리는 벡터 리콜로 항목 표현을 사용하여 온라인 변환 작업도 수행했습니다. 특히 사용자가 기록에서 클릭한 항목을 기반으로 상위 N개의 유사한 항목을 호출하여 온라인 추천 결과를 보완합니다. 음식 목록 추천 페이지가 크게 개선되었습니다.
--
요리 지식 지도 구축의 목표는 한편으로는 요리에 대한 체계적인 이해를 구축하는 동시에, 더 많은 지식을 구축하는 것입니다. 완전한 요리 지식 지도 여기서는 요리 지식 그래프의 구성 전략을 설명하기 위해 다양한 계층 구조에서 시작합니다.
** * 요리 이름의 이해**
요리 이름에는 가장 정확하고 저렴한 요리 정보가 포함되어 있는 동시에 요리 이름에 대한 이해도 포함됩니다. 후속 명시적 지식 추론의 기초는 문화적 능력의 전제 조건입니다. 먼저, 요리명의 필수 단어/주제 요리를 추출한 후, 시퀀스 주석을 사용하여 요리명의 각 재료를 식별합니다. 두 가지 시나리오에 대해 서로 다른 모델이 설계되었습니다. 단어 분할이 있는 경우 단어 분할 기호가 모델에 특수 기호로 추가됩니다. 첫 번째 모델은 단어 분할이 없는 경우에 대해 각 토큰에 해당하는 유형을 식별하는 것입니다. Span-Trans 작업을 먼저 수행한 다음 단어 분할을 통해 모듈을 재사용해야 합니다.
요리 이름에 대한 이해는 중요한 정보원이지만 그에 담긴 지식은 상대적으로 제한적입니다. 따라서 다양한 요리의 일반화 처리를 달성할 수 있는 딥러닝 모델을 기반으로 한 예비 문자 추론이 제안됩니다. 문자 그대로의 표현. 그러나 전문적인 지식이 필요한 경우에는 성능이 좋지 않으며, 리터럴이 매우 잘 일치하는 경우가 가끔 나타납니다.
지식이 풍부한 텍스트에서 특정 레시피에 대한 기본 지식을 마이닝하여 소스 지식 기반을 구축한 다음 일반화된 추론을 통해 이를 특정 SKU에 매핑합니다. 예를 들어 재료 추리에는 돼지고기 조림 요리가 여러 개 나온다는 통계에 따르면 삼겹살 요리 10개 중 4개는 삼겹살이고, 6개는 껍질이 있는 삼겹살을 의미하므로 고기가 돼지고기 요리로 변환됩니다. 껍질이 있는 삼겹살. 이에 맞춰 Buddha Jumps Over the Wall에는 여러 가지 레시피가 있습니다. 먼저 각 재료가 나타날 확률을 계산하여 임계값을 설정한 다음 레시피의 레시피를 표시합니다.
멀티 소스 데이터 마이닝은 요리명 이해 결과를 바탕으로 탄탄한 삼중 지식을 구축하고, 요리명 이해 결과의 일반화 규칙에도 의존합니다. 이 전략은 주로 성분, 효능, 사람 등의 라벨을 처리하는 데 적합합니다. 이 방법의 정확도는 양호하고 일반화 능력이 있지만 적용률이 낮습니다.
1,000만 명의 판매자가 편집한 일관성 있는 매장 내 분류 트리와 같이 비즈니스에서 비교적 사용하기 쉬운 훈련 데이터가 있습니다. 이 데이터를 바탕으로 5억 개의 포지티브 쌍과 30G 코퍼스를 생성할 수 있습니다.
모델 학습 중에 레시피 카테고리의 탭/상점은 무작위로 교체되며, 모델은 탭/상점의 교체 여부를 50% 확률로 삭제하여 다음과 같은 경우에만 모델이 강력하게 수행되도록 합니다. 요리명이 입력됩니다. 동시에 모델은 실질적으로 개선되었으며 분류 레이블은 bert의 단어로 학습되었습니다. 이 방법은 주석이 달린 100,000개의 데이터를 사용하여 레시피 하위어/동의어 모델의 정확도가 1.8% 증가했습니다.
먼저 ReseNet을 이용하여 레시피 이미지를 컴파일하고, Bert 모델을 이용하여 레시피 텍스트 정보를 인코딩한 후, 비교 학습 손실을 통해 텍스트와 매장 요리 간의 매칭 정보를 학습합니다. 여기서는 단일 타워 모델을 독립적으로 사용할 수 있으며, 다른 한편으로는 접시 그림을 추론하고 캐시할 수도 있습니다. , 그림 내용이 간단하고 대화식 모델링이 필요하지 않습니다. 학습 목표는 이미지를 매장 요리와 일치시키고, 이미지를 요리 이름과 정렬하고, 이미지를 탭과 정렬하는 것입니다.
다중 모드 정보를 기반으로 요리 카테고리를 예측하거나 레시피 정보를 완성할 수 있습니다. 예를 들어, 사진 정보로 '돼지와 양배추'를 예측하는 것이 더 직관적이고 정확할 것입니다. 텍스트 및 뷰 모달 정보를 기반으로 하는 멀티뷰 준지도 레시피 속성 추출 요리 방법 추출을 예로 들어 먼저 요리 방법 훈련 샘플(돼지 고기 조림)을 생성한 다음 CNN 모델을 사용하여 레시피 요리 방법을 훈련하고 예측합니다. Bert 모델 안내 텍스트 모델 또는 다중 모드 모델을 미세 조정하여 판매자/탭/요리 및 리뷰 정보를 기반으로 요리 방법을 예측합니다. 마지막으로 두 모델에 투표하거나 두 기능을 결합하여 예측합니다.
요약하면 요리 지식 그래프 구성에 대한 해당 요약을 작성합니다. 요리 이해는 SKU 초기화에 더 적합하며 명시적 추론 모델은 동의어, 하위어, 요리 등에 더 적합합니다. 궁극적으로 우리는 다중 모드 + 구조화를 통해 불완전한 단일 모달 정보 문제를 해결하려고 합니다. 사전 훈련 및 추론, 다중 속성 차원, 주석이 달린 대량의 데이터에 대한 필요성 등이 있으므로 이 방법은 거의 모든 시나리오에 적용됩니다.
오늘의 나눔은 여기까지입니다. 모두 감사드립니다.
게스트 공유: