지식 그래프를 구축하는 방법은 다음과 같이 소개된다.
구축 모델, 컨셉 온톨로지 디자인. 구축 모델 및 개념 온톨로지 디자인은 온톨로지 구축이기도 합니다. 온톨로지 구축에는 일반적으로 하향식과 상향식의 두 가지 방법이 있습니다.
지식 추출. 일반적으로 두 가지 유형으로 나뉘는데, 하나는 엔터티를 먼저 추출한 후 관계를 추출하는 파이프라인 방식과, 다른 하나는 엔터티 관계를 동시에 추출하는 파이프라인 방식이다.
지식 통합. 이 두 가지 방법을 간단히 소개하자면, 하나는 규칙 기반 방법이고 다른 하나는 딥러닝 기반 방법입니다.
지식 저장소. 마지막으로 모든 지식이 저장됩니다.
관련 확장
1. 지식 소스
지식 그래프 데이터는 텍스트, 구조화된 데이터베이스, 멀티미디어 데이터, 센서 데이터 등 다양한 소스에서 얻을 수 있습니다. 인위적인 크라우드소싱 등
각 데이터 소스의 지능화에는 다양한 기술적 수단의 통합이 필요합니다. 예를 들어, 텍스트 데이터 소스의 경우 텍스트에서 지식을 추출하기 위해서는 개체 인식, 개체 연결, 관계 추출, 이벤트 추출 등 다양한 자연어 처리 기술이 통합되어야 합니다.
2. 지식 표현 및 스키마 엔지니어링
지식 표현은 기계가 인간을 시뮬레이션하는 방법과 기술을 지원하기 위해 인간 두뇌의 지식을 설명하고 표현하기 위해 컴퓨터 기호를 사용하는 것을 의미합니다. 추론을 위한 마음. 지식 표현은 그래프 구성의 출력 목표, 즉 의미론적 설명 프레임워크(Description Framework), 스키마 및 온톨로지(Ontology), 지식 교환 문법(Syntax), 지식 그래프의 엔터티 명명 및 ID 시스템을 결정합니다.
3. 지식 추출
지식 추출은 업무에 따라 개념 추출, 개체 인식, 관계 추출, 이벤트 추출, 규칙 추출로 나눌 수 있습니다. 전통적인 전문가 시스템 시대에는 지식이 주로 전문가의 수작업 입력에 의존해 규모 확장이 어려웠다.
현대 지식 그래프의 구축은 일반적으로 기존의 구조화된 데이터 자원을 변환하여 기본 데이터 세트를 형성한 다음 자동화된 지식 추출 및 지식 그래프 완성 기술을 사용하여 여러 데이터 소스의 지식을 더욱 확장합니다. .인위적인 크라우드소싱을 통해 지식 그래프의 품질을 더욱 향상시킵니다.
4. 지식 융합
지식 그래프를 구축할 때 타사 지식 기반 제품이나 기존 구조화된 데이터에서 지식 입력을 얻을 수 있습니다. 예를 들어, Linked Open Data 프로젝트(Linked Open Data)는 앞서 소개한 DBpedia와 Yago에서 소개한 일반 지식 베이스와 특정 분야의 지식 베이스 제품을 모두 포함하는 축적되고 정리된 의미 지식 데이터를 정기적으로 공개합니다.
5. 지식 그래프 완성 및 추론
일반적으로 사용되는 지식 그래프 완성 방법에는 설명 논리에 따른 추론과 같은 온톨로지 추론에 따른 완성 방법이 포함된다[67-69]. RDFox, Pellet, RACER, HermiT, TrOWL 등과 같은 관련 추론 엔진 구현 이러한 유형의 추론은 주로 TBox, 즉 개념적 수준의 추론을 대상으로 하며, 개체 수준의 관계를 완성하는 데에도 사용될 수 있습니다.
6. 지식 검색 및 지식 분석
지식 그래프 기반 지식 검색의 구현 형태에는 주로 의미 검색과 지능형 질문 및 답변이 포함됩니다. 전통적인 검색 엔진은 웹 페이지 간의 하이퍼링크에 의존하여 웹 페이지를 검색하는 반면, 의미 검색은 사람, 기관, 장소 등과 같은 사물을 직접 검색합니다. 이러한 것들은 텍스트, 사진, 비디오, 오디오, IoT 장치 등 다양한 정보 자원에서 나올 수 있습니다.