도서관과 정보과학에서 가장 많이 사용되는 검색 언어는 자연어이다. 자연어는 문헌 정보에서 나온 실제 언어이므로 표준화할 필요가 없다. 취해진 로고 단어는 정보 자체의 단어에서 직접 가져온 것이다.
자연어 처리 (NLP) 는 기계가 사람들이 쓰고 말하는 방식을 이해하고 해석하는 능력을 말한다.
NLP 의 목표는 컴퓨터/기계가 언어를 이해하는 데 인간처럼 지능을 갖도록 하는 것이다. 궁극적인 목표는 인간 교류 (자연어) 와 컴퓨터 이해 (기계어) 사이에 다리를 놓는 것이다.
자연어 처리는 인공지능의 하위 영역이다. 자연어 처리의 응용은 기계 번역, 감정 분석, 스마트 질의 응답, 정보 추출, 언어 입력, 여론 분석, 지식지도 등을 포함하며 심화 학습의 한 분야이기도 하다.
이 개념에는 자연어 이해 (NLU) 와 자연어 생성 (NLG) 이라는 두 가지 하위 집합이 있습니다.
바이두의 사진 한 장을 적용하여 그들의 관계를 아래와 같이 전시하다.
(1) 밑바닥은 가장 기초적인 큰 데이터, 기계 학습, 언어학,
(2) 위를 보면 지식지도로, 실체도, 관심도, 의향도를 포함한다.
(3) 다음 단계, 왼쪽은 언어이해, 오른쪽은 언어생성.
-질의 이해, 텍스트 이해, 감정 분석 등을 포함한 언어 이해. 다양한 수준의 어휘, 구문, 의미 분석을 할 수 있습니다.
--글쓰기, 독해력 등을 포함한 언어 생성.
(4) 최상층은 질의 응답 시스템, 기계 번역 및 대화 시스템을 포함한 시스템 계층입니다.