정보가공이란 다양한 목적과 요구 사항에 따라 수집된 대량의 원시 정보를 필터링 판단, 분류 정리, 카탈로그 색인, 카탈로그 조직, 저장 분석을 통해 특정 사용 가치를 지닌 정보로 만드는 과정을 말합니다.
일반적으로 수집된 원본 정보는 초기, 난잡하고 고립된 정보입니다. 이러한 0 차 정보를 분류하여 규칙적이고 질서 있고 체계적인 고급 정보로 만들어야 이용할 수 있다. 설명과 색인을 통해서만 레벨 0 정보를 보조 정보로 변환하여 정보를 저장, 검색 및 전달할 수 있습니다. 따라서 정보 처리 과정은 기존 정보를 기반으로 사용자에게 높은 가치와 사용이 편리한 새로운 정보를 만들어 정보의 가치를 높이는 과정입니다.
표준에 따라 정보 처리는 서로 다른 방식으로 나눌 수 있다.
처리 응답 시간에 따라 처리는 실시간 처리와 배치로 나눌 수 있습니다. 실시간 처리는 전송된 데이터를 즉시 처리하고, 즉시 응답하며, 일반적으로 일반 작업에 적용됩니다. 대량 처리란 전송된 데이터를 일정 분량이나 시간 저장한 후 중앙 집중식으로 처리하는 것으로, 일반적으로 통계 분석 업무에 적용된다.
처리 기능의 깊이에 따라 처리는 사전 처리, 업무 처리 및 의사 결정 처리로 나눌 수 있습니다. 전처리는 정보의 간단한 정리입니다. 비즈니스 처리는 정보 분석, 종합적인 정보 지원 의사 결정입니다. 의사 결정 처리는 정보에 대한 통계적 추론으로 의사 결정 정보를 생성합니다.
가공 공구에 따라 수동 가공과 컴퓨터 가공으로 나눌 수 있습니다. 수동 처리는 인공설비를 이용하여 정보를 처리하는 것으로, 주로 정보 처리의 초급 단계에 존재한다. 컴퓨터 처리는 컴퓨터를 이용한 데이터 처리, 원시 데이터 처리, 양식, 그래픽 등의 결과입니다.
3.4.2 정보 필터링
정보 필터링은 정보 처리의 첫 번째 단계이며, 그 목적은 진실을 위조하고, 정밀하고, 정보의 정확성과 유효성을 보장하는 것이다.
정보 필터
정보 필터링의 기본 절차는 주로 다음과 같은 측면을 포함합니다.
(1) 정보 정리. 정보 정리는 정보 필터링 및 식별을 위한 전제 조건으로, 단편적인 정보를 규범화하고 구성하여 추가 처리 및 분석을 용이하게 하기 위한 것입니다.
(2) 브라우징 복습. 브라우징과 감사는 정보 선별과 선별의 중심 부분이다. 그 목적은 명백한 오류나 쓸모없는 정보를 제거하고, 명백하고 진실하거나 유용한 정보를 보존하는 것이다. 잠시 확정할 수 없는 일부 정보에 대해서는 잠시 보류하고, 추가 처리를 위해 남겨두다.
(3) 다시 복습하다. 불확실한 정보의 경우 컨설팅 또는 기타 과학적 방법을 사용하여 분석 및 연구를 다시 수행하여 과학적으로 선택을 결정하고 정보 필터링 및 차별의 정확성을 높여야 합니다.
3.4.2.2 정보 스크리닝의 주요 대상
(1) 가상 정보. 이런 정보는 완전히 허구와 날조한 것으로, 어떠한 사실의 근거도 없다. 주로 정보 수집자의 나쁜 동기에서 비롯되며, 이런 정보는 반드시 제거해야 한다.
(2) 정보를 추가합니다. 이런 종류의 정보는 일정한 근거가 있지만 일부 줄거리와 내용은 정보 수집자와 전달자가 사실을 근거로 추가하는 것이 아니라 주관적인 상상을 통해 추가되는 것이므로 분석과 구분이 필요하다.
(3) 정보를 과장하다. 이러한 정보는 종종 사실을 과장하거나 축소하는 경향이 있으며, 사실에 대한 왜곡으로 정보의 진실성과 신뢰성에 심각한 영향을 미칠 수 있습니다.
(4) 편견이 있는 메시지. 이런 정보는 어떤 동작의 원인을 일방적으로 강조하거나 어떤 동작을 억압하는 요소이다. 그러한 정보가 검사 및 시정되지 않으면 정보의 사용 가치에 영향을 미치며 정보 사용자들에게 큰 손해를 입힐 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 정보명언)
(5) 정보가 불완전합니다. 시간이 오래 걸리거나, 정보를 잘못 얻거나, 정보 출처 자체가 접근할 수 없기 때문에, 개별 현상이나 특징을 통해서만 얻은 정보는 불완전하기 때문이다. 이러한 정보는 일반적으로 추가 추가 수집이 필요합니다.
(6) 퍼지 정보. 이러한 정보는 정보 수집자의 귀청설, 모래 사영, 흔히' 말',' 들어봤어요',' 대략',' 가능성',' 조짐' 등의 단어들을 담고 있다. 이런 정보는 신빙성이 약하므로 반드시 다시 수집하여 확인해야 한다.
(7) 정보를 긁어모으다. 이러한 정보는 수집, 처리 및 전달 과정에서 서로 다른 위치, 시간, 조건, 성격의 정보를 같은 위치, 같은 시간, 같은 조건, 같은 성격의 같은 정보로 결합하는 경우가 많습니다. 전반적으로, 이런 잡다한 정보는 여전히 근거가 없다.
3.4.2.3 정보 필터링 방법
(1) 감각 판단법. 감각 판단법은 정보 처리기가 원본 정보를 탐색하고 검토하는 과정에서 자신의 지식, 기술 및 경험에 의존하여 정보의 진실성과 신뢰성을 시각적으로 판단하는 방법을 말한다.
(2) 비교 분석. 비교 분석은 정보 처리기가 정보를 선별하고 분별하는 과정에서 서로 다른 채널에서 수집한 정보를 전후 좌우, 같은 정보를 비교 분석하여 정보의 진실성과 신뢰성을 확인하는 방법을 말한다.
(3) 전문가 판단법. 전문가 판단법은 잠시 선택할 수 없는 정보에 대해 전문가가 그 가치를 결정하는 방법이다.
(4) 단체 토론법. 집단토론법은 집단협상 방법으로 집단지혜를 통해 개인이 결론을 내릴 수 없는 일부 정보의 선택을 결정하는 것을 말한다.
(5) 현장 검증법. 현장 검증법은 정보 수집자나 정보 처리기가 현장에 깊이 들어가 의심스러운 정보의 진실성을 검증하도록 지시하는 방법이다.
(6) 수학 회계 방법. 수리계산법은 정보 처리기가 원본 정보에 대해 의문이 있을 때 재계산하는 처리법이다. 이 방법은 정보 수집 및 계산 오류, 필기 오류 또는 전송 중 오류로 인한 정보 왜곡을 적시에 수정할 수 있습니다.
3.4.3 정보 분류
정보 필터링은 정보의 황삭이고, 정보 분류는 정보의 마무리이다. 정보를 분류해야 정보를 더 잘 저장, 검색, 전달 및 활용할 수 있다.
3.4.3. 1 정보 분류 기본 절차
(1) 분류 방법을 결정합니다. 현재 정보를 분류하는 방법에는 지역 분류, 컨텐츠 분류, 주제 분류, 시간 분류, 종합 분류 등 여러 가지가 있습니다. 어떤 분류 방법을 채택할지에 따라 정보 자료의 순서가 직접 결정된다. 따라서 분류를 결정하는 것은 정보 정리의 기초이자 전제이다.
(2) 정보 정리를 실시하다. 이것은 정보 분류의 두 번째 단계입니다. 즉, 사후 작업을 위해 정보 자료를 분류할 것입니다.
(3) 정보를 정리하다. 정보를 분류한 후, 같은 범주의 정보자료 배치도 선착순 문제가 있다. 정보를 정리하면 정보는 질서 정연한 정보 시스템이 될 수 있다.
3.4.3.2 정보 분류의 구체적인 방법
(1) 구역 분류. 지역별 분류는 지역별 정보에 따른 분류 방법을 말합니다.
(2) 시간 분류. 시간 분류는 시간순으로 정보를 나누는 방법입니다. 시간 분류는 연도, 월, 일로 나눌 수도 있다.
(3) 내용 분류. 컨텐트 분류는 정보에 포함된 다른 내용에 따라 분류하는 방법입니다. 예를 들어, 업종에 따라 정보는 농업 정보, 산업 정보, 비즈니스 정보, 서비스 정보, 여행 정보, 기업 정보, 자본 건설 정보, 재무 정보, 재무 정보 등으로 세분화될 수 있습니다.
(4) 종합 분류. 종합분류는 시간, 지역, 내용에 따라 정보를 종합적으로 나누는 방법이다. 조합에 따라 종합 분류는 기간 분류, 지역 기간 분류, 컨텐츠 도메인 분류, 컨텐츠-기간 분류, 지역 시간-컨텐츠 분류, 지역 컨텐츠-시간 분류, 기간 컨텐츠-도메인 분류 및 시간-컨텐츠-도메인 분류로 나눌 수 있습니다.
정보 설명
정보 설명이라고도 하는 정보 설명은 특정 관리 규칙 및 기술 표준에 따라 정보의 외부 특성 및 일부 컨텐츠 특성을 분석, 선택 및 기록하는 프로세스입니다. 정보 설명을 통해 원본 정보의 컨텐츠 특성과 외부 특징을 반영하는 레코드를 형성하는 항목 또는 항목입니다. 카탈로그는 여러 항목을 일정한 순서로 배열하는 파일 보고 및 검색 도구입니다. 항목은 일종의 문헌의 축소판이고, 카탈로그는 한 무리의 문헌의 축소판이다.
3.4.4. 1 정보 설명 표준화
문헌의 표준화는 한 국가나 국제 범위 내에서 문헌에 기재된 원칙, 내용 및 형식에 대한 구속성 규범을 가리킨다. 문헌 자원을 개발하고 활용하기 위해서는 문헌의 특징과 문헌을 보도하고 검색하는 방법을 설명하는 일관된 서지 정보 언어를 확보해야 한다. 1960 년대에 많은 국가들이 자국에서 문헌 저서의 표준화를 실현하였다. 이를 바탕으로 국제도서관협회와 기구연합회 (IFLA) 특별팀은 197 1 년 국제문헌기록기준을 제정하기 시작했고 1974 년 국제표준서지 (IS) 를 공식 발표했다. 국제 표준 참고 문헌은 다음과 같은 문제를 성공적으로 해결했습니다.
(1) 문헌 설명 항목과 정렬 순서를 서로 바꿀 수 있도록 하여 문헌 설명의 국제적 통일을 실현하였다.
(2) 언어 장애를 극복하고 각국 문헌의 묘사를 쉽게 식별할 수 있도록 했다. 언어를 이해하지 못하는 독자도 기호 시스템을 통해 설명 항목을 식별할 수 있습니다.
(3) 일반 책을 기계 판독 목록의 형식으로 변환하는 데 도움이 된다.
우리나라의 통일된 문헌 보고 제도를 확립하고 보완하기 위해 국제 서지 정보 교류를 전개하고 문헌 정보 자원을 더 잘 개발하고 활용하기 위해 우리나라는 전국 문헌 업무 표준화 기술위원회 제 6 분위원회 (목록 기재 분위 위원회) 와 중국 * * * 도서관 학회의 공동 노력으로 7 월 국가 문헌 저서 기준 시리즈의' 문헌 저서통칙',/KLOC 를 공식 출판했다. 그 후로 일반 도서, 연속 간행물, 지도, 문서, 고서, 정기 간행물 검색, 참고 문헌 기록 규칙 등 다양한 하위 규칙이 잇따라 출범했다.
3.4.4.2 기계 판독 가능 디렉토리 형식
Marc (Machine Readable Catalog) 는 컴퓨터 스토리지 미디어에 코드 형식 및 특정 구조로 기록되고 컴퓨터에 의해 인식되고 읽혀지는 기계 판독 디렉토리의 약어입니다.
국회 도서관은 65438 년부터 0965 년까지 기계가 읽을 수 있는 목록을 개발하기 시작했다. MARCⅰⅰ 테이프는 1966 에서 생산됩니다. 1969 년 MARC II 테이프가 공식 출간된 이후 전문 저서, 연재 간행물, 서류와 원고, 시각 자료, 악보, 지도 등 MARC 데이터 파일이 속속 출간됐다. MARC 형식은 미국 국회도서관에서 개발했기 때문에 USMARC (LCMARC 라고도 함) 라고 합니다. 1977 년 IFLA 는 처음으로' UNIMARC 범용 판독 카탈로그 형식' 을 출판한 뒤 계속 개정했다.
CNMARC 는 중국 기계 판독 카탈로그 형식으로 중국 국가서 조직이 UNIMARC 에 따라 제정했다. 중국 국민의 문화업계 표준인 WH/T0503-96 이 출범했다. 이것은 ISO2709 의 규정에 부합한다. UNIMARC 를 기반으로 UNIMARC 에 정의된 모든 필드가 유지되고 중국어 발행물에 고유한 필드 정의가 보완됩니다. 예를 들어, 09 1 통합 도서 번호 필드와 하위 필드를 추가합니다. 092 주문 번호 : 093 특허 번호 094 표준호 690 "중국 도서관 분류"; 692 중국 과학원 도서 분류; 905 정보 수집 등.
3.4.4.3 두빈콜 표준
Dubin 핵심 표준은 DC 의 약자입니다. DC 메타데이터의 형식은 OCLC (online computer library center, Inc.) 와 ncsa (national center for super computing application) 가 공동으로 첫 번째 워크숍 ( 피연산자는 네트워크의 전자 텍스트 리소스로 제한됩니다. 회의에서 13 개의 메타 데이터 항목이 생성되었는데, 이 메타 데이터 항목은 회의 장소 두빈의 이름을 따서 명명되었다. 9 월 세 번째 워크숍에서 1996, DC 메타데이터는 처리 개체를 이미지 리소스로 확장합니다. 이미지 리소스를 포괄적으로 설명하기 위해 설명 항목과 권한 관리 항목 두 개가 추가되고 일부 설명 항목의 이름이 수정되어 15 개의 설명 항목이 생성됩니다. 1997 10 핀란드 헬싱키에서 열린 5 시리즈 워크숍에서는 DC 메타데이터 형식의 주요 기능이 정보 자원 평가보다는 정보 자원에 대한 설명이나 설명에 초점을 맞추고 있음을 더욱 분명히 했습니다. 15 메타 데이터 항목은 다음 세 가지 범주로 나뉩니다.
(1) 리소스 컨텐츠 설명 클래스 메타데이터 항목입니다. 이 클래스에는 다음과 같은 메타데이터 항목이 있습니다.
제목: 리소스의 작성자 또는 게시자가 제공한 리소스의 이름입니다.
생성자: 자원 생성자입니다.
Subject: 자원 객체의 주제 내용이나 주제 내용을 나타내는 키워드입니다.
설명: 문서 객체 요약 또는 시각화 저작물의 내용 설명을 포함한 리소스 컨텐트에 대한 텍스트 설명입니다.
언어: 자원 객체가 사용하는 언어 유형입니다.
출처: 2 차 자원에 대한 출처 정보입니다. 일반 요소에는 현재 리소스에 대한 정보만 포함됩니다. 현재 리소스를 표시해야 하는 경우 항목에 두 번째 리소스의 날짜, 작성자, 형식, 플래그 또는 기타 메타데이터가 포함될 수 있습니다.
관계: 2 차 자원 식별 및 현재 자원과의 관계 이 요소는 관련 리소스와 리소스 설명 간의 연관을 허용합니다. 예를 들어 카탈로그 원본 (예 버전), 번역 원본 (기준), 추출 원본 (예 부분), 형식 변환 원본 (예 형식) 등이 있습니다.
적용 범위: 자원 지식 내용의 공간적 및 시간적 특성. 공간 범위는 위도 경도, 표준화된 지명 등과 같은 물리적 영역을 나타냅니다. 시간 범위는 자원이 생성된 시간 (시점) 이 아니라 자원의 내용 (기간) 입니다. 시간 설명은 날짜 항목과 동일한 형식을 사용합니다.
(2) 지적 재산권 설명 메타 데이터 항목. 이 클래스에는 다음과 같은 메타데이터 항목이 있습니다.
생성자: 자원 지식 콘텐츠 생성의 주요 책임을 맡은 개인 또는 기관입니다.
출판사: 자원을 출판사, 대학, 회사 실체와 같은 현재 형식으로 변환하는 업무를 담당하는 사람입니다.
기여자: 창작자 요소에 포함되지 않고 리소스의 지식 내용에 중요한 기여를 하며 창작자 다음으로 공헌하는 개인 또는 조직 (예: 편집, 카피 라이팅, 일러스트레이션 등) 을 말합니다. ).
권리: 권리 관리 선언, 권리 관리 선언의 id 또는 자원 권리 관리 정보 콘텐츠를 제공하는 서비스의 id 를 가리킵니다.
(3) 외부 속성은 클래스 메타 데이터 항목을 설명합니다. 이 클래스에는 다음과 같은 메타데이터 항목이 있습니다.
일자 항목: 자원 생성 또는 자원 가용성 확보와 관련된 일자입니다.
유형: 소설, 시, 보고서, 논문, 사전 등과 같은 자원의 범주입니다.
식별자: 리소스를 고유하게 식별하는 문자열 또는 숫자입니다. 예를 들어, 네트워크 리소스 ID 의 URL 및 URN 과 ISBN (International Standards Book) 또는 기타 사양 이름과 같은 기타 일반적인 고유 ID 를 식별자로 사용할 수 있습니다.
형식: 리소스를 표시하고 실행하는 데 필요한 소프트웨어 또는 하드웨어 (예: 텍스트, JPG 이미지, 응용 프로그램 등) 를 나타내는 리소스의 데이터 형식입니다.
정보 색인
정보 공개라고도 하는 정보 색인은 정보의 주요 내용 및 기타 형식 특징을 선택, 요약 및 정련하는 과정입니다. 정보 양식 특성 선택, 정보 내용의 특성 분석, 정보 컨텐츠 주제를 반영하는 로고와 같은 특정 컨텐츠로 변환 등이 포함됩니다.
3.4.5. 1 정보 색인 프로그램
정보 색인 프로세스는 일반적으로 세 부분으로 구성됩니다.
(1) 테마 분석. 즉, 분석 정보에 포함된 주제는 주로 주제의 수량 분석, 즉 정보에 포함된 주제의 수를 포함합니다. 주제 구조 분석, 즉 주제당 몇 개의 주제 개념 요소가 있습니까? 주제 내용 분석, 즉 정보에 어떤 주제가 포함되어 있는지, 각 주제에 어떤 개념적 요소가 있는지 구체적으로 설명합니다.
(2) 주제 색인. 주제 분석 결과를 주제 인식으로 전환하다. 정보 주제에 대한 공개 정도에 따라 주제 색인에는 4 가지 전략이 있습니다. 1 전체 색인: 즉, 정보 엔티티의 전체 주제는 일반적으로 하나의 로고로 색인화됩니다. ② 종합 색인: 한 정보 엔티티의 모든 로컬 주제 또는 다른 주제와 해당 개념 요소를 상세히 색인화합니다. ③ 보충 색인: 즉, 정보 엔티티의 전체 주제를 전체적으로 인덱싱하는 것 외에도 일부 로컬 주제와 개념 요소를 별도로 인덱싱합니다. 4 키 색인: 정보 엔티티의 정보 시스템의 특성, 작업 및 목적과 관련된 주제 부분을 색인화합니다.
(3) 검사 및 감사, 즉 위에서 언급한 주제 분석 및 주제 색인의 프로세스와 결과를 검토하고 검토하여 결국 공식적으로 정보 공개의 결과를 형성합니다.
3.4.5.2 정보 인덱싱 방법
색인화 과정에서 제공되는 태그의 형태와 특성에 따라 정보 색인은 일반적으로 분류 색인과 주제 색인의 두 가지 범주로 나눌 수 있습니다.
(1) 분류 색인. 분류 색인은 정보의 내용이나 형식 특징을 분류하는 방법입니다. 분류 색인을 사용하면 주제 속성이 * * * * 인 정보 클래스를 모아 다양한 정보 간의 주제 관계에 따라 모든 정보를 계층적이고 조직적인 전체로 구성할 수 있습니다. 현대 분류법의 편성 방법으로 볼 때, 분류 방법은 주로 등급 분류, 깎인면 조합 분류 및 혼합 분류입니다.
1) 계층 분류. 이런 분류는 문헌 내용의 학과 성격을 바탕으로 지식 범주의 논리적 순서에 따라 일반에서 구체적, 단순에서 복잡에 이르기까지 계층별로 나누는 계층 체계이다. 주요 특징은 주제와 전공별로 문헌을 집중하고, 지식 분류의 관점에서 다양한 문헌의 내용 차이와 연계를 밝히고, 주제 분류에서 문헌 정보를 검색할 수 있는 방법을 제공한다는 것이다.
2) 깎인면 조합의 분류. 이것은 분석 및 합성 원리에 기반한 분류 유형입니다. 그것의 기본 사상은 어떤 복합제목이든 아무리 복잡하더라도 그에 상응하는 기본 개념으로 분해될 수 있다는 것이다. 동시에, 그들은 또한 해당 기본 개념의 조합으로 표현될 수 있다. 따라서 분류법에 모든 주제를 상세히 나열할 필요는 없습니다. 범주 테이블에 범주별로 다양한 기본 개념을 나열하고 해당 번호를 지정하기만 하면 됩니다.
3) 혼합 분류. 이 분류는 위의 두 가지 분류의 장점을 종합한 것이다. 클래스 테이블의 상세한 열거를 기초로 다양한 조합 방법을 광범위하게 사용한다. 국제 십진 분류법과 같다.
상술한 계층 분류법은 예로부터 지금까지 도서관 문헌의 분류와 검색에 광범위하게 적용되었으며, 도서 정보 분야에서도 여전히 널리 사용되고 있다. 그 장점은 지식을 강조하는 체계적인 조직으로, 사람들이 사물을 인식하는 습관에 부합하며, 사용자가 학과 체계에 따라 관련 문헌 정보를 검색할 수 있도록 하는 것이다. 클래스 트리 구조는 문헌의 랙 관리 및 검색 도구의 배열 조직에 적용됩니다. 일반적으로 아라비아 숫자와 라틴 문자로 식별되며 공통성이 있어 국제 통합 분류가 자원 공유를 가능하게 합니다. 물론 계층 분류 체계에는 아키텍처의 한계와 직접 특이성 차이와 같은 한계도 있습니다. 다중 각도 색인 및 검색에 적합하지 않습니다. 범주 체계는 고정되어 있고, 미리 열거되어 있어, 제때에 새로운 학과, 새로운 것을 반영할 수 없어, 수정하고 보충하기가 매우 어렵다.
(2) 주제 색인. 주제 색인은 표준화되거나 표준화되지 않은 자연어를 정보 주제 식별자로 사용하는 방법입니다. 선어 원칙, 조합 방식, 규범 조치 및 편성 방법에 따라. 주제법은 제목 형태학, 변형학, 키워드법, 서사형태학으로 나눌 수 있다.
1) 제목 어휘. 제목 형태학은 제목 단어 (표준화된 사물명과 명사용어) 를 정보 주제 내용의 식별과 검색으로 이용하는 방법이다. 제목사의 출처는 주로 색인 객체의 이름 또는 제목에서 흔히 볼 수 있는 정형명사이다. 제목 단어의 편제는 제목 표라고 하며, 제목 어법의 주요 특징은 사전 편찬 표이다. 제목 단어는 고정된 조합으로 용어집에 구성되어 설정된 조합에 따라 검색됩니다. 제목 용어집의 역할은 의미, 변화형, 단어와 단어 사이의 관계 및 사용법 등에서 최적화된 제목 단어를 관리하고 제어하는 것입니다. 하나의 사물은 하나의 표제로만 표현되고, 하나의 표제어는 하나의 사물이나 의미만 표현하며, 사용 과정의 혼란을 피한다. 제목 형태학은 직설적이고 특이성이 뛰어나며 공통성이 강하여 피쳐 검색에 적합하지만 유연성이 떨어집니다.
2) 변형기. 변형기' 는 가장 기본적이고 분할할 수 없는 어휘 단위 단어를 주제어로 사용하여 정보 내용에서 추출한 다음 표준화하여 독립적인 개념을 표현할 수 있다고 주장한다. 예를 들어, "컴퓨터 소프트웨어" 는 단위 단어가 아니라 "컴퓨터" 와 "소프트웨어" 는 단위 단어입니다. 영어에서 단위 단어는 종종 한 단어이다. 변형기의 두드러진 특징은 어휘의 단위화를 강조하는 것이다. 후기 결합을 강조하다. 변형기' 는 주제법의 유연성을 높였지만 어휘단위화, 어휘가공방법이 불합리하고, 잘못된 조합이 생기기 쉬우며, 오검률이 높기 때문에 실용성이 강하지 않다.
3) 키워드법. 키워드법은 정보 자료의 제목, 요약 또는 본문에서 주제 개념을 표현할 수 있는 의미 있는 정보 단위 (키워드) 를 주제어로 직접 추출한 다음 사전순으로 정보를 검색하는 방법입니다. 키워드 정렬은 "과학 인용 색인" 의 "회전 주제 색인" 과 같은 주제 검색의 색인 체계를 형성할 수 있으며, 그 키워드는 문헌의 제목에서 추출됩니다. 키워드법은 어고에 의해 제어되지 않고 빠르고 간단하며, 컴퓨터가 정보를 구성하고 검색하는 데 적합하다. 그러나 단점은 키워드법의 어휘가 표준화되지 않아 정보의 검사율과 정확도에 영향을 미친다는 것이다.
4) 서사. 시소러스는 시소러스에서 시소러스를 선택하고 개념 조합을 통해 정보 자료의 주제를 설명하고 색인과 검색이 더 높은 수준의 색인에 도달할 수 있도록 하는 방법입니다. 사전 편찬의 두드러진 특징은 여러 설명자가 임의의 논리적 조합을 형성하여 다양한 검색 문제를 구성할 수 있다는 것이다. 서술학은 위에서 언급한 몇 가지 학과 방법의 장점을 흡수하여 직관적이고, 구체적이며, 유연하며, 색인이 정확하고, 검색이 편리하다는 등의 장점을 가지고 있으며, 문헌 검색에서 광범위하게 응용되었다. 현재 국내외 대부분의 검색 도구와 데이터베이스는 시소러스를 사용하고 있다. 상용시어표로는 INSPEC 시소표, 원자력 과학 중국어 시소표, 국방과학 시소표, 지질중국어 시소표, 중국어 시소표가 있다.
정보 저장소
정보는 추상적이며, 반드시 어떤 전달체에 부착해야 표현할 수 있다. 정보를 캐리어에 첨부하는 프로세스는 정보를 저장하는 프로세스입니다.
정보 스토리지의 의미와 기능
정보 저장이란 처리된 정보를 특정 규칙에 따라 해당 정보 전달체에 기록하고 특정 특징 및 컨텐츠 속성에 따라 시스템의 검색 시스템으로 구성하는 프로세스입니다. 정보 스토리지의 의미와 역할은 다음과 같습니다.
(1) 유리한 * * *. 정보가 저장되면 사용자는 정보 저장소를 즐기고 재사용하여 정보 활용도를 높일 수 있습니다.
(2) 검색이 편리하다. 처리된 정보를 저장하여 저장소를 형성하면 사용자가 필요한 정보를 검색할 수 있습니다.
(3) 정보의 중앙 집중식 관리에 유리하고, 정보 자원의 소유권을 늘리고, 높은 수준의 정보 자원을 개발한다.
결론적으로, 정보를 저장할 때, 반드시 검색의 편리성과 효율성을 충분히 고려하고, 질서 정연하고, 분류가 합리적이며, 검색이 명확하고, 쉽게 이루어져야 한다.
3.4.6.2 정보 저장소의 주요 기술
전통적인 정보 저장 기술은 종이 인쇄 스토리지 기술을 의미하며, 현대 정보 저장 기술로는 마이크로필름 스토리지 기술, 오디오 스토리지 기술, 컴퓨터 스토리지 기술, 광 스토리지 기술 등이 있습니다. 스토리지 용량, 집적도, 비용 절감, 간편한 액세스 등의 장점을 갖추고 있어 널리 사용되고 있습니다.
(1) 용지 저장 기술. 종이 스토리지 기술은 가장 많이 사용되고 사용 시간이 가장 긴 스토리지 기술입니다. 그러나 저장 정보 밀도가 낮고, 부피가 크며, 점유 공간이 많고, 종이가 연소하기 쉽고, 습기가 많고, 곰팡이가 나고, 좀나방, 풍화 등 여러 가지 단점이 있다. , 그리고 저장하기가 쉽지 않습니다.
(2) 마이크로 스토리지 기술. 마이크로스토리지 기술은 카메라로 인쇄물의 내용을 필름에 축소한 다음 마이크로필름으로 헹구어 저장하는 것을 말한다. (알버트 아인슈타인, Northern Exposure (미국 TV 드라마), 마이크로명언) 마이크로필름 저장 기술의 주요 장점은 1 저장 밀도가 높아 용지 정보 저장 공간을 90% 절약할 수 있다는 것입니다. ② 저장 방법은 간단하고, 비용이 저렴하며, 경제적이다. ③ 유통기한이 길어서 보통 환경에서 50 년, 표준조건 하에서 수백 년을 도달할 수 있다. ④ 마이크로 영화는 원본에 충실하며 실수하기 쉽지 않습니다. 다른 저장 방식에 비해 오류율은 0 입니다. ⑤ 마이크로기술을 이용하여 규격이 일정하지 않은 원본 문서를 규범적으로 관리할 수 있다. 마이크로기술은 컴퓨터 기술 및 통신 기술과 결합하여 자동 검색을 수행할 수도 있습니다. 단점은 마이크로리더나 마이크로리더 복사기를 통해서만 읽을 수 있고, 대조적으로 읽을 수 없기 때문에 보존 조건이 매우 엄격하다는 것이다.
(3) 오디오 및 비디오 저장 기술. 시청각 저장 기술은 녹음 또는 녹화로 정보를 기록하고 저장하는 정보 저장 기술로, 녹음 저장 기술, 비디오 저장 기술 및 필름 저장 기술을 포함합니다.
(4) 광 저장 기술. 광 저장 기술은 레이저와 컴퓨터를 이용하여 다양한 정보를 디지털화하고, 광 신호로 변환하고, 광 디스크에 정보를 저장하는 새로운 저장 기술입니다. 광 디스크 스토리지 기술은 다음과 같은 특징을 가지고 있습니다. ① 스토리지 밀도가 높고 용량이 큽니다. (2) 저렴하고 복제하기 쉽다. (3) 내구성, 긴 저장 수명. 시디는 밀봉이 잘 되어 있어 먼지, 유해 가스, 전자기장의 영향을 받아서는 안 된다. 또한 무접촉 액세스를 위해 레이저를 사용하며 10 년 이상의 수명을 제공합니다. 그것의 주된 단점은 오류율이 비교적 높다는 것이다.
(5) 컴퓨터 저장 기술. 컴퓨터 저장 기술은 컴퓨터의 내부 및 외부 스토리지를 이용하여 정보를 저장하는 기술이다. 컴퓨터에서의 역할에 따라 컴퓨터의 메모리는 메모리와 외부 메모리로 나눌 수 있습니다. 그 중에서도 메모리는 CPU 와 직접 거래되며, 주요 특징은 속도, 용량, 가격이 높다는 것입니다. 외부 메모리는 주로 메모리의 백업과 보충으로 널리 사용되고 있다. 스토리지 용량이 크고 비용이 적게 드는 영구 오프라인 정보 저장이 특징입니다.
3.4.7 정보 분석
정보 분석은 정보 조직 과정에서 없어서는 안 될 부분이며, 알려진 정보를 통해 객관적인 사물 운동의 법칙을 제시하는 과정이다. 주요 임무는 정보 연구자들이 특정 주제를 해결하는 사용자의 요구를 충족시키기 위해 특정 방법과 수단을 사용하여 원본 정보를 더 깊고, 완전하며, 포괄적이며, 더 적용 가능한 수준에서 새로운 정보 내포로 요약하는 것입니다.
3.4.7. 1 정보 분석 기능
정보 분석에는 정리, 평가, 예측 및 피드백의 네 가지 기본 기능이 있습니다.
(1) 정렬 기능: 정렬 정보를 수집하여 무질서에서 질서로 변경합니다.
(2) 평가 기능: 정보의 가치를 평가하여, 조잡하고 정밀하며, 위선을 제거한다.
(3) 예측 기능: 알려진 수정본의 내용을 분석하여 알 수 없거나 미래의 정보를 얻을 수 있습니다.
(4) 피드백 기능: 사용자의 실제 소비 이익에 따라 예측 결론을 검토, 평가, 수정 및 보충합니다.
일반적으로 이 네 가지 기본 기능은 밀접한 관련이 있습니다. 정보 정리 및 평가는 정보 분석의 두 가지 기본 기능으로 예측 및 피드백 기능을 위한 준비입니다. 예측과 피드백은 정보 분석의 두 가지 특징이며 정보 정리 및 평가 기능의 추가 확장 및 확장입니다.
정보 분석 방법
정보 분석 방법은 정보 분석의 도구이며 정보 분석을 실현하는 수단이다. 정보 분석의 내용은 천차만별이고 규모와 범위도 다르지만 공통의 목표는 구체적인 의사 결정 문제를 중심으로 하는 것이다. 문제 발전 역사와 현황에 대한 심도 있는 분석과 연구를 통해 그 발전 법칙을 밝히고 그 발전 전망과 추세를 예측함으로써 다양한 분석 방법의 공통된 특징과 속성을 결정한다. 정보 분석 방법은 주로 정성 분석과 정량 분석을 포함한다.
(1) 정성 분석. 정성 분석, 즉 논리법은 논리적 추리와 변증법 분석을 바탕으로 알려진 정보에 따라 비교, 분석 종합, 귀납추리 등 일련의 논리적 수단을 통해 사물 발전 법칙과 인과관계를 밝혀내는 연구 방법이다. 정성 분석의 장점은 추리가 엄격하고 직감이 강하다는 것이다. 그러나 주요 단점은 정량설명이 없는 정성적 성향일 뿐 구체적이고 상세하지 않아 기술경제나 엔지니어링 프로젝트, 시장 예측 등 정량연구가 필요한 과제에 완전히 적응할 수 없다는 점이다.
(2) 정량 분석 방법. 정량 분석 방법, 즉 수학 방법은 기초 수학, 수학 통계, 응용수학 및 기타 모든 수학 처리와 계산을 운용하는 연구 방법의 총칭이다. 이러한 방법의 두드러진 특징은 사물을 정량적으로 묘사하고 그 발전의 구체적인 정도를 보여줄 수 있다는 것이다. 수학적으로 사물 사이의 관계를 연구할 때, 연구자들은 사물 자체가 아니라 공식이나 모형과 같은 사물의 동형 시스템을 직접 접촉한다. 그러나 정량 분석 방법에는 적용 가능한 조건과 한계가 있습니다. 수학 계산에 사용되는 경계 조건은 객관적인 사물에 따라 추상적이거나 가정되며, 최종 결론을 결정할 때 이러한 추상이나 가정이 합리적이거나 객관적인 현실에 부합하는지 여부를 검토하거나 검증해야 합니다. 수학 방법에 사용된 다양한 매개변수 데이터는 객관적인 통계와 주관적 평가에서 비롯되므로 수학 방법 연구의 결과는 정보 분석 연구의 결론에서만 상대적인 의미를 지닙니다. 객관적인 사물은 종종 다중 매개 변수, 역동적이고 복잡한 시스템이며, 모든 객관적인 사물의 동형 체계는 본질적으로 근사적이고 정적이며 단순화된 시스템이다.
이것은 논리적 방법과 수학적 방법이 각각 천추라는 것을 알 수 있다. 정보 분석 연구에서 그것들을 완전히 분리하기는 어렵다. 일반적으로 정성 분석은 정량 분석의 기초이며, 정성 분석의 결론에 대한 논거를 제공하고 정성 분석의 결과를 확인하는 것을 목표로 한다. 구체적인 정보 분석 활동에서 그들은 두 가지 방법을 결합하는 경향이 있다.