컴퓨터 애플리케이션과 전통문화의 관계가 우리의 관심을 끌 것입니다. 한자입력의 대중화에 대한 적응의 문제와 더불어 한자정보화의 발전방향에 대한 문제도 있다. 본 글에서는 '실리코드' 작성 사례를 통해 한자 인코딩 입력 방식이 직면한 문제점과 그 해결의 근거가 되는 이론을 설명한다. 주로 구성 요소의 이름 지정 및 수량 문제와 구성 요소 글꼴을 컴퓨터 글꼴 라이브러리에 입력할 수 없는 불편함과 관련이 있습니다. 부호화에 적합한 구성요소 "니모닉"과 한자의 연관 기술 방법의 적용, 고빈도 문자 부호화를 정의하기 위한 접속사의 사용, 숫자, 천상 등 다양한 한자 유형에 대한 부호화 할당 방법을 제안한다. 줄기와 땅의 가지, 십자가가 많은 문자 모양. 디지털 혁명 속에서 전통문화의 유지와 진흥, 그리고 현대화와 전통의 유기적인 결합을 요구합니다.
지난 10여 년 동안 한자 인코딩의 선구자들은 큰 열정을 가지고 거의 모든 한자 인코딩 소리와 모양의 조합을 분석하고 요약했습니다. 그러나 대중에게 널리 인정받은 적은 없었고, 코딩은 '박수를 받았지만 호평을 받지 못했다'부터 '아무도 박수를 보내지 않았다'까지 다양했다. 언어는 전문 입력 작업자에게 의미 없는 기호일 수도 있고, 동등한 숫자로 대체될 수도 있습니다. 그러나 대중에게 언어는 생명이고 감정이며 소리, 형태, 의미의 종합이며 듣고 말하고 읽고 쓸 수 있는 전체이다.
한자의 입력방식은 단순히 문자를 처리하는 과정이 아닌 한자문화를 학습하고 전파하는 과정이다. 입력 방식을 해결하는 것은 시작에 불과하며, 중국 전통 문화를 홍보하는 컴퓨터 애플리케이션이 목표입니다.
한자 인코딩의 기본 준비
'인코딩'의 정의는 특정 규칙에 따라 지정된 코드로 정보를 할당하고, 반대 규칙에 따라 원래 정보를 복원하는 것입니다. 코딩은 언어가 아니며 대체할 수도 없습니다. 언어적 관점에서 볼 때 한자 인코딩을 위한 기본적인 준비가 아직 부족합니다.
첫째, 구성 요소에 이름이 없습니다. 국가표준 640개 부분 중 거의 절반에 가까운 한자 부분이 관례적인 발음이나 제목이 없거나 '제목'을 갖고 있음에도 불구하고 대중에게 알려지지 않아 할당 과정을 간결하고 자연스럽게 설명할 수 없다. 언어.
둘째, 해체만 하고 연결은 하지 않습니다. 중국인은 일반적으로 한자를 설명하고 해석하는 데 두 가지 방법을 사용합니다. 즉, "Mu Zi Li, Gong Chang Zhang"의 분할 방법과 "혁명 가죽, 신체"의 차용어 연결 방법입니다. 쪼개서 기술하기 어려운 '중력' 구조를 지닌 한자의 경우, 단어를 빌려 단어를 형성하는 방법이 더 많이 사용된다. 그러나 대부분의 한자 인코딩 방법은 "문자 분할"이라는 개념만을 사용합니다.
셋째, 모양과 소리의 분리입니다. 언어규칙은 "단어의 발음 기호와 발음의 통일"이다. 단순한 상징적 표현은 의사소통과 기억에 도움이 되지 않는다.
'인코딩'은 통일된 규칙에 따라 텍스트를 변환하려는 산업화 시대의 산물입니다. 전문가가 전신 코드와 다양한 비밀번호까지 마스터하는 것은 어렵지 않습니다. 일반인의 경우 능숙해지기까지는 시간이 걸리고, 적용하려면 조건이 필요합니다.
컴포넌트는 컴퓨터에 설 자리가 없습니다
컴포넌트는 한자의 기본이고, 한자를 배우고 공부하는데는 한자컴포넌트가 꼭 필요합니다. 그러나 한자성분의 실용성은 사회적 관심을 끌지 못한 것으로 보인다.
구성요소가 컴퓨터에 설치되어 있지 않습니다.
교재 내용에 구성요소 사양을 포함할 수 있나요?
컴포넌트 이름은 언제 해결되나요?
1997년 12월 국가표준 한자성분이 발표됐다. 이제 4년 이상이 지났지만 이러한 구성 요소에 대한 "글꼴 매트릭스" 표준과 소프트웨어 제품은 아직 상용 컴퓨터에서 찾아볼 수 없습니다. 따라서 전국적으로 온라인 커뮤니케이션부터 전통적인 출판까지 텍스트의 정보화, 텍스트의 유래 등 구성요소 차원에서 텍스트를 논의하기는 어렵다.
저희가 사용하는 부품 규격에는 1918년 북양정부가 발표한 표음기호를 비롯해 일반적으로 사용되는 다양한 기호와 일본어, 러시아어, 그리스 문자가 포함되어 있는데, 편차는 중국어가 없다는 뜻입니다. 전체 시스템 표면의 문자 구성 요소.
한자정보 제품도 일종의 제품이므로 모든 제품은 테스트를 거쳐야 합니다. 그러나 지금까지 공식화된 "입력 방법" 테스트를 위한 많은 표준은 어떤 의미에서는 마음대로 혁신을 원하는 "코딩" 사람들을 제한하기 위한 것일 뿐입니다. 반대로 문자정보화는 왜 아직까지 언어와 전자정보 분야에서 모두 인정받을 수 있는 표준화되고 단계별 추진계획이 없는 걸까? 이러한 종류의 계획은 공개되고 신속하게 실행되어야 할 뿐만 아니라 다양한 직업의 교차점을 고려하고 지속적으로 혁신적인 정보 기술과 사회적 요구에 적응해야 합니다.
정보화는 사회의 정보화입니다. 우리는 많은 계획을 세우고 많은 부서를 설립했지만, 사고 습관 측면에서는 여전히 정보화 문제를 해결하기 위해 전통적인 농업 방식이나 산업적 방식을 사용하려고 노력하고 있습니다. 정보화의 낙후성은 충분한 예이다.
구성 요소를 수집 및 분류하고 수량을 줄이고 범주를 늘리십시오.
정보화 시대에 이상적인 한자 디지털화를 완성하려면 문자의 "축소"도 진지하게 고려해야 합니다. 구성 요소.
군대에는 수천 명의 장교와 수백 개의 직위가 있지만, 군대 계급이 10개 이상이면 어떤 장교라도 부를 수 있고 전투에서는 낯선 사람을 지휘할 수 있다. 한자 컴포넌트에 대해서도 정보화 시대에 걸맞는 보다 합리적인 컴포넌트 분류와 명칭을 만들어야 할까.
원소의 주기율표와 원소의 이름, 기호코드 덕분에 화학반응의 발현을 촉진하고 화학이 연금술사와 연금술사의 실수에서 벗어날 수 있게 해준 것입니다. . 그렇다면 '디지털 지구' 시대에도 여전히 대중적인 발음과 표준화된 코드가 부족한 한자 구성요소가 너무 많다는 것은 '디지털화'의 공백이라고 볼 수는 없을까?
26개의 문자 할당을 사용하는 펜 모양 입력의 경우 560개의 구성 요소를 요약, 병합 및 정렬해야 합니다. 물론 여기서 요약하고 병합한다는 것은 컴포넌트 자체를 압축하거나 수정하는 것이 아니라 유사한 컴포넌트에 유사한 이름과 문자를 부여하여 "수를 줄이고 카테고리를 늘리는 것"을 완성하는 것입니다.
'한자 구성요소 규격'에서 '획 모양'이라는 용어는 일반 한자의 획 모양이 획과 방향에 따라 수십 가지 종류로 나눌 수 있음을 지적한 것이다. : 가로와 세로, 점, 접기.
저자는 펜 모양으로 보면 '가로 세로 점과 접기' 외에 카테고리가 하나 이상 더 추가될 수 있다고 생각하는데, 이를 임시로 '조합'이라고 부른다. "펜을 접어 점을 추가하는 것"을 위한 "厶?" 구성 요소도 포함되어 있습니다. 이러한 구성 요소에는 아직 이름이 없으며 "합"이라는 단어와 할당된 코드 "V"로 설명할 수 있습니다. 이렇게 하면 "교도소에 사적 방법을 사용하도록 명령한다"와 같은 한자를 쉽게 기술하고 입력할 수 있다.
'deng'과 'xue'라는 단어의 첫 번째 부분은 단독으로 사용되지 않고 항상 나머지 절반인 冖一이 따라오는데, 이는 부분 할당 측면에서 매우 불편합니다. . 꽤 많은 구성요소의 의미가 상실되었기 때문에 구성요소를 분류할 때 사용과 기억을 용이하게 하기 위해 이들을 "병합"하는 데 집중할 수 있을까요?
구성 요소의 수를 줄이고 범주를 늘리는 작업은 구성 요소 할당의 단순성을 고려해야 할 뿐만 아니라 사람들의 사고 습관에 적합해야 하며 전체 단어의 반복 할당도 피해야 합니다. 그러므로 부품명을 복원하는 일은 문학가들만의 일이 아니다. 정보계 역시 피할 수 없는 책임이 있다.
코딩에서 보조 언어까지
한자 입력 코딩은 사실상 한자와 서양 문자의 '구분'이다. '구분'은 고대 하늘의 국가, 군, 특정 지역 간의 대응에서 비롯됩니다(자해, 721쪽). 한자 부분과 서양 문자의 대응도 당연히 심오한 문화적 의미를 지닌 '구분'을 갖습니다. .
그러나 실제 작업에서 코딩은 특성화 및 디지털화의 변환 과정만 강조하고 문화적 개념과 인간 능력을 다양한 정도로 무시하는 경우가 많습니다.
한자의 정보화는 전통적인 '전자화'와 '기계화'만을 수반하는 것이 아니라 장비와 기술에 대한 난리를 피우고 있다. 한자의 정보화에는 붓시대의 쓰기론 개선도 포함되는데, 2000년의 문자적용사양에 따라 기호대체를 완전히 할 수 없고 언어적용도 할 수 없다. 1980년의 방법은 한자정보화의 기초로 활용된다. 특히, 문자가 없는 부분의 명칭을 복원하기 위해서는 한자 정보화의 기호부여를 위한 기초로 3000년 전 한자의 초기 시기와 해당 부분이 가장 활발했던 시기의 정보를 선택해야 한다.
구성요소에 이름을 붙이고 단어를 사용하여 단어를 형성
'석예코드'의 개발을 통해 한자의 정보화에 있어서 가장 중요한 과제는 '이름을 짓는 것'이라고 믿고 있다 한자의 구성요소를 발음한다. 즉, 구성요소의 "제목"을 말한다. 한자를 쓰는 전 과정을 간결한 자연어로 기술할 수 있다면 한자 입력의 인코딩은 물론, 구성요소의 '직관적인 정렬' 규칙까지 '쉽게 해결'될 것이다.
(현재 획과 획 순서는 2번 정렬되어 있습니다.)
한자 입력에 널리 사용되는 솔루션은 다음과 같은 특징을 가져야 합니다.
1. 사용되는 한자의 기본 구성 요소는 다음과 같습니다. 표준화된 이름, 대중적인 발음 또는 니모닉 사운드
2. 한자 인코딩은 값을 할당하기 위해 발음 코드 동기화 방법을 채택하고, 발음 키 코드를 누릅니다.
3. "빌려온 문자 지시" 또는 "니모닉 사운드"라고 합니다(컴퓨터 프로그래밍에서는 "니모닉 기호"라고 부르기 때문입니다).
4.
언어 기반의 입력 방식을 구현하기 위해 '실리 코드'는 9개의 발음(기억음)과 29개의 할당 코드를 잠정적으로 결정합니다. 다음을 포함하여 이름이 없거나 발음되지 않은 구성 요소:
"冫宗"의 니모닉 사운드는 "Quan"(Drip Water Spring)이고 할당된 코드는 q입니다. "Lv"(7타와 8타)는 "Qi", 할당된 코드는 "qi" 코드는 q;
서론(3타, 4타) 니모닉 사운드는 "leg", 할당 코드는 t;
博, 니모닉 사운드는 "side door", 할당 코드는 cm, 廴, 니모닉 사운드는 "scissors", 할당 코드는 jd <입니다. /p>
勹, ? 니모닉 사운드는 "fishhook"이고 할당 코드는 yg입니다.
물론 이 "기호 소리"에 대한 다른 해결책이 있습니다. 발음이 중요한 것은 아니지만 "구성 요소"를 기억하기 쉽게 만들어야 합니다. 예를 들어 "勹"도 "Bao"라는 발음을 가지고 있지만 전체적인 코딩 과제의 밸런스를 풀어야 합니다. 이 문제는 향후 구성 요소 이름 지정 시 고려해야 할 문제이기도 합니다. "컴포넌트 이름" 할당이 합리적이라면 입력 코딩 및 한자 티칭에 직접 사용할 수 있습니다.
5. 인코딩에서 일반적으로 사용되는 접속사, 대명사 및 기타 단일 문자 빈도가 높은 단어를 정의합니다.
한자는 율동적인 언어로 단일 문자, 2바이트 문자, 다중 바이트 문자가 번갈아 등장하며, 단일 문자 접속사와 대명사가 전체 텍스트의 약 7~10%를 차지합니다. 따라서 구성기호음을 활용한 기반으로 단문자 연결사를 코딩된 단문자 고주파 단어로 선택하는 것은 사용하기 편리한 혁신이다.
영문 26자의 순서에 따르면 빈도가 높은 단어는 한두 달란트, 공장, 입에 나오는 단어, 사람, 땅 등의 나무이다. , 위안 등이 핵심이자 중간입니다.
파트를 먼저 튜닝한 후 소리에 따라 코드를 할당해야 합니다. 이러한 부분으로 구성된 단어는 부분 발음(일반적으로 개방형 악센트라고 함) 시퀀스의 집합으로 표현될 수 있습니다. 예를 들어 여단의 고대 형태는 펄럭이는 군 깃발 아래에 모인 사람들의 집합이며, 그 부분은 "사각형, 소, 깃발, 사람"으로 읽혀지며 할당된 문자 순서, 즉 이니셜이 자연스럽게 형성됩니다. 자음은 다음과 같이 발음하는 데 사용됩니다: fnqr.
십자형 구조의 한자 구성요소를 단어를 빌려 단어를 구성하는 방식으로 설명하며, 실시예에서는 약 150개의 구성요소를 사용한다. 부품 및 부품 차용어 문구에 할당된 문자는 다음과 같습니다:
Leather(gmm), revolution(gm);
体(stt), body(st);< /p >
비(yll), 이슬(yl).
실리어 코드의 분류 및 배정 방법
언어학적 관점에서 보면 문자의 의미와 발음이 모두 다양합니다. 사람들은 동일한 것을 설명하기 위해 서로 다른 설명을 사용하는 경향이 있습니다. 예를 들어, 서로 다른 사람들은 같은 사람을 이름, 직위, 직위, 출신, 친척 지위, 교육 수준, 심지어는 신체적 특성까지 오해 없이 지칭할 수 있습니다. 우리도 사람들의 언어습관을 이용해 다양한 특징을 지닌 한자를 묘사할 수는 없을까? 적어도 중국 숫자, 별자리, 이름 없는 구성 요소, 중복 구성 요소 등은 서로 다른 할당 설명 방법으로 분류할 수 있습니다. 완성된 '실리코드'는 한자 구성요소를 숫자, 천간지지, 자연음, 도형, 맞춤 니모닉, 단어를 빌려 설명하는 단어로 구성하는 구성요소로 나눕니다.
숫자 구성 요소 할당 공식은 다음과 같습니다. 하나 A 둘 B 셋(시작) 연관
3은 3/4, 5는 5/10으로 읽습니다. 완전 10(8은 베이징의 BJ를 피함)
숫자 및 할당 코드는 다음과 같습니다.
One A Two B Three SS Four SW Five WL Six LQ Seven QB Eight BA Nine JS 10개의 SQ
중국어 번체 숫자는 다음과 같이 첫 번째 문자가 한 번 반복되는 유사합니다. 하나의 AAB 두 개의 BBS 10개의 SSQ
십개의 힘 코드와 전통 문화
610년 전, 우리나라 신유학의 철학적 창시자인 웅실리 선생은 창조적이고 활기차고 활력이 넘치며 자립적인 민족 문화생활을 되살리고 복원하려고 노력했습니다. Xiong Shili 선생님의 중국 문화에 대한 공헌을 기념하기 위해 이 한자 보조 언어를 "Shili Code"라고 명명했습니다.
성격 개정 시대에 우리나라의 경제 시스템 개혁은 정보 기술의 급속한 발전과 함께 중국 문화의 현대화 연구도 새로운 차원으로 끌어 올려야 합니다. 한자입력은 산업적 기호처리에서 언어와 문자의 현대화 발전범위로 전환하여 민족 전체와 역사의 요구에 부응해야 한다. 혁신적인 메커니즘을 바탕으로 글쓰기, 코딩, 소프트웨어 전공자들이 결합해 입력 방식 문제를 해결할 뿐만 아니라, 정보화 시대 중국어의 미래를 맞이할 수 있기를 간절히 바란다.
전통과 현대화의 관계, 외국문화와 지역문화의 관계를 적절하게 다루어야 한다. 중국의 민족문화가 현대화의 발전과 사회의 요구에 적응하고 변화하고 업데이트되도록 하여 전통과 현대화가 변증법적 통일을 이룰 수 있도록 해야 합니다. 어떤 빛나는 문화라도 실생활의 요구에 적응하지 못하고 혁신을 멈춘다면 창의성이 고갈되어 점차 소멸될 것입니다. 반면에 혁신은 인간 진화의 법칙에도 적응해야 합니다. 도구는 인간 능력의 확장일 뿐이며 대체물이 되어서는 안 됩니다.
문명과 문화, 전통과 진보의 문제에 직면하여 전통문화유산을 버리는 '진보'가 우리의 자랑이 될 수 있을까? 중국의 오랜 문화는 중화민족의 강력한 응집력입니다. 우리는 디지털 혁명 속에서 중국의 전통문화를 유지하고 계승해야 할 책임이 있으며, 현대화와 전통을 유기적으로 결합시키는 것이 한자 사용의 가장 중요한 부분입니다. .