본문 바로가기

....?

통제어휘집

http://roconeco.springnote.com/pages/713739

어휘통제
- 시스템을 설계할 때 특정용어를 인식하도록 설계하고, 사용자들에게 탐색과정에서 이러한 용어를 사용하는 것.
- 필요성 : 검색 시스템의 일관성 부여, 탐색/검색이 효율적

통제언어의 이용
- 자연어에서 발생되는 동의어, 동형이의어, 문맥상의 모호성 등의 문제를 해결하여 정보검색 시스템에서 색인자의 언어와 시스템, 이용자의 언어를 일치시키는데 목적이 있다.

통제어휘집 사용
- 색인어 혹은 탐색어의 선택을 위해 이들 어휘를 모아놓고, 어휘간의 관계를 나타내주는 통제어휘집 사용.

색인언어의 종류에 따른 통제어휘집 분류
- 분류시스템 : 분류표
- 주제명 색인 : 주제명표
- 키워드 색인 : 시소러스

통제어휘집
- 어휘간의 개념적인 주제로 주로 동등관계, 계층관계, 연관관계를 제시하며, 어휘통제를 통해 같은 개념을 한가지 어형으로 표현할 수 있도록 한다.

통제언어의 장점
- 자연어에 비해 효율적으로 검색 가능

통제언어의 단점
- 자연어에 비해 특정성이 부족하여 주제를 구체적으로 표현이 어려움
- 새로운 단어나 구가 생성되어도 즉시 반영이 어려워 최신성이 떨어짐
- 탐색자가 통제어휘에 대한 지식을 가지고 있어야만 효율적인 검색이 가능


자연어 색인
- 문헌의 내용을 분석한 후 추출된 주요 개념을 나타내는 단어나 문구 등의 자연어 그대로를 색인어로 채택되는 방법
- 문헌에 나타나는 용어나 색인자가 임의로 부여한 용어가 전혀 통제를 받지 않고 그대로 색인어로 사용되기 때문에, 같은 개념이 여러개의 다른 용어로 표현될 가능성이 있다.
- 자연어 색인은 미리 정해진 색인어를 대상으로 하는 것이 아니라, 제목이나 초록 본문에서 자연어로 기술된 단어를 이용
- 용어색인, 자유색인 이라고도 함