자연어처리

(주)아이와즈는 정보검색 원천 기술을 바탕으로 고객의 신뢰와 믿음을 실현하기 위한 최고의 솔루션이 될 것 입니다.

IWAZ 형태소 분석기

IWAZ 형태소 분석기는 한국어 대상 형태소 분석기로 한국어 텍스트의 형태를 분석하여, 형태별 품사를 결정하여 반환하는 솔루션이며,
분석 중 나타나는 하나 이상의 품사후보를 갖는 형태에 대해서는 중의성 해소를 통해 반드시 1개의 품사로 결정하여 표시해주도록 만들어져 있습니다.
사용자들은 이러한 분석 정보를 이용하여 복잡한 중의성 제거 과정을 프로그램에 맡기고, 빠르게 형태분석 결과를 받아 볼 수 있으므로 효율적인 시간 활용이 가능해집니다.
또한 기분석 사전에 등재되지 않은 미등록어의 경우에도 일련의 프로세스를 거쳐 산출된 1개의 품사 분석 정보를 받아볼 수 있으므로 시간 비용의 낭비를 최소화해 줍니다.

또한 IWAZ 형태소 분석기는 ㈜아이와즈만의 특화된 NER(Named Entity Recognition)과 사건 감지 및 평가(Event Detection & Evaluation) 기술을 이용하여,
사용자가 목표로 하는 콘텐츠 정보를 정확하게 분석하여 추출할 수 있게 지원합니다.
  • System Architecture IWAZ 형태소 분석기 아카이브
  • 주요기능 및 특징 - 어휘 유형별 추출 기능
    - 개체명 세부분류 편집/변환 기능
    - 비표준 한국어 품사태그 변환 기능
    - 띄어쓰기 오류 보정 기능
    - 오탈자 감지 및 교정 기능(기본 사전 및 사용자 사전 기반)
    - NER(Named Entity Recognition) 지원
    - ASCII, EUC-KR, UNICODE 16/32 지원(UTF-8,16,32)
    - UNIX/LINUX, WINDOWS 32/64BIT 지원
    - 한국어 기본어휘 지원(국립국어원 참조)
    - 미등록어 분석 기능
    - 한국어 표준 품사태그 지원(TTA.KO-11.0010)
    - 한국어 표준 어휘 의미번호 지원(국립국어원 표준국어대사전 기반)
    - 200만 Entry 이상의 기본 사전 제공
    - 기본 개체명 데이터(10만 건) 기본 제공
    - 어휘 빈도 분포 추출 기능 30만 어절/SEC의 고속분석
    - 용례검색(concordance) 지원
    - 사용자 사전 편집 및 추가
    - 도메인별 개체명 수집 기능
    - 22개 개체명 대분류 제공
  • 사용영역 - 빅데이터 활용을 위한 자동 분석 기초 단계
    - 영화 또는 제품 리뷰 및 후기에 대한 분석 및 자동 분류
    - 실시간 소셜미디어(트위터, 페이스북 등) 분석 및 활용을 위한 준비 단계