April 18, 2016

YodaQA - IBM 왓슨 PC용 오픈소스버전

"Yet anOther Deep Answering pipeline" 이라는YodaQA 프로젝트가 있다. 지식기반 질의응답 시스템인데, IBM 개발자들이 오픈소스로 내놓은 Apache UIMA, 그리고 스탠포드 대학에서 만든 Parser와 Solr 등을 사용한다.

자연어로 질문이 들어오면 1차적으로 파서가 형태소, 의존, 성분 등 구문 분석을 통해 Nouns, Named entities 그리고 LAT+SV (lexical answer type + selection verb) 등을 가지고 정보 검색을 수행한다. 기계학습은 Answer scoring에서 사용되는데 embedding-based selection이라고 질문의 vector embedding과 결과값을 로지스틱 회귀로 학습된걸로 일종에 분류 기반으로 랭킹하여 결과를 보여준다.

그래서 결과가 어떻냐? KB:62.9% on a collection of movie questions (Google: 59.9%). 특정 도메인에서의 정확도는 구글보다 좋다고 한다. 프로젝트 만든이와 채팅해보니 현재 Semantic Parsing 분야도 추가적으로 추진하고 있다고.

온라인 데모도 존재하는데 다음 사이트를 방문해보시라: http://ailao.eu/yodaqa/

No comments:

Post a Comment