
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
주제를 깊이 있게 다루는 블로그 피드 검색을 위한 위키피디아 기반 질의 확장 방법
송우상(Woosang Song),이예하(Yeha Lee),이종혁(Jong-Hyeok Lee),양기주(Gijoo Yang) 한국정보과학회 2010 정보과학회 컴퓨팅의 실제 논문지 Vol.16 No.11
본 논문에서는 질의로 주어진 주제를 깊이 있게 다루는 블로그 검색을 위한 위키피디아 기반 질의 확장 방법을 제안한다. 제안된 방법은 질의와 연관된 위키피디아 문서를 질의 확장에 사용한다. 실험을 위해 대규모 블로그 실험 데이터인 TREC Blogs08 collection과 영문 위키피디아 데이터를 사용하였다. 실험 결과 제안된 방법은 기존의 블로그 포스트 기반 질의 확장 방법에 비해 MAP을 비롯한 검색 성능을 큰 폭으로 향상시켰다. This paper proposes a Wikipedia-based feedback method for in-depth blog distillation whose goal is to find blogs that represent in-depth thoughts or analysis on a given query. The proposed method uses Wikipedia articles which are relevant to the query. TREC Blogs08 collection which is a large-scale blog corpus and English Wikipedia dump were used for experiments. The proposed method significantly increased the retrieval performance including MAP over the conventional postbased feedback method.
정헌영(Hun-young Jung),김준기(Jungi Kim),이예하(Yeha Lee),이종혁(Jong-Hyeok Lee) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.1C
의견의 주체를 찾는 일은 의견 분석의 결과를 활용 하는데 있어 필수적인 분야이다. 본 논문은 발안자를 찾는 시스템의 성능을 높이기 위해 이전논문에 제안하였던 단어에 의견주체의 후보로서의 점수를 부여하는 방법을 개선하였고 미등록어 문제를 해결하기 위해 taxonomy에 의존하여 기존단어의 점수를 이용하는 방법을 제안하였다. 본 논문에서 제안한 방법은 Baseline과 비교하여 F1값이 18.9% 증가하였다.
김준기(Jungi Kim),남상협(Sang-Hyob Nam),이예하(Yeha Lee),이종혁(Jong-Hyeok Lee) 한국정보과학회 2008 한국정보과학회 학술발표논문집 Vol.35 No.1
인터넷 사용의 증가로 인터넷이 사용자의 의견 표출의 장이 되었다. 이에 따라 사용자의 견해나 의견을 자동으로 인식 및 추출하는 방법들이 연구되어 오고 있다. 의견 분석 (opinion analysis)은 한국어에서는 아직 연구가 활발히 되지 않는 분야로 의견 분석에 필요한 자원 및 도구들이 미비하다. 본 논문은 다른 언어권에서 구축된 주관성 어휘를 사전을 이용해 번역하는 방법을 제시하고 문제점 및 개선 방법과 향후 연구방향에 관하여 논의한다.
의견의 주체를 찾기 위한 후보어휘의 의견주체점수 부여 방법과 Self-training
정헌영(Hun-young Jung),김준기(Jungi Kim),이예하(Yeha Lee),이종혁(Jong-Hyeok Lee) 한국정보과학회 2009 한국정보과학회 학술발표논문집 Vol.36 No.1
의견의 주체를 찾는 일은 의견 분석을 하는데 있어 중요하게 여겨지는 부분이다. 본 논문은 시스템의 성능을 높이기 위해 각 명사구에 의견주체후보로서의 점수를 부여하는 방법을 제안하였고 점수가 학습 데이터에 제약되는 문제를 해결하기 위해 Self-training을 도입하였다. 본 논문의 방법 중 의견주체의 후보점수를 부여하는 방법은 Baseline과 비교하여 정확률을 11.8% 더 높였고 Self-training 방법으로는 정확률을 0.97% 높였다. 두 방법을 동시에 사용하였을 경우 정확률이 13.2% 증가하였다.
의견 어구 추출을 위한 생성 모델과 분류 모델을 결합한 부분 지도 학습 방법
남상협(Sang-Hyob Nam),나승훈(Seung-Hoon Na),이예하(Yeha Lee),이용훈(Yong-Hun Lee),김준기(Jungi Kim),이종혁(Jong-Hyeok Lee) 한국정보과학회 2008 한국정보과학회 학술발표논문집 Vol.35 No.1
의견(Opinion) 분석은 도전적인 분야로 언어 자원 구축, 문서의 Sentiment 분류, 문장 내의 의견 어구 추출 등의 다양한 문제를 다룬다. 이 중 의견 어구 추출문제는 단순히 문장이나 문서 단위로 분류하는 수준을 뛰어 넘는 문장 내 의견 어구를 추출하는 문제로 최근 많은 관심을 받고 있는 연구 주제이다. 그러나 의견 어구 추출에 대한 기존 연구는 문장 내 의견 어구 부분이 태깅(tagging)된 학습 데이터와 의견 어휘 자원을 이용한 지도(Supervised)학습을 이용한 접근이 대부분으로 실제 적용 상의 한계를 갖는다. 본 논문은 문장 내 의견 어구 부분이 태깅된 학습 데이터와 의견 어휘 자원이 없는 환경에서도 문장단위의 극성 정보를 이용하여 의견 어구를 추출하는 부분 지도(Semi-Supervised)학습 방법을 제안한다. 본 논문의 방법은 Baseline에 비하여 정확률(Precision)은 33%, F-Measure는 14% 가량 높은 성능을 냈다.