최근 관심분야인 Head noun extraction과 관련된 논문을 하나 찾았다.
하지만 역시나 Frequency base라 얼마나 효용이 있을지는 미지수다.
내부에 알고리즘만큼은 잘 사용할 법도 하다.
사실 이 논문은 이게 전부가 아닌가 싶기도 할 정도다.
1. 명사구에서 head로 사용되는 명사의 빈도를 구한다.
2. 상위 N개만 추리고 나머지는 버린다.
3. 이 중에서...
  가) 해당되는 모든 완전한 명사구를 복원한다.
  나) 각 명사구의 단어수와 빈도를 저장한다.
4. 전체 자료에서 상위 K개의 명사구를 추려 이를 Keyphrase 후보로 선정한다.
No comments:
Post a Comment