C#으로 국문에 대한 NLP가 필요합니다.
예를 들어,
슈퍼로봇대전에 제네식 가오가이가가 참전합니다.
랑
슈퍼로봇대전에 인피니티 마징카이저가 참전합니다.
는 슈퍼로봇대전이라는 곳에 어떤 것이 참전한다는 내용은 일치하지만 '제네식 가오가이가’와 '인피니티 마징카이저’는 다르기 때문에 다른 문장이라고 판별하고 싶고,
슈퍼로봇대전에 인피니티 마징카이저가 참전합니다.
랑
슈퍼로봇대전에 마징카이저가 참전합니다.
는 다르긴하지만 '마징카이저’라는 종류가 같으므로 같은 문장으로 처리하고 싶습니다.
찾아보니 레펜슈타인 거리 측정 알고리즘 및, TextRank 알고리즘 같은 것이 있는 듯한데, 국문에 대해서도 가능한지 모르겠습니다.
아래 링크를 참고 했었지만 잘 이해가 가지 않습니다…
https://lovit.github.io/nlp/2018/08/28/levenshtein_hangle/
특히 바로 위의 깃허브 페이지는 소스를 다운받아 실행했지만 뭐가 누락되었던건지 특정 폴더를 참조하고 있더군요…
혹시 .NET으로 자연어처리 있으신 분의 경험을 여쭙니다.