Comments (1)
해당 문제를 풀려면, 복합 명사 처리를 개선해야하는데,
일단,
ioseph=> select * from mecabko_analyze('삼성전자');
word | type | part1st | partlast | pronounce | conjtype | conjugation | basic | detail | lucene
----------+------+---------+----------+-----------+----------+-------------+-------+-----------------------+----------
삼성전자 | NNP | | F | 삼성전자 | Compound | | | 삼성/NNG/*+전자/NNG/* | 삼성전자
(1개 행)
형태로 mecab 에서 반환하는 구조로는 conjtype (연결종류)와 detail(세부분석) 로 복합어인 경우를 처리하는 작업을 더 해야합니다. 현재 모듈은 Inflect (용언 활용)에 대해서는 그 용언의 어근만 처리하는 기능을 추가했는데, 복합어인 경우는 처리하지 않았습니다.
윗 경우라면,
'개선':4 '많이':3 '삼성전자':1 '실적':2
이 결과를
'개선':5 '많이':4 '실적':3 '삼성':1 '전자':2
이렇게 중복처리해야 원하는 결과가 나올 것 같습니다.
아직까지는 개선 계획이 없습니다. 긴 여름 휴가가 있으면 그 때 심심하면 한 번 도전해 보겠습니다.
from textsearch_ko.
Related Issues (5)
- 안녕하세요 설치 관련 문의입니다. HOT 3
- 안녕하세요 rank 관련 질문드립니다.
- 형태소 분석 오류가 납니다. HOT 3
- 문의 드립니다. HOT 5
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from textsearch_ko.