텐서플로우를 이용한 자연어 분석기 개발 시도 시작

 

이 가격에 팔아도 될까? 사도 될까?
중고 물건을 구입하거나 판매해본적이 있다면 내가 팔 물건이 지금 얼마일까 궁금한 사람이 매우 많을것이다.

 

커뮤니티에는 중고 물건을 파는 게시판이 있는 경우가 종종 있다. 거기에 올라오는 글들을 분석하여 어떤 물건이 얼마에 팔리는지 수집 할 수 있다면 이런 고민을 할때 큰 도움이 되지 않을까는 그냥 억지로 붙인 핑계고, 내가 사고 싶은 물건이 있는데 중고장터에 새로 고침하기 귀찮아서 중고장터에 올라오는 글들을 크롤링해서 내가 원하는 물건이 올라올때 나한테 알려주는 시스템을 만들려고 한다. 그러다 보니 욕심이 나서 텐서플로우를 통한 자연어 분석을 해보려고 한다

자연어 수집->형태소 분석->텐서플로우 상태로 진행이 될 것 같다.

형태소 분석기란 한글을 음절단위로 잘라 뜻이 있는 단위로 잘라주는 분석기를 말한다. 아래와 같은 텍스트를 입력하면 다음과 같은 결과가 나온다. ( https://www.shineware.co.kr/products/komoran/ )

 

사용하던 아이폰7이 루프병에 걸려 통화가 안되어 실사용으로 사용할 전화 구합니다 

 

 

저렇게 나눈 단위로 텐서에 입력하면 판매/구매하고 싶은 물건의 이름을 추출하여 가격 별로 db에 입력하면 끝!! 이라는 간단한 프로젝트가 될 수 있기를 바란다.
일단 개요는 이렇게 간단하게 시작하고 조만간 형태소 분석기들에 대해 조사해서 공유해봐야겠다

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.