코어닷 기술 블로그

코어닷 투데이에 오신 여러분 환영합니다

2018 코어닷 테크 세미나

울산에서 시작되는 코어닷 투데이의 세미나에 여러분을 초청합니다

CoreDot Tech Seminar 2018 코어닷 기술 세미나는 울산 스타트업들의 실무 개발 능력을 기초부터 최신 트렌드까지 다양한 관점에서 공유하고 나누는 자리입니다. 스타트업에 꼭 필요한 홈페이지 / API / 자연어 처리 / 딥러닝 영역의 최신 기술과 개발 노하우들을 경험해 보시길 바랍니다. 일시 : 2018.10.26. (금) ...

LDA로 해보는 Documents Autotagging

문서의 대표가 되는 단어를 어떻게 찾아볼 것인가?

LDA Autotagging process 를 알아봅시다. 본 프로젝트의 목적은 정보과 과부화되고, 정리되지 않은 관보 문서들에게, 그들이 가지고 있는 주제와 산업군을 바탕으로 검색의 용이성을 만드는데 목적이 있습니다. 본 과정을 어떻게 진행하면 좋을지 이야기해 봅시다. 사용한 라이브러리는 다음과 같습니다. 1 2 3 4 5 6 7 8 9 10 1...

LDA로 할수 있는것

LDA로 토픽모델링을 구현하면 무엇을 할 수 있나요?

본 문서는 다음과 같은 사이트를 참고하였습니다. Gensim ratsgo - 토픽모델링 LDA로 그럼 이제 무엇을 해야하나요? Gensim LDA 객체를 한번 다시 살펴봅시다. LDA 객체는 3가지 관점에서 살펴 볼수 있습니다. 첫번째는 Topic의 관점, 두번째는 documents의 관점, 그리고 마지막은 term의 관점입니다. Data...

LDA 파라미터튜닝을 도전해보자

Coherence로 살펴보는 최적화된 모형

LDA 파라미터를 튜닝해보자! 본 문서는 Topic modelling을 진행하면서, 좋은 LDA모델이 만들어 졌는가에 대한 평가기준을 만들기 위해서, 주제 일관성 이라는 개념을 가지고 저희가 설계한 모델을 평가하는 방법에 대해서 알아보려고 합니다. 사용한 라이브러 1 2 3 4 5 6 7 8 9 10 11 12 from pymongo import ...

단어의 지역표현과 백터화 그리고 데이터 전처리

빠르게 배워보는 한글의 전처리

본 문서는 다음과 같은 사이트를 참고하였습니다. https://radimrehurek.com/gensim/tut1.html https://statkclee.github.io/text/ https://ratsgo.github.io/from%20frequency%20to%20semantics/2017/03/10/freque...

LDA와 토픽 모델링에 대한 기본적인 이해

테라비이트의 텍스트 문서를 분석하는 방법

본 문서는 다음과 같은 사이트를 참고하였습니다. Gensim ratsgo - 토픽모델링 텍스트마이닝과 토픽모델링 데이터마이닝의 한 분야인 텍스트마이닝은 텍스트문서, 이메일, HTML문서와 같이 비구조화(Unstructured), 혹은 반구조화(Semi-Structured) 된 텍스트문서에서 새로운 정보를 추출하는 정보기술로, 토픽모델링은 텍스...