본문 바로가기

Data Mining

[데이타마이닝] 무료 데이타 마이닝 툴


데이타 마이닝 툴 중, open source로 무료로 사용 되는 소프트 웨어들이 몇가 지 있습니다.

1. Rattle - R에서 라이브러리로 지원하는 마이닝 툴입니다. 시간 날 때 마다 Tangara와 비교해서 가면서 쓰고 있는데, GUI 형태라서 쓰기쉽고 visual이 좋다고 생각 됩니다. Graham Williams로 구글에서 검색해 보면, 저자가 rattle 이용 할 수 있는 설명서를 따로 만들어 놓은 파일도 찾을 수가 있습니다.  http://datamining.togaware.com/ 

2. Tanagra - R과는 별개로 어플리케이션이 설치가 됩니다. 이 프로그램 또한 GUI 형태라서 초보자도 쉽게 사용 할 수 있습니다. 최근까지도 개발하신 분이 꾸준히 블로그에 사용할 수 있는 예제와 문서를 update하고 있기때문에, 이 툴을 메인으로 사용하지 않더라도 학습하는 차원에서도 좋다고 생각 됩니다.  http://data-mining-tutorials.blogspot.com/

3. Rapid miner - 무료 마이닝 소프트웨어인 Weka를 기반으로 만들어 졌다고 기사를 읽은 적이 있습니다. 기존에 마이닝 툴을 많이 접해 보신 분에게는 적합할 것 같은데, 저 같은 초보자에게 잔손이 많이 가고 영문 매뉴얼 조차도 있기는 하지만, 상세하지 않기때문에 사용하기 어려운 프로그램인 것 같습니다. 최근에는 Rapid miner에서도 extension으로 R을 사용 할 수 있습니다.

4. Weka - 웨카는 ai-times 님의 블로그에 자세히 실려 있어서 link로 대체 합니다. 클릭하시면, 이동합니다. --> http://ai-times.tistory.com/category/WEKA%20(%EC%9B%A8%EC%B9%B4)%20%EC%A0%95%EB%B3%B4

5. Orange - 유럽에서는 회사에서도 이 프로그램을 많이 쓰는 것 같습니다. 포럼에도 글이 많이 올라 오고요. 하지만, 이 소프트웨어 또한 상세한 메뉴얼이 많지 않은 것이 아쉽습니다. http://orange.biolab.si/doc/

결론, 저는 쓰기 쉬운 Rattle과 Tanagra를 현재 쓰고 있습니다. 공부하면서 업무에 적용 하기 쉬운 것 같습니다.