사는게 뭐길래/Data & Intelligence(29)
-
데이터 마이닝으로 K리그 영플레이어상 예측하기
회사에서 숙제 받았습니다. 제가 하는 일 중에 뭔가 다른 사람들에게 알려서 마케팅에 도움이 될만한 글 좀 써보라고… 그래서, 축구 + 데이터 마이닝으로 함 찾아봤습니다~~‘넷스루’라는 회사 한 번 새겨주십사~~^^ K리그에서는 매년 시즌이 끝난 후 영플레이어상과 MVP(최우수선수상)를 시상합니다. 종목에 따라 신인상이라고도 하는데 굳이 영플레이어라고 하는 이유는 데뷔 첫해의 신인뿐만 아니라 데뷔 3년차 이하의 선수들까지 수상 대상자로 하기 때문입니다. MVP는 대부분 우승 팀에서 수상자가 나오기 때문에 어느정도 뻔한 결과가 나오는 편이지만 영플레이어상은 이에 비해 객관적인 성적이 많이 반영되는 편입니다. 그렇다면, 데이터 분석 기법을 이용하여 여러 후보중에서 누가 영플레이어상을 수상할 것인지 예측할 수 ..
2016.02.05 -
진정, 개발자 구하기가 이렇게 힘든건가요?
저희 회사(넷스루, www.nethru.co.kr)에서 요즘 한 창 개발자를 구하고 있습니다. 신입도 필요하고 경력도 필요합니다. 구인 사이트에 구인공고도 내고, 헤드헌터 업체를 통해서도 알아보고... 그런데, 쉽지않네요. 이 바닥에 씨가 말랐다고들 이야기합니다. 대기업이 모두 쓸어 갔다고도 이야기합니다. 이상하죠? 우리 주변에는 자기 처우를 제대로 받지 못하는 개발자들, 자기의 특기나 적성과 거리가 멀어서 고민 많은 개발자들, 과중하고 부당한 업무와 무리한 작업여건 때문에 병들어가는 개발자들... 이런 개발자들의 이야기를 수도 없이 듣는데 말입니다. 저희 회사, 그리 큰 회사 아닙니다. 직원은 50명 정도의 창업 12년된 회사입니다. 나름 저희가 주력하는 분야에서 인정은 받고 있습니다. 급여와 근무여건..
2012.03.16 -
나의 티스토리 블로그에서 누가 무엇을 할까? - 요거, 알 수 있습니다.
간만에 울 회사(넷스루, www.nethru.co.kr) 홍보 좀 하렵니다. ^^ 아울러, 티스토리 블로그를 운영중인 블로거들에게도 좋은 놀잇거리가 될 듯 합니다. 티스토리 블로그의 스킨(Skin) 편집 기능을 이용하면, 내 블로그에 유용한 기능 몇 가지를 넣을 수 있습니다. (다른 블로그에 비해서 티스토리의 스킨 편집 기능이 좀 더 유연하고 자유롭다는 생각이 드네요.) 물론, 약간의 웹 프로그램 관련 지식이 좀 필요하긴합니다만... 그리 어렵지는 않습니다. 블로그 운영하시는 분들, 이런거 궁금하지 않으셨는지요? - 지금 내 블로그를 보고 있는 사람이 얼마나 되는지? - 어떤 글에 관심을 가지는지? - 어떤 경로나 검색어를 통해서 내 블로그로 왔는지? - 내 블로그에 와서 어떤 글들을 보았는지? - ....
2012.03.05 -
검색과 추천 -Query Suggesttion vs. Query Destination
검색에 사용되는 추천 기법들과 효과에 대해서 잘 설명한 논문이 있어서 소개합니다. 새로운 추천 기법이나 알고리즘을 소개하는 논문은 아니고, 어떤 포인트에서 어떻게 추천을 했더니, 어떠한 차이점과 효과가 있더라... 라는 내용을 담은 실험 논문입니다. "Studying the Use Of Popular Destinations to Enhance Web Search Interaction" - by Ryen White, Mikhail Bilenko, Silviu Cucerzan - SIGIR 2007 (최우수 논문으로 선정) - http://research.microsoft.com/en-us/um/people/ryenw/papers/WhiteSIGIR2007a.pdf(정보검색 분야에서 역사와 전통을 자랑하는 ..
2011.11.04 -
로그 분석을 통해 검색을 더 똑똑하게 만들 수 있는 방법 (스터디 자료 소개)
SIGIR 2011(Beijing)에서 발표된 튜토리얼 중에 검색 로그 분석을 통해 검색을 더 똑똑하게 만드는 방법들에 대한 좋은 내용이 있네요. "Enhancing Web Search by Mining Search and Browse Logs" - by Daxin Jiang, Jian Pei, Hang Li - SIGIR 2011(Beijing, July 2011) (PDF version) 링크된 PDF 문서는 파워포인트 발표자료인데, 비교적 설명이 잘 돼 있습니다. (원본 강의를 들을 수 있으면 더 좋겠는데... 쩝!) 그리고, 주요 인용 기술에 대해서는 슬라이드에 참고문헌을 잘 명시해 놓았기 때문에 좀 더 자세하게 공부하는데도 도움이 될 듯 합니다. .... 전반적인 내용은 사용자들의 검색 기록(L..
2011.10.07 -
추천 서비스의 효과를 측정하는 방법 중 하나 - Recall & Precision
추천 알고리즘의 효과 내지 정확성/유효성을 측정하는 지표 중 하나가 Recall과 Precision입니다. (업계 보다는 학계에서 주로 쓰임. 추천 시스템뿐만 아니라 유사한 여러 분야에서 쓰이는 지표라고 함) 예를 들어 설명) 1. 결혼정보 추천 시스템에서 박지성에게 {박지선, 김지선, 아이유, 유인나, 나문희}를 추천했습니다. 2. 박지성은 이사람 저사람 보다가 {아이유, 유인나, 구하라}와의 데이트를 신청했습니다. 추천 시스템에서 추천한 사람은 5명. 박지성이 선택한 사람은 3명. 박지성이 선택한 3명 중에서 추천 시스템에서 추천한 사람은 2명. 이럴 때... Precision = 박지성이 선택한 사람 중 추천 시스템에서 추천한 사람 / 추천 시스템에서 추천한 사람 = 2 / 5 = 0.4 Recal..
2011.09.08