1. 페이지 1 / 20
예측 분석 산업별 사례 147
-에릭 시겔, “빅데이터의 다음 단계는 예측 분석이다” p272 ~ p291
● 가정 및 개인 생활 분야
예측 대상 예측 분석 활용 사례
위치
당신이 있게 될 곳
노키아(Nokia)
-노키아는 휴대폰 추적을 통해서 미래의 사용자 위치를 예측하는 콘테스
트를 주최하였다. 이를 통해 얻은 방법론들은 부분적으로 사용자 친구들
의 행위(예를 들면 한 사람이 통화하는 사회적 접촉 대상들)를 분석에 포
함 시켜서 스위스의 특정 지역에 거주하는 사람들에 대해서 평균적으로
그들이 어디에 있게 될 것인지를 하루 전에 20미터 범위 내에서 예측할
수 있다.
마이크로소프트(Microsoft)
-GPS 데이터에 근거하여 한 사람이 몇 년 후에 어디에 있게 될 것인지를
정확하게 예측하는 기술을 개발하는 데 예측 분석을 활용하였다.
우정 페이스북(Facebook)
-당신이 알고 있을 가능성이 있는 사람들 및 연결하고 싶어할 가능성이
있는 사람들을 정확하게 추천하는 방법론을 개선하기 위한 콘테스트를 후
원 하였다.
링크드인(LinkedIn)
-당신이 알고 있을 가능성이 있는 사람들을 예측하여 추천하는 서비스가
“자신들이 만든 것들 중에서 가장 중요한 데이터 제품”이라고 말한다.
사랑 매치닷컴(Match.com)
-온라인 데이트에서 ‘지능적 소개팅’(Intelligent Matching)은 당신이 교류하
고 싶어할 가능성이 높은 상대를 예측한다.
오케이큐피드(OKCupid)
-온라인 데이트에서 어떠한 메시지가 상대방으로부터 반응을 얻을 가능성
이 가장 높은지를 예측한다.
2. 페이지 2 / 20
임신 타깃 쇼핑몰(Target)
-쇼핑 행태로부터 고객의 임신을 예측함으로써 30%나 더 많은 대상자를
찾아내어 신생아 부모의 구매욕구에 호소할 수 있는 할인쿠폰을 보낸다.
불륜 모 대학 연구진
-불륜행각은 인구사회학적 특징보다는 행태 특징에 의해서 더 정확하게
예측된다는 것을 보여주었다. 물론 유전적 요소도 영향을 준다고 하였다.
이혼 모 병원 연구진
-90% 정확도를 가지고 이혼을 예측한다.
사망 보험, 의료, 범죄 소탕 및 안전 분야 사례 참조
● 마케팅, 광고, 웹 분야
예측 대상 예측 분석 활용 사례
구매 행위
타깃 마케팅을 위
하여
프리미어 뱅크카드(PREMIER Bankcard)
-1,200만 달러의 우편홍보물 비용을 절감하였다.
퍼스트 테네시 은행(First Tennessee Bank)
-우편홍보물 비용은 20% 절감하고 반응률은 3.1% 증가하여 예측 분석에
투자된 비용 대비 600% 수익을 창출하였다.
타깃 쇼핑몰(Traget)
-예측 분석을 통해 매출액이 15~30% 증가하였다.
하버 스위트(Harbor Sweets)
-구매한 지 오래된 고객들을 다시 오게 만들기 위해서 데이터 분석을 통
해 타깃을 선정하였는데 40%라는 놀라운 반응률을 보였다.
핑거허트(FingerHut)
-타기팅으로 우편홍보물을 20% 줄여서 연간 거의 300만 달러를 절감하면
서도 수익은 오히려 더 늘어났다.
버몬트 컨트리 스토어(Vermont Country Store)
3. 페이지 3 / 20
-판매 카탈로그 발송 대상을 보다 정확하게 타기팅함으로써 데이터 분석
에 투자한 비용 대비 11배가 넘는 수익률을 거두었다.
하라스 라스베이거스(Harrah’s Las Vegass)
-이 카지노 업체는 각각의 고객들이 장기적으로 얼마나 지출할 것인지를
예측하였다(이를 고객의 ‘평생가치’라고 부르기도 한다.).
콕스 커뮤니케이션스(Cox Communications)
-구매 경향을 예측함으로써 우편홍보물에 대한 반응률이 3배 증가하였다.
특히 가정용 TV, 인터넷, 이동통신 서비스 등과 같은 커뮤니케이션 관련
제품들에 대한 요구를 예측함으로써 연간 수익률이 50%에 이르게 되었
다.
뮤추얼펀드 투자관리 회사
-평균적인 개인보다 추가적인 투자를 할 가능성이 5배나 더 높은 고객들
을 선별해 내었다.
영국의 한 슈퍼마켓
-고객들 중 19%에 대해서 그 고객이 재방문할 날짜를 정확하게 예측할
수 있었으며, 그들이 지출할 금액에 대해서 10달러 이상 차이나지 않게
정확하게 예측할 수 있었다.
엘리 타하리(Elie Tahari)
-여성 패션라인 제품에 대한 수요를 예측하였다.
구매 취소 행위
고객 유지를 위하
여
프리미어 뱅크카드(PREMIER Bankcard)
-고객 예치금 800만 달러를 이탈하지 않고 계속 보관하게 만들었다.
페덱스(FedEx)
-어느 고객이 경쟁업체로 넘어갈 것인가를 65~90% 정확도로 예측하였다.
호주 옵투스(Optus)
-이동통신 서비스의 평균 가입자보다 서비스 해지 가능성이 10배나 높은
고객을 선별해 내었다.
스프린트(Sprint)
-유선전화 서비스의 평균 가입자보다 서비스 해지 가능성이 3배나 높은
4. 페이지 4 / 20
고객을 선별해 내었다.
노르웨이 텔레로느(Telenor)
-이동통신 서비스 가입자의 이탈률을 36% 감소시켰으며 고객유치 비용
대비 수익은 11배 높아졌다.
뉴질랜드 투디그리스(2degrees)
-이동통신 서비스의 평균 가입자보다 서비스 해지 가능성이 12배나 높은
고객을 선별해 내었다.
로이드 TSB(Lloyds TSB)
-고객 이탈에 대한 예측 모델링을 개선함으로써 연간 이익이 800만 파운
드나 증가하였다.
체이스 은행(Chase Bank)
-금융 리스크 및 보험 분야 사례 참조
리드 엘세비어(Reed Elsevier)
-잡지의 구독갱신률이 16% 증가하였다.
세일즈 성공 가능
성
거래 우선순위 선
정을 위하여
IBM
-IBM 캐나다 법인은 세일즈를 위해 계획한 이벤트에 응할 참가자 목표를
83% 신뢰도를 가지고 예측하였다. 즉 “우리가 이 파티를 주최한다면 사람
들이 충분히 참가할 것인가”를 예측한 것이다. 여기에는 IBM 예측 분석
솔루션의 세일즈도 포함되어 있으므로 예측 분석을 팔기 위해서 예측 분
석을 한 것이다.
휴렛팩커드(HP)
-세일즈 담당자들에게 판매 기회를 예견해 주는 조기 경보 시스템을 구축
하여 95%의 정확도로 세일즈 노력의 결과 중 92%를 예측하였다. 또한 전
체 60%의 딜에 대해서 최종 결과까지 걸리는 시간을 예측하였다.
벨라 픽처스(Bella Pictures)
-웨딩사진 촬영 예약판매를 위해서 예비신부를 타기팅하였다.
페이첵스(Paychex)
-급여 및 인력관리 서비스 제공 업체인 이 회사는 영업 목적의 전화통화
5. 페이지 5 / 20
중 성공 가능성이 적은 통화를 예측 선별함으로써 전체 영업 목적의 통화
수를 40% 감소시킴과 동시에 전체 세일즈를 늘릴 수 있었다.
선 마이크로시스템즈(Sun Microsystems)
-전화 영업 성공률을 2배나 향상시켰다.
제품 선택
개인 맞춤화된 추
천을 위하여
아마존닷컴(Amazon.com)
-제품 추천을 통한 매출이 전체 매출의 35%를 차지한다.
넷플릭스(Netflix)
-영화 추천 능력 개선을 위한 100만 달러 상금의 콘테스트를 주최하였다.
넷플릭스 가입자들이 선택하는 영화 중 약 70%는 온라인 추천에 의한 것
이라고 한다.
영국 테스코(Tesco)
-13개국에 걸친 마트 계산대에서 연간 1억 장의 개인맞춤화된 쿠폰을 발
급한다. 예측 모델링은 그 이전의 다른 방법론들과 비교할 때 쿠폰 사용
률을 3.6배나 증가시켰다.
타깃 쇼핑몰(Target)
-제품 선별 추천 모델을 사용한 타기팅 우편홍보물로 매출이 15~20% 증
가하였다.
유에스뱅크(U.S. Bank)
-반응률이 2배 향상되었으며 투자 대비 교차판매 수익률이 5배 증가하였
다.
판도라(Pandora)
-400가지의 음악적 특성에 근거하여 음악을 추천한다.
마우스 클릭
보여줄 콘텐츠를
선별하기 위하여
구글(Google)
-사용자에게 검색 결과로 보여질 웹페이지들 중 어떤 것이 사용자의 고품
질 요구에 더 부합하는가를 예측함으로써 검색 기능을 향상시켰다.
교육 관련 한 포털
-사용자가 클릭할 가능성이 더 높은 광고를 보여줌으로써 19개월마다
100만 달러의 매출을 추가로 창출하였다.
6. 페이지 6 / 20
비효율적인 광고
광고주에게 경고하
기 위하여
구글(Google)
-새로운 광고들 중에서 어떤 것이 더 많이 후회(bounce)하게 만드는가를
예측한다(즉 사람들이 어떤 광고를 클릭한 후 즉시 이전 페이지로 다시
되돌아오는가를 분석한다.).
트윗 및 게시물의
구전 효과
노출 극대화를 위
하여
MTV
-비디오 뮤직 어워드 방송 시 해당 웹페이지의 페이지 뷰가 55% 증가하
였다.
스팸 메일
스팸 편지함에 자
동으로 집어넣기
위하여
구글(Google)
-2004년까지만 해도 상당히 높았던 지메일(Gmail)의 스팸 메일 오인율
(false positive rate)이 현재는 거의 무시해도 좋을 정도로 낮아졌다.
히트곡 및 히트 영
화
모 연구진
-기계 학습을 이용해 어떤 시나리오 대본이 할리우드의 대박 영화가 될
것인지 그리고 어떤 노래가 음원 차트에서 히트를 칠 것인지를 예측하였
다.
● 금융 리스크 보험 분야
예측 대상 예측 분석 활용 사례
자동차 충돌로 인
한 신체 상해
올스테이트(Allstate)
-2012년에 개최된 예측 모델링 콘테스트를 통해서 보험 가입 차량의 특
성들에 근거하여 신체 상채 부담금액의 예측 정확도를 3배나 향상 시켰
다.
고액의 산업재해
상해
액시던트 펀드 보험(Accident Fund Insurance)
-의료보험 가입자의 비용청구서 내용으로부터 2차적 건강 조건(예를 들면
비만이나 당뇨병 여부)을 확인한다. 이러한 조건들은 어떤 상해를 당했을
때 고액의 비용이 발생할지를 예측하게 해줌으로써, 예를 들어 보험에 가
입한 직원들 중 특정인에게 예방조치를 취하도록 할 것인지 여부를 판단
7. 페이지 7 / 20
할 수 있게 해준다.
보험 청구 인피니티 보험(Infinity Insurance)
-정부 정치 비영리단체 교육 분야 사례 “신청서 승인 및 거절” 참조
유명한 국제상선보험사
-예측 모델을 이용하여 ‘손실률’을 0.5% 낮춤으로써 거의 5천만 달러를 절
약할 수 있게 되었다.
사망 생명보험회사들
-보험가입 승인 여부 및 보험납입액을 결정하기 위해서 사망 연령을 예측
한다.
상위 5위권에 드는 미국의 한 의료보험회사
-의료 분야 사례 참조
부동산 담보대출
조기상환
체이스 은행(Chase Bank)
-어떤 주택소유자가 부동산 담보대출을 갈아타기(대환대출)하여 향후 지불
할 이자를 모조리 경쟁 은행에 가져다 줄지를 미리 알 수 있는 예측 모델
을 사용하여 수억 달러의 이익을 창출하였다.
파산(리스크) 시티그룹(Citygroup)
-30년이 넘는 기간 동안의 국제적 채무불이행 사례들에 대한 분석을 활용
하여 각 지역별로(북미 및 서유럽 지역에서는 더 세분하여 산업별로) 상
업적 신용 리스크 모델들을 개발하였다. 은행 내부에서 이러한 모델을 이
용하는 담당자들이 3천 명에 이르며 이 모델들은 20년이 넘게 이용되었
다.
캐나디안 타이어(Canadian Tire)
-리스크 관리를 위해서 신용카드 지불 연체를 예측한다.
프리미어 뱅크카드(PREMIER Bankcard)
-연체율 및 대손상각비율을 낮출 수 있었으며 1천만 달러 이상의 수익을
올렸다.
청구서 체납 브라질 텔레콤(Brasil Telecom, 지금은 Oi로 개명)
-악성 체납을 예측하여 400만 달러를 회수하였다.
8. 페이지 8 / 20
DTE 에너지(DTE Energy)
-대손상각에 대해서 선제적으로 대응하고 서비스 해지를 줄임으로써 비용
을 700% 절감하였다.
모 금융기관
-전액 상환이 불가능하다고 채무자들에게 상환금액을 조정해 주고 전액
상환이 가능하다고 예측된 채무자들에게는 조정을 해주지 않음으로써
210만 달러 규모의 손실을 줄일 수 있었다.
주식시장
(블랙박스 거래)
런던 주식 거래소(London Stock Exchange)
-런던 주식 거래소 거래량의 40%가 알고리즘 시스템에 의해서 이루어진
다.
존 엘더(John Elder)
-자신이 직접 설계한 블랙박스 거래 시스템에 자신의 전재산을 투자하였
다.
다양한 회사들
-알파지니어스(AlphaGenius), 세레벨럼 캐피털(Cerebellum Capital), 레벨리
온 리서치(Rebellion Research) 그리고 많은 회사들이 알고리즘에 의해서
거래한다.
● 의료 분야
예측 대상 예측 분석 활용 사례
사망 상위 5위권에 드는 미국의 한 의료보험회사
-말기 의료 서비스(유언장 작성 및 통증완화 치료 등)를 제공하기 위하여
건강보험 노인 가입자가 18개월 이내에 사망할 가능성을 예측한다.
영국의 리스크 프리딕션(Riskprediction.org.uk)
-사용자의 신체조건 등에 근거하여 간단한 수술, 중대한 수술, 복잡한 수
술, 복원성 대장직장절제술 같은 특수수술 등의 수술 도중에 사망할 리스
크를 예측한다.
9. 페이지 9 / 20
유행성 독감 구글 독감 트렌드(Google Flu Trends)
-(증상관 관련된) 온라인 검색 트렌드를 분석함으로써 질병통제센터보다
7~10일 앞서서 병원의 독감 환자 증가를 예측할 수 있다는 것을 보여주
었다.
유방암(D) 스탠퍼드 대학교
-예측 모델링을 활용하여 샘플 세포조직의 더 많은 요소들을 고려함으로
써 유방암을 의사보다 훨씬 더 잘 진단해 낼 수 있는 혁신적 방법론을 개
발하였다.
폐혈증 시스터즈오브머시 의료 시스템(Sisters of Mercy Health Systems)
-환자의 활력징후(vital signs) 관찰에 근거하여 심각한 폐혈증 및 패혈 소
크를 예측한다. 수용 가능한 오인율 범위 내에서 71%의 케이스를 탐지하
였다.
HIV 진행 모 연구진
질병 진행에 대한 예측 정확도를 70%에서 78%로 개선하였다.
약품 효능 화이저(Pfizer)
-환자에게 약품 투여 시 3주 이내에 호전될 확률을 예측한다.
조산 브리검영 대학 및 유타 대학
-빠르면 임신 24주차의 혈액 샘플에서 찾아볼 수 있는 펩타이드 바이오마
커(peptide biomarker)에 근거하여 조산 위험성을 80% 정도 정확하게 예
측한다.
발기부전(D) 화이저(Pfizer)
-더 효과적이고 간단한 자가진단 테스트용 5가지를 개발하였다.
병원 행정 헤리티지 프로바이더 네트워크(Heritage Provider Network)
-한 환자가 향 후 1년 동안 병원에서 지내야 할 입원 일수를 가장 잘 예
측할 수 있는 모델을 개발하기 위해서 300만 달러 상금의 콘테스트를 주
최하였다.
피츠버그 대학 메디컬 센터
퇴원 승인 여부를 결정하기 위해서 환자가 퇴원 후 30일 이내에 재입원
10. 페이지 10 / 20
할 리스크를 예측한다.
약품 미복용 FICO
-환자가 약품 처방에 따르는지를 예측한다. 이를 통해서 평균적으로 1년
에 수백일간 처방 계익을 따르지 않을 그룹을 골라낸다. 의약 처방을 따
르지 않는 행위로 인해서 미국에서만 연간 12만 5천 명의 불필요한 조기
사망과 2,900억 달러의 불필요한 비용이 발생한다.
임상실험자 모집 영국 글락소스미스클라인(GlaxoSmithKline)
-고가의 실험 약품 공급을 계획하고 할당하기 위해서 신약 임상실험에 많
이 필요한 실험 참여자의 공급량을 예측한다.
수납 오류(D) 멀티케어 의료 시스템(MultiCare Health System, 워싱턴 주에 있는 4개의
병원)
-비정상적인 계정 및 청구서를 탐지하여 연간 200만 달러에 달하는 수납
오류를 만회하였다.
다양한 건강상 리
스크
다양한 병원 및 의료센터들
-상대적으로 건강상 리스크가 높은 개인들에게 예방적 진료 및 조기 진료
를 하도록 유도하기 위해서 선도적으로 타깃 마케팅을 실행하고 있다.
테네시 주 블루크로스 블루실드 공공의료보험(Blue Cross Blue Shield of
Tennessee)
-청구 데이터로부터 개별 가입자들이 어떤 의료 서비스를 원하게 될 것인
지를 예측한다.
**(D)는 ‘예측’을 한다기보다는 ‘탐지’(detection)된 것을 의미한다.
● 범죄 소탕 및 사기 감지 분야
예측 대상 예측 분석 활용 사례
사기(D)
세금 환급
미국 국세청
-국세청 조사 담당자들은 예측 분석을 활용하여 사기로 의심되는 세금 환
급 요청서의 순위를 매김으로써 조사 건수를 늘리지 않고도 25배나 많은
탈세를 찾아내었다.
사기(D) 미국 국방성 국방재무회계 부서
11. 페이지 11 / 20
정부 대상 청구서 -공개된 보고서에서 이미 알려진 사기 사례를 대상으로 검증한 결과 그중
97%를 탐지할 수 있었다.
사기(D)
정부 계약
미국 우체국
-하청업체 계약 건 중에서 내부 공모 또는 특혜로 의심되는 건들에 대해
서 예측 분석으로 순위를 매겨서 회계감사의 가이드로 삼았다.
사기(D)
수표
시티즌스 뱅크(Citizens Bank)
-사기로 의심되는 수표들을 예측함으로써 사기로 인한 손실을 20% 절감
하였다.
사기(D)
사무장비
400억 달러 규모의 미국 보험회사
-의심스러운 보험 청구서들에 대해서 예측 분석으로 순위를 매겨서 회계
감사원들이 동일한 조사건수 대비 6.5배의 사기를 적발할 수 있었다.
사기(D)
자동차 보험 청구
서
영국의 아비바 보험(Aviva Insurance)
-신체상해가 포함된 자동차 보험 청구서의 사기를 탐지하는 방법을 개선
하여 매월 50만 파운드를 추가로 절약할 수 있었다.
사기(D)
보증 수리 청구서
휴렛팩커드(HP)
-HP의 판매대리점 및 서비스대리점들이 제출한 보증수리 청구서의 사기
여부를 탐지하여 5년간 6,600만 달러의 비용을 절약하였다.
사기(D)
직원 수당 청구
미국 우체국
-직원들의 수당청구서 중 부당한 것을 예측 분석으로 탐지하여 950만 달
러를 절약할 수 있었다.
살인 메릴랜드 주
-예측 모델을 사용하여 교도소 수감자 중에서 누가 더 살인 가해자 또는
피해자가 될 위험성이 높은지를 분석하였다.
길거리 범죄 시카고, 로스앤젤레스, 멤피스, 리치먼드, 산타크루스, 바인랜드
-범죄 발생이 예측되는 지역으로 경찰차를 미리 보내 순찰을 하도록 하였
다.
테러리스트 공격 미군
12. 페이지 12 / 20
관련자의 체포, 재판, 금전적 지원, 정치적 맥락 등의 요소에 근거하여 테
러리스트의 공격 및 무장저항세력의 활동을 예측 분석하는 연구를 수행하
고 자금을 지원한다.
행정규제 위반(D) 뉴욕 시
-타기팅된 조사를 통해서 불법 아파트 및 영업허가증 불법 양도를 5배나
더 적발하였으며 밀수한 담배를 파는 가게를 2배나 더 적발하였다.
상습범
징역형 선고 도는
가석방 결정을 위
하여
오리건 주 및 펜실베이니아 주
-판사 및 가석방 심사위원회에서 재소자들 중 누구를 얼마나 더 오래 감
금해야 할지 결정하는 데 도움을 얻기 위해서 예측 모델을 사용 하였다.
살인사건 해결 시카고 경찰청
-수사가 성과가 있을지 여부를 예측하는 데 살인사건 및 피해자의 특성이
도움이 된다는 것을 발견하였다.
보안 수준 아마존닷컴(Amazon.com)
-직원별로 적절한 수준의 보안접근 필요성을 예측한다.
해커 및 바이러스
(D)
연구진들
-어떤 온라인 행위들이 악의적 침입 및 공격이며 어떤 것들이 정당한 행
위들인지 예측하는 모델링을 만든다.
● 안전 및 효율을 위한 고장 탐지 분야
예측 대상 예측 분석 활용 사례
시스템 오류
인공위성
원자로
대형 상업용 위성 회사
-발사 후 3년 이내에 유지보수가 필요한 위성을 더 잘 예측하기 위해서
위성 배터리 고장의 패턴을 발견해 내었다.
아르곤(Argonne) 국립연구소
13. 페이지 13 / 20
도시 전력 공급
기차 궤도(D)
기차 바퀴
사무장비
신용카드 지불 시
스템(D)
건물
회사 네트워크
-원자로 고장(냉각관의 파열 등)을 예측 분석으로 모델링 하였다.
콘 에디슨(Con Edison)
-뉴욕 시의 전력 케이블 고장을 예측하고 1시간에 3번씩 운영 모니터에
표시되는 위험수위를 업데이트한다.
BSNF 철도
-심각한 열차사고의 주요한 원인인 궤도 파손을 예측 분석하여 85% 정확
도로 문제가 발생할 구체적 위치를 예측한다.
TTX
-1.5% 범위 내에서 연간 재고 및 유지보수 총액을 예상하기 위해서 수십
만 개의 열차 바퀴에 대해서 개별적으로 고장 확률을 예측한다.
포춘 500대 기업에 속하는 글로벌 테크놀로지 회사
-수리 서비스 출동 차량에 사전 적재해 놓기 위해서 프린터 및 하드 드라
이브와 같은 전자기기의 부품들 중 어떤 것들이 교체할 가능성이 높은지
를 예측한다.
주요 결제처리 서비스 업체
-거래 시스템의 비정상적 작동을 탐지하여 문제를 훨씬 신속하게 해결하
도록 한 프로젝트로 인해서 투자 대비 7배의 수익을 거두었다.
이란의 대학들
-콘크리트가 어떤 원료들로 어떻게 배합되었는지에 근거하여 그 강도를
예측하였다.
설문조사 결과 IT부서들의 18%
-예측 분석을 이용하여 단기간에 발생할 가능성이 높은 IT분야의 고장을
14. 페이지 14 / 20
경고함으로써 적절한 대처 수단을 사전에 취할 수 있도록 하고 있다.
불량부품
제조라인 품질관리
를 위하여(D)
한 세탁기 제조업체
-불량 탐지 성공률이 87%를 넘어섰다.
기름 유량
지하의 석유자원을
효율적으로 채굴하
기 위하여
국립 이란 남부 석유회사(National Iranian South Oil Company)
-신경망 분석법을 사용하여 석유 생산율을 예측한다.
고객 수요
서비스 합리화를
위하여
캐나다 자동차 협회
-고객 전화에 대한 새로운 응대 절차를 마련함으로써 서비스 출동률을
25%나 줄였고 이를 통해 인건비를 절감하면서도 불만율은 45%나 낮추었
다.
항공기 충돌시 사
망률(D)
데이터 분석 책임자
-국가교통안전국(NTSB)의 데이터를 모델링하여 평균보다 5배나 더 치명적
일 수 있는 항공기 사고를 밝혀내었다.
항공편 지연 컨티넨탈 항공(Continental Airlines)
-레이더 네트워크 데이터를 통해서 항공편의 지연을 예측하고 하늘 공간
의 활용도를 개선함으로써 수천만 달러를 절약할 수 있었다.
교통량 호주 뉴사우스웨일스 주정부
-호주 시드니 시의 M4 고속도로의 차량 이동시간을 예측하고, 예상되는
교통량 지연을 일기예보와 마찬가지로 지역별로 온라인에 게시한다.
통화 끊김 노키아 지멘스 네트워크(Nokia Siemens Networks)
-4G 이동통신 네트워크 상에서의 통화 끊김 현상을 70% 정확도로 예측
하여 서비스 이용도 및 지속성을 개선한다.
● 정부, 정치, 비영리단체, 교육 분야
예측 대상 예측 분석 활용 사례
15. 페이지 15 / 20
유권자 설득 2012년 오바마 대선 캠프
-선거운동 접촉(전화, 방문, 홍보물, TV 광고 등)을 통해서 설득할 수 있는
유권자는 누구인지, 이러한 접촉을 할 경우 역효과가 나 오히려 상대방
후보에게 투표하게 될 유권자는 누구인지를 예측하였다. 예측 모델은 접
전지역 주의 수백만 유권자들을 대상으로 한 선거운동에 활용되었고 전통
적인 선거운동 타기팅과 비교하여 “괄목할 만한 발전을 이루어내었다”.
모금 활동 샬롯데 레스큐 미션(Charlotte Rescue Mission, 노스캐롤라이나 주 샬롯데
시의 빈민구호 시민단체)
-모금운동 결과로 기부금이 거의 50% 증가하였다.
네이처 컨서번시(The Nature Conservancy, 미국의 대표적인 환경보호 단
체)
-대상자 명단 중에서 기부할 가능성이 가장 높다고 예측된 10%만을 대상
으로 우편물을 발송하여 669,000달러를 모을 수 있었다.
저스트기빙(JustGiving, 전세계의 자선단체와 기부희망자를 이어주는 온라
인 플랫폼)
-영국돈 수억 파운드에 달하는 모금활동에서 예측 분석이 핵심적 역할을
하였다고 평가하였다.
유타 대학 경영대학원
-연간 기부금 모금에 대한 반응을 예측함으로써 졸업생 동문들의 기부금
이 73% 증가하였다.
연구보조금 획득 호주 멜버른 대학
-어떤 연구보조금 신청서들이 승인될 것인지를 예측하는 예측 모델링 콘
테스트를 개최하였다.
에너지 소비 호주 에너젝스(Energex)
-호주에서 두 번째로 큰 전력회사인 에너젝스는 인프라 개발과 고객 타기
팅(에너지 소비 절감을 위한 인센티브 제공 대상 선정)을 위하여 향후 20
년의 전력 수요 증가 예측을 공간적 차원에서 시뮬레이션하였다.
소액대출 상환 불
능
키바(Kiva, 소액대출을 통해 저개발국가의 주민 자활을 돕는 미국의 비영
리단체)
16. 페이지 16 / 20
(빈곤 탈출을 위한) 소액대출 신청 프로젝트들 중에서 프로젝트 소개글에
‘학교’ 또는 ‘기계’ 등의 키워드가 미포함되어 있는지 여부 등에 따라서 평
균보다 상환 불능 가능성이 거의 두 배 이상 높은 프로젝트들을 선별한
다.
신청서 승인 및 거
절
미국 사회복지청
-신청자들 중 상당 부분을 차지하는 신체장애 지원금 신청서에 대한 승인
여부 심사기간이 한 달 넘게 걸리던 것을 한 시간 이하로 줄일 수 있게
되었다.
서비스 도움 요청 영국 BBC 방송
-각 가정의 TV 시청자들, 특히 노년층 및 장애인 중에서 디지털 TV로 전
환하는 데 기술적 지원을 필요로 할 사람들을 선별해 내었다.
학교 중퇴 미국 공립대학 위원회(American Public University System), 애리조나 주
립대학, 아이오와 주립대학, 네덜란드 아이트호벤 대학, 오클라호마 주립
대학, 앨라배마 대학
-중퇴 위기에 놓인 학생들을 예측하여 사전에 상담하고 그들이 계속 학교
에 다닐 수 있도록 도움을 제공한다.
학점
컴퓨터가 자동으로
채점할 수 있게 하
고 교수가 학문적
도움을 줄 대상을
타기팅하기 위하여
휴렛 재단(Hewlett Foundation)
-학생들이 쓴 보고서를 자동으로 채점하는 시스템을 개발하는 데 자금을
지원하였다. 그 결과로 개발된 시스템은 사람이 채점하는 것과 동일하게
정확한 채점을 할 수 있었다.
피닉스 대학
-수업별로 어느 학생이 낙제할 위험이 높은지를 예측하여 학습 코칭과 같
은 도움을 누구에게 줄 것인지 타기팅을 한다.
리오 살라도 커뮤니티 칼리지(Rio Salado Community College)
-수업 시작 8일 후 (부분적으로 온라인 활동에 근거하여) 어느 학생이 C
또는 그 이상의 학점을 얻을 것인지를 70% 정확도로 예측하고 교수에게
사전에 알려준다.
지식
교육을 위하여
<제퍼디!> 우승자
데이터 분석 전문가 로저 크레이그(Roger Craig)는 자신이 어떤 연습문제
를 틀릴 가능성이 높은지를 예측하여 <제퍼디!> 출전에 대비하는 공부시
17. 페이지 17 / 20
간을 어떻게 할애할 것인지를 타기팅하였다. 그는 역대 출전자 중 1회당
최고 상금을 획득하였으며 2011년 챔피언 토너먼트에서 승리하였다.
페이스북, 엘스비어(Elsevier), IBM, 피츠버그 학습과학센터
-수학의 대수(Algebra) 문제에 대한 학생들의 풀이 능력을 예측하는 예측
모델링 콘테스트를 주최하였다. 예측 모델링에서 맞춤화된 ‘지능적 개인교
사 시스템’은 매년 전체 학생들이 수학 공부를 위해 사용하는 시간들 중
에서 대략 2억 5천만 시간을 절약해 줄 수 있다고 평가 받고 있다.
그록킷(Grockit, SAT, ACT, GRE 등 미국의 표준시험 대비 교육업체인 카플
란 Kaplan의 온라인 플랫폼 자회사)
-시험 대비 교육업체인 그록킷은 GMAT, SAT, ACT 등의 시험에서 응시자가
어떤 문제를 틀릴 가능성이 높은지를 예측하여 각자 어떤 분야를 더 공부
해야 하는지 타기팅하도록 해준다.
● 인간 언어의 이해, 생각, 심리학 분야
예측 대상 예측 분석 활용 사례
질문에 대한 대답
(D)
IBM
-예측 모델링을 이용하여 질의응답 컴퓨터 왓슨을 개발하였고 공개방송된
퀴즈 대결에서 <제퍼디!>의 역대 최고 챔피언 2명을 이겼다.
거짓말 (D) 버펄로 대학
-연구원들은 눈동자의 움직임을 관찰하는 것만으로도 82%의 정확도로 거
짓말을 탐지해 내도록 시스템을 훈련시켰다.
모 연구진
-군대 내의 형사사건 조사에서 피의자들이 쓴 진술서에서 76%의 정확도
로 거짓말을 찾아낸다.
모욕 (D) 임페리움(Imperium)
-데이터 통합을 전문으로 하는 회사로, 블로그와 온라인 댓글에서 모욕을
구별해 내는 알고리즘을 주제로 콘테스트를 개최하였다.
부적절한 댓글 (D) 영국 BBC 방송
18. 페이지 18 / 20
-자신의 웹페이지에 어떤 댓글들이 게시되도록 허용할 것인지 예측함으로
써 모니터 요원이 상대적으로 적은 양의 댓글들에 대해서만 검토해도 되
게끔 하였다.
빈정거림 (D) 헤브루 대학
아마존닷컴에 게시된 비꼬는 서평들 중 83%를 식별해 낸다(예를 들면
“고작 이 책을 위해서 나무들이 죽어야 했단 말인가?” 등).
불만 (D) 페이팔(PayPal)
-고객의 피드백으로부터 이탈할 의사가 있는 고객을 85%의 정확도로 식
별해 낸다.
시티은행(Citybank)
-고객들의 메시지를 범주화하여 자동으로 정확한 고객지원 담당자에게 해
당 문제를 전달한다.
운전 부주의 (D) 포드 자동차(Ford Motor Company)
-데이터에 대한 학습을 통하여 주의력 분산, 피로, 또는 음주 등으로 인해
서 운전자가 주의를 기울이고 있지 않다는 것을 감지한다.
에버릿(Averitt)
-이 운송회사는 트럭 운전사의 피로를 예측하여 자동차 사고를 30% 감소
시켰다.
미 공군
-조종사의 적외선 촬영 비디오를 통해서 피로 상태를 감지하는 연구에 자
금을 지원하였다.
정신질환 (D) 온라인 프라이버시 재단(Online Privacy Foundation)
-일반적으로는 9개의 심리학적 질문을 통해서 정신질환을 판단했는데, 이
재단은 대상자의 트윗을 분석함으로써 정신질환을 예측하는 것을 주제로
한 콘테스트 개최하였다.
정신분열증 (D) 데이터 분석 전문가들 및 심리학 교수
-빈번한 대명사 사용 및 질문에 대한 짧은 대답 등으로부터 환자의 정신
분열증을 판단해 내는 방법론을 개발하여 상담기록만 가지고도 29명의
19. 페이지 19 / 20
초진 환자 중 27명을 정확하게 평가해 내었다.
뇌 활동
눈으로 본 이미지
를 재구성하기 위
하여
캘리포니아 주립대학교 버클리 캠퍼스
-대상자가 시각적으로 경험한 것을 그 사람의 뇌 활동으로부터 유추해 유
사하게 비디오로 재구성할 수 있게 하였다. 이들이 개발한 모델은 대상자
가 눈으로 본 것에 대한 뇌 활동을 예측함으로써 새로운 비디오를 볼 때
그 사람의 뇌 fMRI(기능적 자기공명영상, functional Magnetic Resonance
Imaging의 약자로, 쉽게 말해 뇌의 신경활동을 마치 비디오로 찍듯 찍는
MRI라고 할 수 있다.) 스캔을 해독할 수 있다. 대량의 비디오 라이브러리
에서 뽑은 100개의 이미지를 조합한 것을 사용자에게 보여주고 그것을
역(逆)구성한다.
생각 (D) 모 연구진
-컴퓨터로 하여금 사람의 마음을 읽게 하였다. 연구진은 당신이 특정한
사물(도구, 건물, 음식 등)을 생각할 때 뇌의 활동을 fMRI로 스캔한 뒤 그
것을 해독하도록 시스템을 훈련시켰다. 그리하여 일부 사물에 대해서는
80%의 정확도로 식별하였다.
레디카 게임스(Radica Games)
-신경망 알고리즘을 이용하여 스무고개 게임을 할 수 있는 요요 크기의
장난감인 20Q를 생산한다. 이 장난감은 사용자에게 25개의 질문을 통해
서 98%의 정확도로 당신이 생각하는 동물/식물/광물을 맞힌다. 심지어 잘
못된 답변에도 큰 영향을 받지 않는다.
● 인사관리 분야
예측 대상 예측 분석 활용 사례
사직 휴렛팩커드(HP)
-예측 모델을 통해서 전세계 35만 명의 직원들의 ‘이직 위험’을 분석해 낸
다. 그리하여 관리자들이 사전에 개입할 수 있도록 해주거나 적절한 인력
계획을 세울 수 있게 해준다. 이를 통해서 약 3억 달러의 잠재적 비용절
감 효과를 가져왔다.
위키피디아(Wikipedia)
20. 페이지 20 / 20
-위키피디아는 75만 명의 자원봉사자들이 편집에 참여하여 매년 1억
3,900만 번의 편집을 하고 매일 8,000개의 새로운 항목을 만든다. 이 자원
봉사자들 중 누가 그만둘 것인지를 예측한다.
업무성과 모 대학 연구진
-페이스북 프로필을 통해서 개인의 업무성과를 예측할 수 있다는 것을 보
여주었다. 업무성과 평가는 페이스북 프로필에서 찾아볼 수 있는 그 사람
의 성격, 예츨 들면 호기심, 상냥함, 성실함 등과 상관관계가 있다.
미군 특수부대
-지원자들 중에서 누가 이같이 특수하고 힘든 과제를 잘 수행할 수 있을
것인지, 다시 말해 수년간의 훈련에 비용을 투자할 가치가 있는 대상이
누구인지를 예측한다. 핵심 예측 변수에는 근성(IQ보다 더 유용한 예측 변
수이다.), 80회 이상의 팔굽혀펴기 능력 등이 포함되어 있다.
업무 관련 기술
(D)
링크드인(LinkedIn)
-사용자가 쓴 내용으로부터 그 사람의 업무 관련 기술을 예측하여 프로필
에 추가한다.
취업지원서 커리어빌더(CareerBuilder)
-개별 구직자마다 그가 지원할 가능성이 높은 산업/직종/직급/ 등을 예측
하여 타기팅화된 일자리 추천을 해준다.