SlideShare ist ein Scribd-Unternehmen logo
1 von 40
Downloaden Sie, um offline zu lesen
머신러닝 프로세스와
산업별 애플리케이션
• ㈜위세아이텍
• 김종현
2017.11.10
빅데이터컨퍼런스
데이터 전처리 모델학습 예측
5
• NASA 제공 Turbofan engine 가동 가능 시간 시뮬레이션 센서 데이터
https://ti.arc.nasa.gov/tech/dash/pcoe/prognostic-data-repository/
6
• 엔진 100개 별로 엔진 고유 번호, 가동 횟수, 가동 값 3개와 21개의 센서 값으로 구성
• 각 엔진은 다른 온도 환경에서 실험을 수행
…
…
…
7
학습데이터
20,631건
테스트데이터
100건
8
18.48 20.78
31.97 32.04 32.60 34.42 35.09 37.91
45.73
0
5
10
15
20
25
30
35
40
45
50
Tensorflow Deep
Learning
XGBoost Ridge Linear Regression Gradient Boosting Lasso Random Forest Bagging AdaBoost
Root Mean Squared Error
▪ 값이 작을 수록 정밀도가 높음
9
개발 알고리즘 성능 비교
통계적 분석
머신 러닝
(Distributed Random Forest)
Deep Learning
기존 통계적 분석 방법에 비해
머신러닝과 딥러닝 모델에서 우수한 성능을 얻을 수 있음
10
테스트 데이터 예측 결과
유지보수비용
시간
고장나기 시
작하는 시점
조기신호1
조기신호2
조기신호3
소음발생
발열
고장
기
계
상
태
예측정비시점
예방정비
•
예측정비
설비및장비에부착된
센서에서 각종운영관련
데이터 수집과데이터전처리
ACQUIRE ANALYZE ACT
장비모니터링과장비
정보와의통합분석을
통한미래고장시점예측
정비·서비스계획을
최적화
도입효과
44% 감소된 설비 고장 시간
감소된 연간 정비 및 서비스 비용 17%
28% 증가된 자산 수익률
* 출처:SAPPerformance Benchmarking
현
상
문
제
점
군 장비 정비 유지비
증가 추세
예방정비로 인한 가동률 저하
과잉 정비 가능성 존재
정비비용 증가
수
리
부
속
품
머신러닝을 통한 품목별 적정 재고량 예측
자산 비중과 창고 면적 감소를 통한 장비 유지비 감소
최적의 납기를 통한 전투력 상승
머신러닝을 통한 품목별 정확한 정비 예측
정비의 최적시점 제시로 군장비 가동률과 전투력 상승
불필요한 예방정비를 제거함으로써 운영유지 감소
정
비
예
측
정
비
기종 모델명 부품명
운행거리
(km)
온도 위치 점검일자 등록부대
권장
교체주기
등록일자
전차 K1 궤도 1,100,000 80 강원 2017.03.14
OO사단
-OO부대
2017.06.23 2017.03.14
전차 K1 주포 2,378,000 85 강원 2017.04.10
OO사단
-OO부대
2017.09.14 2017.04.10
전차 K1A1 연료탱크 1,254,458 91 강원 2017.03.14
OO사단
-OO부대
2018.07.11 2017.03.14
전차 K2 엔진 980,000 78 강원 2017.03.14
OO사단
-OO부대
2019.11.25 2017.03.14
전차 K2 변속기 1,120,000 81 경기 2017.03.14
OO사단
-OO부대
2020.03.22 2017.03.14
정비수요 예측 알고리즘
설계한 모델을 이용하여 품목별 정비수요를 예측
궤도
Vendor에선 2017.06월 교체를 예상하였으나,
예측 결과 2017.09월까지 문제 없이 사용 가능합니다.
연구내용
고장코드 고장빈도(건) 비정형분석(건) 가중치
94-31-05 4 16 0.16
81-14-0D 559 16 0.16
94-34-02 438 16 0.16
93-41-22 96 7 0.07
83-53-01 1 7 0.07
가중치 산정 예시(열차고장)
연구내용
리스크 감시서버
FT-XML File
ET-XML File
열차접근확인장치
터널경보장치
열차 상태정보
지장물검지장치
선로상태
상시감시장치
끌림검지장치
리스크 산출(상세정보 조회 가
능)
DDS DDS
실시간 리스크 감시
고장설비/차량 위치정보
연구내용
실 시 간 열 차 운 행 (2017.08.01 오전 10:52:06)
실 시 간 이 벤 트 (2017.08.01 오전 10:52:06)
하행
상행
101 103 105 291 107 109 111 113 115 117 119 121
127 129 131 133 135 293 137 295 139 4065 141 143 145 147
149 151 153 157 159 4063 161 163 165 167 169 171 173
102 104 106 108 110 112 114 116 118 120 122 292 124 126
128 130 132 134 136 138 140 142 4062 144 146 148 294 150
296 152 154 4068 156 158 160 162 164 166 168 170 172 174
123 125
수신시각 편성번호 열차번호 고장코드 조치
2017-08-01 10:52:06 1C3004 123 D1-12-09
2017-08-01 10:48:32 1C3004 123 D1-12-09
2017-08-01 10:33:10 1C3004 123 D1-12-09
2017-08-01 10:32:02 1C1038 121 C6-81-05 정상 확인
2017-08-01 10:31:32 1C1038 121 C6-81-05 정상 확인
2017-08-01 10:31:10 1C1038 121 C6-81-05 정상 확인
2017-08-01 10:30:45 1C1038 121 C6-81-05 정상 확인
2017-08-01 10:30:44 1C1038 121 C6-81-05 정상 확인
위험
경고
주의
2017-08-01 10:07:55 1C2014 124 C6-81-05
향후 계획
*한국철도시설공단 요청으로 구간 외 설치 시 서원주~강릉으로 확대 가능
경부고속선 BigData로 Model 구축
사고 발생 원인 : 인적 오류 70%
22
분야별 부정수급 환수금액
<국가권익위원회 자료 (2013.10~2016.10) >
*출처
Research and market - Global Fraud Detection and Prevention (FDP) Market Trends and Forecasts (2016 – 2021)
Markets and Markets - Fraud Detection & Prevention And Anti Money Laundering Market
<청구패턴 분류> <청구다발생 고객 프로파일링>
27
고객데이터에 대해 클러스터링 기법을 적용하여 유사도를 기준으로 동질 유형을 분류
GROUP A
지역 고객연령 구매금액 고객 행위
가입
이력
구매
이력
결재
내역
… 1
:
9
광역
시
40대미만 1만원▲
패턴#1
패턴#3
패턴
#5
2만원▲
패턴#2
50대미만 :
60대이상 :
패턴#4
시 40대미만 :
패턴#6
고객 유형별
변수 통계량 분석
GROUP Z
[ 고객패턴의 유형 분류 ]
고객 특성
내역
Clustering
GROUP B
ROOT
전체회원
20만명
GROUPD-E
20대 여성
5만명
GROUPB-C
게임
5만명
GROUPC
멀티
2만명
GROUPZ
개인화
5만명
GROUPB
가정용
3만명
GROUPA-C
3O대 남성
10만명
GROUPA
운동
5만명
GROUPD
싱글
2만명
GROUPE
맘
3만명
28
통계기반인 카테고리 TOP 10 이내 상품, 상품기반 추천을 혼합하여 상품상세와 주문내역 페이지에 노출시킴
Web Mobile
30
재무데이터는일정시점별로
생성됨
소수전문가의
주관적인의견에의존
산업 추이 예측불가
“산업별 부실관리가경제위기로”
Bigdata
오픈된빅데이터의사용
기계학습및딥러닝기법을통한
높은예측력
AI
1. 실시간위험도예측
2. 예측정확도향상
32
적조 조기경보
데이터 수집
• 현장시료채취
• 위성,선박관측자료
• 해양기상통계자료
기존 자료 분석
• 국내외기상데이터
• 적조발생양상
• 적조생물증식매커니즘
예측모델 작성
• 최적시나리오작성
• 현장요인비교
적조 예보
• 1~4단계예보
• 사전피해대비
산업경제 위기 조기경보
빅데이터 
경제체감지수 산출
• 빅데이터수집및가공하여
경제체감지수산출
체감지수+금융/실물지수
경제융합지수도출
• 경제체감지수및
금융/거시지수융합을통한
경제융합지수도출
인공지능 기반
경제 위기패턴 학습
• 과거경제위기패턴을
인공지능기반으로학습
실시간 경제위기
진단 및 리포팅
• 경제위기진단시스템을통해
실시간산업경제위기진단및
진단결과리포팅
33
과거 경제위기 관련 데이터
80년도
경제위기
08년도
금융위기
97년도
IMF
시간
국내
경제위기
그리스
경제위기
지역
영국
브렉시트
학습된
경제위기패턴
인식모듈
경제위기 패턴 학습 및 진단
인공지능 기반 분석, 패턴 학습을 통하여
현재 시점의 위기상황 추정 및 조기경보 가능
정형 데이터 실시간 비정형 데이터
산업경제 빅데이터
-SNS
-경제기사
-취업포탈
-전문가
경제동향보고서
-경제연구소보고서
-금통위
통화정책결정문
-etc…
-경제성장률
-GDP
-물가상승률
-실업률
거시변수 미시변수
-기업매출액
-기업순이익
-기업성과
-전력소비량
-경상수지
-코스피지수
-생활물가지수
-etc…
34
거시 데이터
거시+빅 데이터
빅 데이터
거시 데이터 빅 데이터 거시+빅데이터
True Signal 0.5 0.3333 0.6250
NSR 0.0296 0.0222 0.0237
35
2000년 1월 2일 ~ 2016년 11월 10일
분야 기사 수 (개)
증권 3,996,738
금융 1,108,919
부동산 755,584
산업/재계 2,520,896
글로벌경제 678,914
경제 일반 4,151,425
생활 경제 261,485
중기/벤처 72,214
총합 13,546,175
중국 시장 한국 수출
생산 국내 미국 업체
공장 자동차 성장 달러
세계 판매 제품 글로벌
지난해 대다 투자 현지
해외 올해 진출 이다
따르다 일본 증가 확대
업계 기술 산업 유럽
규모 전망 전략 현대차
지난 늘다 크다 감소
기아차 수입 공급
전기차 수요 만대 대비
배터리 점유 보이다
형태소 품사 분석
(PoS tagging)
의미 단위 파싱
(parsing)
스팸 단어 및
저빈도 단어 제거
단어 인덱싱
(Indexing)
기사 원문 전처리된 데이터
36
빅데이터로 보는 경제전망
경제감성컨셉추출 국가별유사위기사례
분석
금융/실물부문별전망경제위기융합지수
경제여론및감정분석
경제위기패턴분석
정책 당국 기업 및 가계
체감경기의
과학적분석에활용
경제주체소비및투자
의사결정에 활용
실시간
산업경제위기조기대응
Web/Mobile을 통한
신속하고정확한정보제공
• 데이터량 증대와 데이터 융합은 데이터품질을 저하시킴
데이터 정비 데이터 정제
지속적인 수정과 확인
하루 2-3회 칫솟질
오류제거
정기적인 치과 방문
예방 45% 10%
탐지 30% 30%
수리 25% 60%
• 데이터는 치아와 같아서 정비하지 않으면 부패된다
날짜, 코드 데이터 규칙 적용
날짜
코드
4/32, 20170300
성별코드 : M, F, Z, 0
➢ 단일 항목 탐지
수치 이상값 탐지 : 아웃라이어
볼트 해제시간 :
10분이내
정상값
이상값
볼트 해제시간 :
12분 이상
이상값
➢ 상관관계 복수 항목 탐지
텍스트 클러스터링
볼트 해제시간 :
08분 이상
정비경력 10년
문서
비정형텍스트
분석 기술
39
데이터 값 일치화 데이터 병합
40
• 데이터경제 시대에서 AI 적용 비즈니스와 가능한 목표를 명확히 설정
• 데이터기반의 새로운 서비스 시장과 고용이 창출됨
• 머신러닝 프로세스에서 데이터전처리의 비중이 80%임

Weitere ähnliche Inhalte

Ähnlich wie 머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표

Smart manufacturing using i io t ai big data
Smart manufacturing using i io t ai big dataSmart manufacturing using i io t ai big data
Smart manufacturing using i io t ai big dataS.K. Cha of ACS in Korea
 
LH Smartcity for osgeo
LH Smartcity for osgeoLH Smartcity for osgeo
LH Smartcity for osgeossuser3b2776
 
[Pgday.Seoul 2018] Greenplum의 노드 분산 설계
[Pgday.Seoul 2018]  Greenplum의 노드 분산 설계[Pgday.Seoul 2018]  Greenplum의 노드 분산 설계
[Pgday.Seoul 2018] Greenplum의 노드 분산 설계PgDay.Seoul
 
2. KSB 인공지능 기계 고장진단 솔루션.pdf
2. KSB 인공지능 기계 고장진단 솔루션.pdf2. KSB 인공지능 기계 고장진단 솔루션.pdf
2. KSB 인공지능 기계 고장진단 솔루션.pdfssuserde0b2d
 
RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개Lee Sangboo
 
주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)Seung-Woo Kang
 
PPT for real time IoT based production management use cases in 2014 manufactu...
PPT for real time IoT based production management use cases in 2014 manufactu...PPT for real time IoT based production management use cases in 2014 manufactu...
PPT for real time IoT based production management use cases in 2014 manufactu...S.K. Cha of ACS in Korea
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdfYunjeong Susan Hong
 
ARE YOU READY? : INCIDENT RESPONSE READINESS
ARE YOU READY? : INCIDENT RESPONSE READINESSARE YOU READY? : INCIDENT RESPONSE READINESS
ARE YOU READY? : INCIDENT RESPONSE READINESS현우 신
 
[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료
[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료
[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료오윤 권
 
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스HELENA LEE
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집ABRC_DATA
 
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2Donghan Kim
 
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017Amazon Web Services Korea
 
KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0Lee Sangboo
 
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발ABRC_DATA
 
빅데이터로 진화하는 세상
빅데이터로 진화하는 세상빅데이터로 진화하는 세상
빅데이터로 진화하는 세상영훈 김
 
플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0Lee Sangboo
 

Ähnlich wie 머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표 (20)

Smart manufacturing using i io t ai big data
Smart manufacturing using i io t ai big dataSmart manufacturing using i io t ai big data
Smart manufacturing using i io t ai big data
 
LH Smartcity for osgeo
LH Smartcity for osgeoLH Smartcity for osgeo
LH Smartcity for osgeo
 
[Pgday.Seoul 2018] Greenplum의 노드 분산 설계
[Pgday.Seoul 2018]  Greenplum의 노드 분산 설계[Pgday.Seoul 2018]  Greenplum의 노드 분산 설계
[Pgday.Seoul 2018] Greenplum의 노드 분산 설계
 
Mes iot ai in smart factory
Mes iot ai in smart factoryMes iot ai in smart factory
Mes iot ai in smart factory
 
2. KSB 인공지능 기계 고장진단 솔루션.pdf
2. KSB 인공지능 기계 고장진단 솔루션.pdf2. KSB 인공지능 기계 고장진단 솔루션.pdf
2. KSB 인공지능 기계 고장진단 솔루션.pdf
 
RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개RealDisplay Platform V1.5 소개
RealDisplay Platform V1.5 소개
 
주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)주가_변화시점탐지(Change point Detection)
주가_변화시점탐지(Change point Detection)
 
PPT for real time IoT based production management use cases in 2014 manufactu...
PPT for real time IoT based production management use cases in 2014 manufactu...PPT for real time IoT based production management use cases in 2014 manufactu...
PPT for real time IoT based production management use cases in 2014 manufactu...
 
데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf데이터드리븐 DX 추진방안_202306.pdf
데이터드리븐 DX 추진방안_202306.pdf
 
ARE YOU READY? : INCIDENT RESPONSE READINESS
ARE YOU READY? : INCIDENT RESPONSE READINESSARE YOU READY? : INCIDENT RESPONSE READINESS
ARE YOU READY? : INCIDENT RESPONSE READINESS
 
[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료
[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료
[한국 IBM 권오윤] H2O.ai DriverlessAI 소개자료
 
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
8월 24일 인공지능사업화 세미나: 로봇 어드바이저리 - 크래프트 테크놀로지스
 
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집인공지능-빅데이터연구센터[ABRC] 산학협력사례집
인공지능-빅데이터연구센터[ABRC] 산학협력사례집
 
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2 Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
Big data on 제조 글로벌 제조사 품질 개선 사례-Dhan-kim-2013-7-2
 
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
클라우드를 통한 엔터프라이즈 산업 변신 사례 - AWS Summit Seoul 2017
 
KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0KOPENS OI SOLUTION v1.0
KOPENS OI SOLUTION v1.0
 
JMTLogistic.pdf
JMTLogistic.pdfJMTLogistic.pdf
JMTLogistic.pdf
 
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
빅데이터 윈윈 컨퍼런스_빅데이터 기반 지능형 도시가스 배관 위험 예측 기술 개발
 
빅데이터로 진화하는 세상
빅데이터로 진화하는 세상빅데이터로 진화하는 세상
빅데이터로 진화하는 세상
 
플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0플랜트펄스 IoT 플랫폼 소개서 - V6.0
플랜트펄스 IoT 플랫폼 소개서 - V6.0
 

Mehr von eungjin cho

하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV
하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV
하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHVeungjin cho
 
사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석
사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석
사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석eungjin cho
 
우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사
우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사
우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사eungjin cho
 
데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장
데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장
데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장eungjin cho
 
클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무
클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무
클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무eungjin cho
 
빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사
빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사
빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사eungjin cho
 
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장eungjin cho
 
모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표
모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표
모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표eungjin cho
 
챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사
챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사
챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사eungjin cho
 
인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장
인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장
인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장eungjin cho
 
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수eungjin cho
 
빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장
빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장
빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장eungjin cho
 
DATA ECO와 연결의 힘 - SKT 김성우 랩장
DATA ECO와 연결의 힘 - SKT 김성우 랩장DATA ECO와 연결의 힘 - SKT 김성우 랩장
DATA ECO와 연결의 힘 - SKT 김성우 랩장eungjin cho
 
예측 분석 산업별 사례 147
예측 분석 산업별 사례 147예측 분석 산업별 사례 147
예측 분석 산업별 사례 147eungjin cho
 
예측 분석이 발견한 이상하고 놀라운 인간 행동들
예측 분석이 발견한 이상하고 놀라운 인간 행동들예측 분석이 발견한 이상하고 놀라운 인간 행동들
예측 분석이 발견한 이상하고 놀라운 인간 행동들eungjin cho
 
로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권
로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권
로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권eungjin cho
 
4대 핀테크 동향과 금융산업의 파급영향
4대 핀테크 동향과 금융산업의 파급영향4대 핀테크 동향과 금융산업의 파급영향
4대 핀테크 동향과 금융산업의 파급영향eungjin cho
 
국내 로보어드바이저 시장 현황 뉴스 정리 201604
국내 로보어드바이저 시장 현황 뉴스 정리 201604국내 로보어드바이저 시장 현황 뉴스 정리 201604
국내 로보어드바이저 시장 현황 뉴스 정리 201604eungjin cho
 
저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다eungjin cho
 
Fintech overview 페이게이트 박소영대표 20151006_v5
Fintech overview 페이게이트 박소영대표 20151006_v5Fintech overview 페이게이트 박소영대표 20151006_v5
Fintech overview 페이게이트 박소영대표 20151006_v5eungjin cho
 

Mehr von eungjin cho (20)

하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV
하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV
하이퍼바이저 라이선스 비용이 없는 뉴타닉스 AHV
 
사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석
사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석
사례로 보는 사물인터넷(IoT) 데이터 품질관리 - 비투엔 김영석 수석
 
우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사
우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사
우리가 스마트시티를 만들어가는 방법, '데이터 시각화' - 뉴스젤리 정병준 대표이사
 
데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장
데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장
데이터 가공(DMP)와 스마트 시티 - 엔코아 김옥기 센터장
 
클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무
클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무
클라우드와 오픈소스 DBMS의 만남 - 큐브리드 오명환 상무
 
빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사
빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사
빅데이터 기반의 홈 IoT 모델 구축 - 코오롱베니트 김종혁 박사
 
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
고성능 빅데이터 수집 및 분석 솔루션 - 티맥스소프트 허승재 팀장
 
모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표
모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표
모바일VR 사용자 인터페이스를 위한 데이터 기반 기계 학습 - 딥픽셀 이제훈 대표
 
챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사
챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사
챗봇의 활용, 어디에서 도입하면 좋은가? - 와이즈넛 장정훈 이사
 
인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장
인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장
인메모리 DBMS기반 보안 빅데이터 분석 솔루션 개발 사례 - 리얼타임테크 한혁 연구소장
 
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
의료사업 선진화를 위한 빅데이터 분석 - 서울아산병원 심우현 교수
 
빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장
빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장
빅데이터를 이용한 예측분석의 이슈와 트랜드 - 아시아나IDT 이훈석 ICT융합연구소장
 
DATA ECO와 연결의 힘 - SKT 김성우 랩장
DATA ECO와 연결의 힘 - SKT 김성우 랩장DATA ECO와 연결의 힘 - SKT 김성우 랩장
DATA ECO와 연결의 힘 - SKT 김성우 랩장
 
예측 분석 산업별 사례 147
예측 분석 산업별 사례 147예측 분석 산업별 사례 147
예측 분석 산업별 사례 147
 
예측 분석이 발견한 이상하고 놀라운 인간 행동들
예측 분석이 발견한 이상하고 놀라운 인간 행동들예측 분석이 발견한 이상하고 놀라운 인간 행동들
예측 분석이 발견한 이상하고 놀라운 인간 행동들
 
로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권
로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권
로보 어드바이저가 이끌 자산관리 시장의 변화 유진20160608증권
 
4대 핀테크 동향과 금융산업의 파급영향
4대 핀테크 동향과 금융산업의 파급영향4대 핀테크 동향과 금융산업의 파급영향
4대 핀테크 동향과 금융산업의 파급영향
 
국내 로보어드바이저 시장 현황 뉴스 정리 201604
국내 로보어드바이저 시장 현황 뉴스 정리 201604국내 로보어드바이저 시장 현황 뉴스 정리 201604
국내 로보어드바이저 시장 현황 뉴스 정리 201604
 
저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다저성장 시대 데이터 경제만이 살길이다
저성장 시대 데이터 경제만이 살길이다
 
Fintech overview 페이게이트 박소영대표 20151006_v5
Fintech overview 페이게이트 박소영대표 20151006_v5Fintech overview 페이게이트 박소영대표 20151006_v5
Fintech overview 페이게이트 박소영대표 20151006_v5
 

머신러닝 프로세스와 산업별 애플리케이션 - 위세아이텍 김종현 대표

  • 1. 머신러닝 프로세스와 산업별 애플리케이션 • ㈜위세아이텍 • 김종현 2017.11.10 빅데이터컨퍼런스
  • 2.
  • 4.
  • 5. 5 • NASA 제공 Turbofan engine 가동 가능 시간 시뮬레이션 센서 데이터 https://ti.arc.nasa.gov/tech/dash/pcoe/prognostic-data-repository/
  • 6. 6 • 엔진 100개 별로 엔진 고유 번호, 가동 횟수, 가동 값 3개와 21개의 센서 값으로 구성 • 각 엔진은 다른 온도 환경에서 실험을 수행 … … …
  • 8. 8 18.48 20.78 31.97 32.04 32.60 34.42 35.09 37.91 45.73 0 5 10 15 20 25 30 35 40 45 50 Tensorflow Deep Learning XGBoost Ridge Linear Regression Gradient Boosting Lasso Random Forest Bagging AdaBoost Root Mean Squared Error ▪ 값이 작을 수록 정밀도가 높음
  • 9. 9 개발 알고리즘 성능 비교 통계적 분석 머신 러닝 (Distributed Random Forest) Deep Learning 기존 통계적 분석 방법에 비해 머신러닝과 딥러닝 모델에서 우수한 성능을 얻을 수 있음
  • 13. 설비및장비에부착된 센서에서 각종운영관련 데이터 수집과데이터전처리 ACQUIRE ANALYZE ACT 장비모니터링과장비 정보와의통합분석을 통한미래고장시점예측 정비·서비스계획을 최적화 도입효과 44% 감소된 설비 고장 시간 감소된 연간 정비 및 서비스 비용 17% 28% 증가된 자산 수익률 * 출처:SAPPerformance Benchmarking
  • 14. 현 상 문 제 점 군 장비 정비 유지비 증가 추세 예방정비로 인한 가동률 저하 과잉 정비 가능성 존재 정비비용 증가 수 리 부 속 품 머신러닝을 통한 품목별 적정 재고량 예측 자산 비중과 창고 면적 감소를 통한 장비 유지비 감소 최적의 납기를 통한 전투력 상승 머신러닝을 통한 품목별 정확한 정비 예측 정비의 최적시점 제시로 군장비 가동률과 전투력 상승 불필요한 예방정비를 제거함으로써 운영유지 감소 정 비 예 측 정 비
  • 15.
  • 16. 기종 모델명 부품명 운행거리 (km) 온도 위치 점검일자 등록부대 권장 교체주기 등록일자 전차 K1 궤도 1,100,000 80 강원 2017.03.14 OO사단 -OO부대 2017.06.23 2017.03.14 전차 K1 주포 2,378,000 85 강원 2017.04.10 OO사단 -OO부대 2017.09.14 2017.04.10 전차 K1A1 연료탱크 1,254,458 91 강원 2017.03.14 OO사단 -OO부대 2018.07.11 2017.03.14 전차 K2 엔진 980,000 78 강원 2017.03.14 OO사단 -OO부대 2019.11.25 2017.03.14 전차 K2 변속기 1,120,000 81 경기 2017.03.14 OO사단 -OO부대 2020.03.22 2017.03.14 정비수요 예측 알고리즘 설계한 모델을 이용하여 품목별 정비수요를 예측 궤도 Vendor에선 2017.06월 교체를 예상하였으나, 예측 결과 2017.09월까지 문제 없이 사용 가능합니다.
  • 17.
  • 18. 연구내용 고장코드 고장빈도(건) 비정형분석(건) 가중치 94-31-05 4 16 0.16 81-14-0D 559 16 0.16 94-34-02 438 16 0.16 93-41-22 96 7 0.07 83-53-01 1 7 0.07 가중치 산정 예시(열차고장)
  • 19. 연구내용 리스크 감시서버 FT-XML File ET-XML File 열차접근확인장치 터널경보장치 열차 상태정보 지장물검지장치 선로상태 상시감시장치 끌림검지장치 리스크 산출(상세정보 조회 가 능) DDS DDS 실시간 리스크 감시 고장설비/차량 위치정보
  • 20. 연구내용 실 시 간 열 차 운 행 (2017.08.01 오전 10:52:06) 실 시 간 이 벤 트 (2017.08.01 오전 10:52:06) 하행 상행 101 103 105 291 107 109 111 113 115 117 119 121 127 129 131 133 135 293 137 295 139 4065 141 143 145 147 149 151 153 157 159 4063 161 163 165 167 169 171 173 102 104 106 108 110 112 114 116 118 120 122 292 124 126 128 130 132 134 136 138 140 142 4062 144 146 148 294 150 296 152 154 4068 156 158 160 162 164 166 168 170 172 174 123 125 수신시각 편성번호 열차번호 고장코드 조치 2017-08-01 10:52:06 1C3004 123 D1-12-09 2017-08-01 10:48:32 1C3004 123 D1-12-09 2017-08-01 10:33:10 1C3004 123 D1-12-09 2017-08-01 10:32:02 1C1038 121 C6-81-05 정상 확인 2017-08-01 10:31:32 1C1038 121 C6-81-05 정상 확인 2017-08-01 10:31:10 1C1038 121 C6-81-05 정상 확인 2017-08-01 10:30:45 1C1038 121 C6-81-05 정상 확인 2017-08-01 10:30:44 1C1038 121 C6-81-05 정상 확인 위험 경고 주의 2017-08-01 10:07:55 1C2014 124 C6-81-05
  • 21. 향후 계획 *한국철도시설공단 요청으로 구간 외 설치 시 서원주~강릉으로 확대 가능 경부고속선 BigData로 Model 구축 사고 발생 원인 : 인적 오류 70%
  • 23. *출처 Research and market - Global Fraud Detection and Prevention (FDP) Market Trends and Forecasts (2016 – 2021) Markets and Markets - Fraud Detection & Prevention And Anti Money Laundering Market
  • 24.
  • 25. <청구패턴 분류> <청구다발생 고객 프로파일링>
  • 26.
  • 27. 27 고객데이터에 대해 클러스터링 기법을 적용하여 유사도를 기준으로 동질 유형을 분류 GROUP A 지역 고객연령 구매금액 고객 행위 가입 이력 구매 이력 결재 내역 … 1 : 9 광역 시 40대미만 1만원▲ 패턴#1 패턴#3 패턴 #5 2만원▲ 패턴#2 50대미만 : 60대이상 : 패턴#4 시 40대미만 : 패턴#6 고객 유형별 변수 통계량 분석 GROUP Z [ 고객패턴의 유형 분류 ] 고객 특성 내역 Clustering GROUP B
  • 29.
  • 30. 통계기반인 카테고리 TOP 10 이내 상품, 상품기반 추천을 혼합하여 상품상세와 주문내역 페이지에 노출시킴 Web Mobile 30
  • 31. 재무데이터는일정시점별로 생성됨 소수전문가의 주관적인의견에의존 산업 추이 예측불가 “산업별 부실관리가경제위기로” Bigdata 오픈된빅데이터의사용 기계학습및딥러닝기법을통한 높은예측력 AI 1. 실시간위험도예측 2. 예측정확도향상
  • 32. 32 적조 조기경보 데이터 수집 • 현장시료채취 • 위성,선박관측자료 • 해양기상통계자료 기존 자료 분석 • 국내외기상데이터 • 적조발생양상 • 적조생물증식매커니즘 예측모델 작성 • 최적시나리오작성 • 현장요인비교 적조 예보 • 1~4단계예보 • 사전피해대비 산업경제 위기 조기경보 빅데이터  경제체감지수 산출 • 빅데이터수집및가공하여 경제체감지수산출 체감지수+금융/실물지수 경제융합지수도출 • 경제체감지수및 금융/거시지수융합을통한 경제융합지수도출 인공지능 기반 경제 위기패턴 학습 • 과거경제위기패턴을 인공지능기반으로학습 실시간 경제위기 진단 및 리포팅 • 경제위기진단시스템을통해 실시간산업경제위기진단및 진단결과리포팅
  • 33. 33 과거 경제위기 관련 데이터 80년도 경제위기 08년도 금융위기 97년도 IMF 시간 국내 경제위기 그리스 경제위기 지역 영국 브렉시트 학습된 경제위기패턴 인식모듈 경제위기 패턴 학습 및 진단 인공지능 기반 분석, 패턴 학습을 통하여 현재 시점의 위기상황 추정 및 조기경보 가능 정형 데이터 실시간 비정형 데이터 산업경제 빅데이터 -SNS -경제기사 -취업포탈 -전문가 경제동향보고서 -경제연구소보고서 -금통위 통화정책결정문 -etc… -경제성장률 -GDP -물가상승률 -실업률 거시변수 미시변수 -기업매출액 -기업순이익 -기업성과 -전력소비량 -경상수지 -코스피지수 -생활물가지수 -etc…
  • 34. 34 거시 데이터 거시+빅 데이터 빅 데이터 거시 데이터 빅 데이터 거시+빅데이터 True Signal 0.5 0.3333 0.6250 NSR 0.0296 0.0222 0.0237
  • 35. 35 2000년 1월 2일 ~ 2016년 11월 10일 분야 기사 수 (개) 증권 3,996,738 금융 1,108,919 부동산 755,584 산업/재계 2,520,896 글로벌경제 678,914 경제 일반 4,151,425 생활 경제 261,485 중기/벤처 72,214 총합 13,546,175 중국 시장 한국 수출 생산 국내 미국 업체 공장 자동차 성장 달러 세계 판매 제품 글로벌 지난해 대다 투자 현지 해외 올해 진출 이다 따르다 일본 증가 확대 업계 기술 산업 유럽 규모 전망 전략 현대차 지난 늘다 크다 감소 기아차 수입 공급 전기차 수요 만대 대비 배터리 점유 보이다 형태소 품사 분석 (PoS tagging) 의미 단위 파싱 (parsing) 스팸 단어 및 저빈도 단어 제거 단어 인덱싱 (Indexing) 기사 원문 전처리된 데이터
  • 36. 36 빅데이터로 보는 경제전망 경제감성컨셉추출 국가별유사위기사례 분석 금융/실물부문별전망경제위기융합지수 경제여론및감정분석 경제위기패턴분석 정책 당국 기업 및 가계 체감경기의 과학적분석에활용 경제주체소비및투자 의사결정에 활용 실시간 산업경제위기조기대응 Web/Mobile을 통한 신속하고정확한정보제공
  • 37. • 데이터량 증대와 데이터 융합은 데이터품질을 저하시킴 데이터 정비 데이터 정제 지속적인 수정과 확인 하루 2-3회 칫솟질 오류제거 정기적인 치과 방문 예방 45% 10% 탐지 30% 30% 수리 25% 60% • 데이터는 치아와 같아서 정비하지 않으면 부패된다
  • 38. 날짜, 코드 데이터 규칙 적용 날짜 코드 4/32, 20170300 성별코드 : M, F, Z, 0 ➢ 단일 항목 탐지 수치 이상값 탐지 : 아웃라이어 볼트 해제시간 : 10분이내 정상값 이상값 볼트 해제시간 : 12분 이상 이상값 ➢ 상관관계 복수 항목 탐지 텍스트 클러스터링 볼트 해제시간 : 08분 이상 정비경력 10년 문서 비정형텍스트 분석 기술
  • 39. 39 데이터 값 일치화 데이터 병합
  • 40. 40 • 데이터경제 시대에서 AI 적용 비즈니스와 가능한 목표를 명확히 설정 • 데이터기반의 새로운 서비스 시장과 고용이 창출됨 • 머신러닝 프로세스에서 데이터전처리의 비중이 80%임