AI/DS논문이야기

[논문이야기] 혈액 보유량은 어떻게 유지될까? ③ 코로나 시기 혈액 보유량-사용량-공급량 관계

[논문이야기] 혈액 보유량은 어떻게 유지될까? ③ 코로나 시기 혈액 보유량-사용량-공급량 관계

코로나 충격에도 불구하고 헌혈자 수 감소는 미미한 수준에 그쳐이는 대한적십자사에서 충격을 미리 예측하고 어떤 증가 요인을 작동시킨 것본 분석에서 그 요인이 ‘혈액 부족 상태’라는 것을 데이터로 밝혀내 [논문이야기] 혈액 보유량은 어떻게 유지될까? ② 혈액 공급량 모델링에서 이어집니다. 이전 편에서는 혈액 공급량인 헌혈자 수에 영향을 미치는 요인에 대해 대해 알아봤다. 헌혈자 수는 일간 데이터로 주간 계절성과 연간…

[논문이야기] 혈액 보유량은 어떻게 유지될까? ② 혈액 공급량 모델링

[논문이야기] 혈액 보유량은 어떻게 유지될까? ② 혈액 공급량 모델링

헌혈 방법에 따라 전혈, 혈장, 혈소판&다종성분으로 나뉘지만, ‘전혈’을 분석 대상으로 삼아데이터 그룹 간 차이 반영해 누락 변수 편향 조심해야조화 회귀를 이용한 연간 주기성 제거, DGP에 맞는 계산법 활용해 [논문이야기] 혈액 보유량은 어떻게 유지될까? ① 관리가 까다로운 혈액 시장에서 이어집니다. 이전 글에서는 혈액 보유량 관리가 어려운 이유에 대해 살펴보았다. 혈액의 공급은 자발적인 참여로만 얻을 수 있고, 혈액의 수요는…

[논문이야기] 혈액 보유량은 어떻게 유지될까? ① 관리가 까다로운 혈액 시장

[논문이야기] 혈액 보유량은 어떻게 유지될까? ① 관리가 까다로운 혈액 시장

2028년에는 혈액 수요가 공급을 뛰어 넘을 것으로 예상돼 현재도 대부분 혈액 부족 상태에 머물러 혈액 시장이 갖는 특수성이 혈액 관리를 어렵게 만들어 최근 대한민국은 저출산으로 골머리를 앓고 있다. 작년 합계출산율이 0.72명으로 미래 경제 성장에 적신호가 켜졌을 뿐만 아니라 저출산으로 인해 혈액 부족 사태도 화두에 올랐다. 전문가들은 저출산이 이어질 경우 2028년에는 혈액 수요가 공급을 뛰어 넘을…

[논문이야기] 수면 상태 감지 ⑤, 한계 및 추후 연구 계획

[논문이야기] 수면 상태 감지 ⑤, 한계 및 추후 연구 계획

일반화 성능 입증, 훈련 데이터와 테스트 데이터 세트에서의 성능 차이가 크지 않아데이터 생성 과정에 맞는 데이터 변형 및 모델링 필요향후 연구 방향으로 보완 변수, 세부 데이터 전처리, ID 간 이질성 고려 등을 제시 [논문이야기] 수면 상태 감지 ④, 일반화에 초점을 맞춰 수면·활동 분포를 활용한 우도비 비교 방법론에서 이어집니다. 이전 글에서는 간단하게 예측값과 라벨값의 시간차이(time difference)로…

[논문이야기] 수면 상태 감지 ④, 일반화에 초점을 맞춰 수면·활동 분포를 활용한 우도비 비교 방법론

[논문이야기] 수면 상태 감지 ④, 일반화에 초점을 맞춰 수면·활동 분포를 활용한 우도비 비교 방법론

분포의 정보량을 사용하기 위한 사전 작업, ID 값별 vs. 전체 데이터 vs. 샘플 데이터수면·활동 분포를 활용한 우도비 비교 방법론, 가우시안 커널 밀도 추정 기반 우도비 계산시간차이(Time Difference) 기반 모델 평가 지표 제안, 예측 지연 및 과도 예측 현상 분석 [논문이야기] 수면 상태 감지 ③, 수면 신호의 변동성과 수면 간격의 불규칙성을 고려한 데이터 전처리 과정에서 이어집니다….

[논문이야기] 수면 상태 감지 ③, 수면 신호의 변동성과 수면 간격의 불규칙성을 고려한 데이터 전처리 과정

[논문이야기] 수면 상태 감지 ③, 수면 신호의 변동성과 수면 간격의 불규칙성을 고려한 데이터 전처리 과정

수면 단계에 따른 몸의 움직임 차이, 수면 신호의 변동성을 발생시켜데이터 전처리 과정에서 수면 신호를 안정화하면 수면 상태 검출에 용이해롬-스카글 주기 분석법을 사용해야 불규칙한 수면 간격에서 주기성을 찾을 수 있어 [논문이야기] 수면 상태 감지 ②, 선행 연구 조사 및 기존 방법론의 한계 분석에서 이어집니다. 이전 글 말미에서는 ENMO 신호의 주기성에 대해 간략하게 살펴봤다. 크게 잠을 자는…

[논문이야기] 수면 상태 감지 ②, 선행 연구 조사 및 기존 방법론의 한계 분석

[논문이야기] 수면 상태 감지 ②, 선행 연구 조사 및 기존 방법론의 한계 분석

기존의 최적화 기반 방법론, 정확도는 높지만 데이터 패턴 변화에 민감하고 1종 오류 감소에 편중된 모델 만들어불규칙한 패턴에 강인하고 일반화 성능이 우수한 방법론을 제시하기 위해ENMO 데이터의 주기성과 각 수면 상태의 분포를 활용한 데이터·모델 변형 방법을 선보일 예정 [논문이야기] 수면 상태 감지 ①, 가속도계 데이터 기반 수면 추적에서 이어집니다. 이전 글에서 소개한 것과 같이, 수면 검사는 수면다원검사를…

[논문이야기] 수면 상태 감지 ①, 가속도계 데이터 기반 수면 추적

[논문이야기] 수면 상태 감지 ①, 가속도계 데이터 기반 수면 추적

수면장애 환자 2022년 110만 명 달해, 수면에 대한 개개인의 관심도 덩달아 증가일회적인 전문 검사보다 간편하고 지속적인 웨어러블 기기 사용 선호연구 목적, ENMO 기반 가속도계 데이터를 활용한 수면 상태 감지 국민건강보험공단이 공개한 수면장애 환자 건강보험 진료 현황에 따르면, 2022년 수면장애로 병원을 찾은 환자는 109만 8819명으로 2018년 85만 5025명보다 28.5% 늘었다. 수면장애 환자가 늘고 있는 만큼 양질의…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ④

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ④

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③에서 이어집니다 가장 심한 불균형이 발생하는 지점은, 출퇴근 시간 대여와 반납이 활발히 일어나는 초 거대 업무 지구(예시: 강서 마곡업무 지구, 여의도 업무 지구, 성수동 지식산업센터 등)입니다. 이때 앞서 논의한 ‘평형상태’ 개념을 활용해 대여소별 자전거 수를 정확히 예측해낼 수만 있다면, 새벽 단 한 번의 재배치만으로 대여소별 일일 거치 자전거수를 최적화…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ②에서 이어집니다 주요 업무지구의 출퇴근 시간 따릉이 이동 패턴 분석(Part 4) 앞선 논문이야기에선 자전거길 조성이 잘 돼 있으며 한강 자전거길 접근이 쉬운 서울시 내 신규 개발 업무지구로 따릉이 사용량이 집중된다는 사실을 살펴봤습니다. 따라서 따릉이 사용의 집중이 되는 초거대 업무지구 5곳을 중심으로 분석을 시작하고자 합니다. 한 가지 가설을 세웠습니다. 그것은…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ②

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ②

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ①에서 이어집니다 따릉이 사용자의 시간별 패턴은 어떨까?(Part 3) 공공 자전거 재배치를 효율화하기 위해선 무엇보다도 따릉이 사용자의 시간별 사용 패턴을 파악하는 게 가장 급선무라고 생각했습니다. 이에 사용량이 가장 많은 시간대의 대여소별 자전거 대여 수와 반납 수를 파악하고자 했습니다. 실제 해당 사업의 주요 사용자 및 사용 시간을 조사한 결과, 따릉이는 오전…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ①

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ①

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? – 초록에서 이어집니다 Intro (Part 1) 저는 고양시 행신역 인근에서 마곡 나루역 근처 사무실로 출근하는 40대 초반 직딩입니다. 원래는 회사 셔틀로 출퇴근하고 있었지만, 최근 자전거에 취미가 생겨 집에서 회사까지 출퇴근을 자전거로 하고 있습니다. 자전거가 취미가 된 가장 큰 이유는 사실 서울시 공공자전거 사업인 따릉이에 대한 이미지가 굉장히 컸기 때문입니다….

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? – 초록

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? – 초록

이번 글은 아래의 내용과 같이 진행될 예정입니다. 어떻게 보면 여러 가지 이야기로 지루하고 복잡해 보일 수 있는 이번 글의 가독성을 위해 5개의 파트로 나눠 진행해 보려고 합니다. 논문이야기 방향 이야기의 시작인 Part1은 따릉이에 관심을 가지게 된 이유 및 ‘서울에서 따릉이를 가장 많이 타는 곳은 어디일까?’에 대한 이야기를 해보고자 합니다. 두 번째 이야기인 Part2는 서울시 환경적인…

[논문이야기] 상하수도 배수관 누수 탐지 ②

[논문이야기] 상하수도 배수관 누수 탐지 ②

[논문이야기] 상하수도 배수관 누수 탐지 ①에서 이어집니다 센서신호를 통해 이상값을 탐지하려면? 그렇다면 센서를 통해 측정된 시퀀스(sequence) 데이터(예: 시간에 따른 온도·수질 측정)에서 어떠한 패턴을 찾을 수 있을까? 또한 이런 센서 데이터에서 미래 값을 예측하거나 이상치(anomaly)를 탐지하는 데 중요한 방법은 무엇이 있을까? 먼저 시계열 속성을 띄는 시퀀스 데이터의 경우엔 다양한 방법으로 유사성(similarity)을 찾아낼 수 있다. 예컨대 거리…

[논문이야기] 상하수도 배수관 누수 탐지 ①

[논문이야기] 상하수도 배수관 누수 탐지 ①

미국 환경보호청(Environmental Protection Agency, EPA)에 따르면 가정에서 매년 약 3,080리터의 물이 누수되며, 가정의 10%에서 하루 약 27.27리터 이상의 누수가 발생하는 것으로 나타났다. 또한 이처럼 가정 내 누수만 해도 규모가 큰데, 외부 공공 급수시스템에서의 누수로 인한 손실은 더하면 더했지 덜 하진 않을 것이다. 실제 국내 누수에 대한 기사를 확인해 보자. 환경부 자료에 따르면 2017년부터 2021년까지 정수장에서…

[논문이야기] Estimating Cannibalization Rates for Pioneering Innovations

[논문이야기] Estimating Cannibalization Rates for Pioneering Innovations

새로운 제품이 출시되면 소비자의 장바구니 구성은 전반적으로 변화하게 됩니다. 흔히 말하는 대체재, 보완재가 그 변화를 지칭하는 대표적인 단어입니다. 즉 신제품의 출시는 단순히 소비자의 장바구니에 추가로 들어가느냐의 차원을 넘어 장바구니의 기존 제품을 대체하거나, 장바구니 밖 시너지를 일으키는 제 3 제품의 구매를 불러오기도 합니다. 신제품 출시, 자사 입장에서 긍정적 또는 부정적인 효과 불러오는지 수치적 확인 못해 문제는…

[논문이야기] 감염병 모델링 ②

[논문이야기] 감염병 모델링 ②

[논문이야기] 감염병 모델링 ①에서 이어집니다. 이전 글에 이어 이번 글에서는 오류가 발생하는 다양한 상황에 따라 모델링 방법이 어떻게 달라져야 하는지 살펴보고, 나아가 구체적인 상황에서 각 모델마다 MLE 추정치가 어떻게 형성되는지 알아본다. 케이스 별 감염병 모델링 방법 이러한 오차의 특성을 고려해서, 다음과 같은 경우로 나눠서 감염병 모델링을 수행해 볼 수 있다. case 1) 시스템 오차는 무시할…

[논문이야기] 감염병 모델링 ①

[논문이야기] 감염병 모델링 ①

COVID-19가 본격적으로 창궐했던 2020년을 기점으로 벌써 3여년의 시간이 흘렀다. 이제는 한국도 위드코로나 정책으로 COVID-19와 공생해 나가고 있는 시점이다. 실제 지난 5월 정부 당국은 사실상 COVID-19 ‘엔데믹'(endemic・일상적 유행)을 선언하면서 국민 일상 회복을 도모했다. 그러나 전염병 전문가들은 아직 긴장의 끈을 놔서는 안된다고 당부한다. 전문가들은 코로나가 완전히 사라진 건 아니며 빠르면 2~3년 이내에 코로나 신종 변이 및 새로운…

[논문이야기] NGCF의 소개 ④

[논문이야기] NGCF의 소개 ④

[논문이야기] NGCF의 소개 ③에서 이어집니다 본 [논문이야기]는 NCF에 그래프 관계형 데이터를 반영한 계산법인 NGCF를 설명하기 위해 ‘Neural Graph Collaborative Filtering(Xiang Wang 등, 2020)‘을 참고했음을 밝힙니다. NGCF는 어떻게 ‘관계형 데이터’를 표현하는가? 먼저 논문 초반 내용인 NCF와 NGCF의 차이점을 간단한 다이어그램으로 소개해보겠습니다. 위 그림처럼 NCF는 $l=1$, 즉 엣지(Edge)가 1개인 관계만 설명할 수 있는 반면, NGCF는 $l=1$ 이상의…

[논문이야기] NGCF의 소개 ③

[논문이야기] NGCF의 소개 ③

[논문이야기] NGCF의 소개 ②에서 이어집니다 이전 글을 통해 추천 알고리즘의 가장 기본적인 형태인 ‘콘텐츠 기반 필터링’과 ‘협업 필터링’을 간락히 살펴봤습니다. 또한 ‘유저와 아이템간 관계’를 비선형적 영역으로 확장하는 협업 필터링을 신경망 협업 필터링(Neural Collaborative Filtering, NCF)을 소개한 바 있습니다. 이번 글에서는 협업 필터링의 구조를 조금 더 자세히 이해해보고, 나아가 ‘신경망 그래프 협업 필터링(NGCF)’이 나오게 된 배경을…