AI/DS논문이야기

[논문이야기] 혈액 보유량은 어떻게 유지될까? ④ 프로모션 효과 측정

[논문이야기] 혈액 보유량은 어떻게 유지될까? ④ 프로모션 효과 측정

혈액 부족 시기에 프로모션, 헌혈 촉구 문자, 공익광고 등을 통해 헌혈자 수 끌어올려프로모션 효과 측정 결과, ‘스포츠 관람 티켓 증정’ 프로모션이 가장 효과적국가 기관 행정 자료의 디지털화가 잘 되어있어 ‘공개정보청구’ 이용 권장 [논문이야기] 혈액 보유량은 어떻게 유지될까? ③ 코로나 시기 혈액 보유량-사용량-공급량 관계에서 이어집니다. 지난 글에서 코로나라는 큰 충격이 발생했을 때 혈액 시장이 어떻게 반응하는지 살펴봤다….

[논문이야기] 혈액 보유량은 어떻게 유지될까? ③ 코로나 시기 혈액 보유량-사용량-공급량 관계

[논문이야기] 혈액 보유량은 어떻게 유지될까? ③ 코로나 시기 혈액 보유량-사용량-공급량 관계

코로나라는 큰 충격에도 불구하고 헌혈자 수 감소량은 미미한 수준에 그쳐이는 대한적십자사에서 충격을 미리 예측하고 증가 요인을 작동시킨 것본 분석에서 그 요인이 ‘혈액 부족 상태’라는 것을 밝혀내 [논문이야기] 혈액 보유량은 어떻게 유지될까? ② 혈액 공급량 모델링에서 이어집니다. 이전 편에서는 혈액 공급량인 헌혈자 수에 영향을 미치는 요인에 대해 대해 알아봤다. 헌혈자 수는 일간 데이터로 주간 계절성과 연간 계절성을…

[논문이야기] 혈액 보유량은 어떻게 유지될까? ② 혈액 공급량 모델링

[논문이야기] 혈액 보유량은 어떻게 유지될까? ② 혈액 공급량 모델링

헌혈 방법에 따라 전혈, 혈장, 혈소판&다종성분으로 나뉘지만, ‘전혈’을 분석 대상으로 삼아데이터 그룹 간 차이 간과하여 발생하는 ‘누락 변수 편향’ 조심해야조화 회귀를 이용한 연간 주기성 제거, ‘DGP’에 맞는 계산법 [논문이야기] 혈액 보유량은 어떻게 유지될까? ① 관리가 까다로운 혈액 시장에서 이어집니다. 이전 글에서는 혈액 보유량 관리가 어려운 이유에 대해 살펴봤다. 그 이유는 혈액의 공급은 자발적인 참여로만 얻을 수 있고,…

[논문이야기] 혈액 보유량은 어떻게 유지될까? ① 관리가 까다로운 혈액 시장

[논문이야기] 혈액 보유량은 어떻게 유지될까? ① 관리가 까다로운 혈액 시장

2028년에는 혈액 수요가 공급을 뛰어 넘을 것이며 점차 상황이 악화될 것으로 예상돼현재도 이미 ‘적정 상태’가 아닌 대부분 ‘부족 상태’에 머물러이는 혈액 시장이 갖는 특수성으로 인해 혈액 보유량을 일정 수준 이상 유지하기 어렵기 때문 최근 대한민국은 저출산으로 골머리를 앓고 있다. 작년 합계출산율이 0.72명으로 미래 경제 성장에 적신호가 켜졌을 뿐만 아니라 저출산으로 인한 혈액 부족 사태도 화두에…

[논문이야기] 수면 상태 감지 ⑤, 한계 및 추후 연구 계획

[논문이야기] 수면 상태 감지 ⑤, 한계 및 추후 연구 계획

일반화 성능 입증, 훈련 데이터와 테스트 데이터 세트에서의 성능 차이가 크지 않아데이터 생성 과정에 맞는 데이터 변형 및 모델링 필요향후 연구 방향으로 보완 변수, 세부 데이터 전처리, ID 간 이질성 고려 등을 제시 [논문이야기] 수면 상태 감지 ④, 일반화에 초점을 맞춰 수면·활동 분포를 활용한 우도비 비교 방법론에서 이어집니다. 이전 글에서는 간단하게 예측값과 라벨값의 시간차이(time difference)로…

[논문이야기] 수면 상태 감지 ④, 일반화에 초점을 맞춰 수면·활동 분포를 활용한 우도비 비교 방법론

[논문이야기] 수면 상태 감지 ④, 일반화에 초점을 맞춰 수면·활동 분포를 활용한 우도비 비교 방법론

분포의 정보량을 사용하기 위한 사전 작업, ID 값별 vs. 전체 데이터 vs. 샘플 데이터수면·활동 분포를 활용한 우도비 비교 방법론, 가우시안 커널 밀도 추정 기반 우도비 계산시간차이(Time Difference) 기반 모델 평가 지표 제안, 예측 지연 및 과도 예측 현상 분석 [논문이야기] 수면 상태 감지 ③, 수면 신호의 변동성과 수면 간격의 불규칙성을 고려한 데이터 전처리 과정에서 이어집니다….

[논문이야기] 수면 상태 감지 ③, 수면 신호의 변동성과 수면 간격의 불규칙성을 고려한 데이터 전처리 과정

[논문이야기] 수면 상태 감지 ③, 수면 신호의 변동성과 수면 간격의 불규칙성을 고려한 데이터 전처리 과정

수면 단계에 따른 몸의 움직임 차이, 수면 신호의 변동성을 발생시켜데이터 전처리 과정에서 수면 신호를 안정화하면 수면 상태 검출에 용이해롬-스카글 주기 분석법을 사용해야 불규칙한 수면 간격에서 주기성을 찾을 수 있어 [논문이야기] 수면 상태 감지 ②, 선행 연구 조사 및 기존 방법론의 한계 분석에서 이어집니다. 이전 글 말미에서는 ENMO 신호의 주기성에 대해 간략하게 살펴봤다. 크게 잠을 자는…

[논문이야기] 수면 상태 감지 ②, 선행 연구 조사 및 기존 방법론의 한계 분석

[논문이야기] 수면 상태 감지 ②, 선행 연구 조사 및 기존 방법론의 한계 분석

기존의 최적화 기반 방법론, 정확도는 높지만 데이터 패턴 변화에 민감하고 1종 오류 감소에 편중된 모델 만들어불규칙한 패턴에 강인하고 일반화 성능이 우수한 방법론을 제시하기 위해ENMO 데이터의 주기성과 각 수면 상태의 분포를 활용한 데이터·모델 변형 방법을 선보일 예정 [논문이야기] 수면 상태 감지 ①, 가속도계 데이터 기반 수면 추적에서 이어집니다. 이전 글에서 소개한 것과 같이, 수면 검사는 수면다원검사를…

[논문이야기] 수면 상태 감지 ①, 가속도계 데이터 기반 수면 추적

[논문이야기] 수면 상태 감지 ①, 가속도계 데이터 기반 수면 추적

수면장애 환자 2022년 110만 명 달해, 수면에 대한 개개인의 관심도 덩달아 증가일회적인 전문 검사보다 간편하고 지속적인 웨어러블 기기 사용 선호연구 목적, ENMO 기반 가속도계 데이터를 활용한 수면 상태 감지 국민건강보험공단이 공개한 수면장애 환자 건강보험 진료 현황에 따르면, 2022년 수면장애로 병원을 찾은 환자는 109만 8819명으로 2018년 85만 5025명보다 28.5% 늘었다. 수면장애 환자가 늘고 있는 만큼 양질의…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ⑥

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ⑥

출퇴근 시간대 자전거 수요 불균형이 확인출근 시간에는 반납량이 많아 자전거가 남고, 퇴근 시간에는 대여량이 많아 자전거가 부족해자전거 수요 예측 결과를 바탕으로 최적의 따릉이 재배치 방안을 제시할 계획 [논문이야기] 이 많은 따릉이들은 어디서 왔을까? ⑤에서 이어집니다 따릉이 대여소 데이터를 수집하고 전처리한 과정에 이어, 이번 글에서는 2019년부터 2023년까지 4년간 마곡나루역 5번 출구 뒤편 따릉이 대여소의 반납량 데이터를…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ⑤

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ⑤

따릉이 이용량은 기온과 계절에 따라 변화하며, 월별·요일별·시간대별로도 이용량에 차이가 있어기온이 15~17도 정도로 선선할 때 이용량이 가장 많았으며, 너무 춥거나 더울 때는 감소해특히 주말보다 주중에, 그리고 출퇴근 시간대에 이용량이 많아 [논문이야기] 이 많은 따릉이들은 어디서 왔을까? 2편 – 초록에서 이어집니다 이번 글에서는 따릉이 대여량과 날씨 데이터의 관계를 집중적으로 분석하려고 합니다. 본격적인 분석에 앞서, 따릉이 이용량 예측에…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? 2편 – 초록

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? 2편 – 초록

4개년 따릉이 이용 데이터와 날씨 데이터를 활용해 따릉이 이동 경로 파악 및 효용성 극대화 방안 모색시간대별·대여소별 수요 예측을 통해 불필요한 자전거 재배치 줄여루베인 알고리즘 기반 대여소 클러스터링으로 자전거 재배치 시 이동 거리 최소화 지난 1편에서는 공공 자전거 사업의 고질적인 적자 문제를 해결하기 위해 따릉이 재배치 효율화의 필요성을 강조하며, 그 핵심 원인이 특정 대여소로의 과도한 쏠림…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ④

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ④

날씨, 한강 자전거길과의 거리, 공휴일 여부가 자전거 거치소의 대여량 결정하는 중요 요인권역별로 최적화 범위 넓혀 효율성 제고 재배치가 필요한 대여소만 걸러내면 비용 낭비 막을 수 있다 [논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③에서 이어집니다 가장 심한 불균형이 발생하는 지점은, 출퇴근 시간 대여와 반납이 활발히 일어나는 초 거대 업무 지구(예시: 강서 마곡업무 지구, 여의도 업무 지구,…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ③

출근 시간엔 주거지역에, 퇴근 시간엔 업무지구에 자전거 반납수 많다따라서 출근 시간과 퇴근 시간에 집중해 자전거 재배치 최적화가 이뤄져야하루 기준 새벽에 한 번만 주거 지역의 자전거 공급 늘려 재배치 최적화 달성 [논문이야기] 이 많은 따릉이들은 어디서 왔을까? ②에서 이어집니다 주요 업무지구의 출퇴근 시간 따릉이 이동 패턴 분석(Part 4) 앞선 논문이야기에선 자전거길 조성이 잘 돼 있으며 한강…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ②

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ②

따릉이 핫플레이스, “마곡 업무 지구”20~30대 연령층 따릉이 가장 많이 이용하는 것으로 나타나서울 업무 지구 중심으로 따릉이 이용량 집중돼 [논문이야기] 이 많은 따릉이들은 어디서 왔을까? ①에서 이어집니다 따릉이 사용자의 시간별 패턴은 어떨까?(Part 3) 공공 자전거 재배치를 효율화하기 위해선 무엇보다도 따릉이 사용자의 시간별 사용 패턴을 파악하는 게 가장 급선무라고 생각했습니다. 이에 사용량이 가장 많은 시간대의 대여소별 자전거…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ①

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? ①

항상 마곡 인근 대여소에 꽉 차있는 따릉이 자전거들필자의 출근길인 마곡이 서울 지역 중 가장 따릉이를 많이 타는 곳따릉이를 포함한 대부분 공공 자전거 사업 적자 면치 못하는 실정 [논문이야기] 이 많은 따릉이들은 어디서 왔을까? – 초록에서 이어집니다 Intro (Part 1) 저는 고양시 행신역 인근에서 마곡 나루역 근처 사무실로 출근하는 40대 초반 직딩입니다. 원래는 회사 셔틀로 출퇴근하고…

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? – 초록

[논문이야기] 이 많은 따릉이들은 어디서 왔을까? – 초록

서울에서 따릉이를 가장 많이 타는 곳은?공공 자전거 산업이 적자를 면치 못하는 이유는?따릉이 대여소별 공급-수요 최적화가 본 논문의 핵심 이번 글은 아래의 내용과 같이 진행될 예정입니다. 어떻게 보면 여러 가지 이야기로 지루하고 복잡해 보일 수 있는 이번 글의 가독성을 위해 5개의 파트로 나눠 진행해 보려고 합니다. 논문이야기 방향 이야기의 시작인 Part1은 따릉이에 관심을 가지게 된 이유…

[논문이야기] 상하수도 배수관 누수 탐지 ②

[논문이야기] 상하수도 배수관 누수 탐지 ②

진동 센서 데이터 특성상 고속 푸리에 변환 후 실수부만 활용해도 정보 손실 별로 없을 것주파수 도메인으로 변환 후 군집화 및 UMAP 시각화 통해 잠재 누수 데이터 분류 가능ICA 통해 누수에 결정적인 영향 미치는 요인 찾는 것 가능하나, 모델이 복잡해져 해석에 문제 생길수도 [논문이야기] 상하수도 배수관 누수 탐지 ①에서 이어집니다 센서신호를 통해 이상값을 탐지하려면? 그렇다면 센서를…

[논문이야기] 상하수도 배수관 누수 탐지 ①

[논문이야기] 상하수도 배수관 누수 탐지 ①

정부 주도의 “스마트 관망관리 시스템”, 어떻게 효율적으로 누수 저감했나누수의 두 가지 종류, “백그라운드 누출”과 “파열에 의한 누출”푸리에 변환을 통해 진동 센서 데이터를 전처리 해야하는 이유 미국 환경보호청(Environmental Protection Agency, EPA)에 따르면 가정에서 매년 약 3,080리터의 물이 누수되며, 가정의 10%에서 하루 약 27.27리터 이상의 누수가 발생하는 것으로 나타났다. 또한 이처럼 가정 내 누수만 해도 규모가 큰데,…

[논문이야기] NGCF의 소개 ④

[논문이야기] NGCF의 소개 ④

그래프 반영을 통해 미처 발견하지 못했던 데이터 속 ‘관계’ 찾아내는 NGCF다층의 레이어를 재귀적으로 구성한 아키텍쳐로 ‘High-order Connectivity’ 찾아내는게 NGCF의 핵심이 때 message construction으로 그래프 데이터 표현된다 [논문이야기] NGCF의 소개 ③에서 이어집니다 본 [논문이야기]는 NCF에 그래프 관계형 데이터를 반영한 계산법인 NGCF를 설명하기 위해 ‘Neural Graph Collaborative Filtering(Xiang Wang 등, 2020)‘을 참고했음을 밝힙니다. NGCF는 어떻게 ‘관계형 데이터’를…