AI/DS논문이야기

[논문이야기] Estimating Cannibalization Rates for Pioneering Innovations

[논문이야기] Estimating Cannibalization Rates for Pioneering Innovations

새로운 제품이 출시되면 소비자의 장바구니 구성은 전반적으로 변화하게 됩니다. 흔히 말하는 대체재, 보완재가 그 변화를 지칭하는 대표적인 단어입니다. 즉 신제품의 출시는 단순히 소비자의 장바구니에 추가로 들어가느냐의 차원을 넘어 장바구니의 기존 제품을 대체하거나, 장바구니 밖 시너지를 일으키는 제 3 제품의 구매를 불러오기도 합니다. 신제품 출시, 자사 입장에서 긍정적 또는 부정적인 효과 불러오는지 수치적 확인 못해 문제는…

[논문이야기] 감염병 모델링 ②

[논문이야기] 감염병 모델링 ②

[논문이야기] 감염병 모델링 ①에서 이어집니다. 이전 글에 이어 이번 글에서는 오류가 발생하는 다양한 상황에 따라 모델링 방법이 어떻게 달라져야 하는지 살펴보고, 나아가 구체적인 상황에서 각 모델마다 MLE 추정치가 어떻게 형성되는지 알아본다. 케이스 별 감염병 모델링 방법 이러한 오차의 특성을 고려해서, 다음과 같은 경우로 나눠서 감염병 모델링을 수행해 볼 수 있다. case 1) 시스템 오차는 무시할…

[논문이야기] 감염병 모델링 ①

[논문이야기] 감염병 모델링 ①

COVID-19가 본격적으로 창궐했던 2020년을 기점으로 벌써 3여년의 시간이 흘렀다. 이제는 한국도 위드코로나 정책으로 COVID-19와 공생해 나가고 있는 시점이다. 실제 지난 5월 정부 당국은 사실상 COVID-19 ‘엔데믹'(endemic・일상적 유행)을 선언하면서 국민 일상 회복을 도모했다. 그러나 전염병 전문가들은 아직 긴장의 끈을 놔서는 안된다고 당부한다. 전문가들은 코로나가 완전히 사라진 건 아니며 빠르면 2~3년 이내에 코로나 신종 변이 및 새로운…

측정오차 하 광고 시계열 모델링 연구: Poisson Time Series 및 Poisson Kalman Filter를 중심으로

측정오차 하 광고 시계열 모델링 연구: Poisson Time Series 및 Poisson Kalman Filter를 중심으로

코로나19 팬데믹은 우리의 일상 전반의 변화와 함께 디지털 전환을 가속했다. 집에서 보내는 시간이 길어지면서 유튜브, 모바일 콘텐츠, 온라인동영상서비스(OTT) 등 미디어 시청 패러다임의 변화는 물론, 소비의 중심축이 오프라인에서 온라인으로 움직이면서 디지털 광고 시장 또한 급격하게 성장했다. 실제로 최근 한국방송광고진흥공사가 발표한 ‘2022년 방송통신광고비 조사’에 따르면 대부분 매체의 방송광고비는 감소했지만 2023년 추정 온라인광고비는 8조8400억원으로 전년 대비 10% 증가하는…

Interpretable Topic Analysis

Interpretable Topic Analysis

산업통상자원부가 올해 초에 발표한 ‘연간 수출입동향’에 따르면, 지난해 우리나라 세계 수출 순위는 6위를 기록했다. 또한 지난해 수출액은 6,839억 달러로 2년 연속으로 사상 최대 수출 실적을 경신했다. 반면 우리나라 무역수지 적자는 나날이 심해지고 있다. 산업부에 따르면 지난해 무역수지는 역대 최악인 472억3,000만 달러(약 61조 8,713억원)을 기록했다. 이는 2008년 글로벌 금융위기(132억6,749만 달러 적자)를 뛰어넘는 수치다. 전문가들은 이를 글로벌…

부동산 경매 시장의 할인/할증 요인 발견

부동산 경매 시장의 할인/할증 요인 발견

우리나라 아파트 경매 시장은 매매 시장과 뚜렷한 가격 차이를 보기 어려울 정도로 활성화 되어있다. 이에 따라 실수요 목적으로 경매 시장을 찾는 개인들, 차익 거래를 노리는 투자자들, 담보 대출을 다루는 금융 기관들과 부실 채권 사업자 등 다양한 이해 관계자가 해당 시장에 참여한다. 특히 대부분의 금융 기관은 사업 구조 중 주택 담보 대출이 차지하는 비율이 높고, 채무…

Is bubble really bubble?

Is bubble really bubble?

버블은 금융 자산 또는 상품의 가격이 내재가치 또는 시장 컨센서스보다 훨씬 높을 때 발생한다. 이는 일반적으로 과열된 경제 상황을 설명할 때 주로 사용되는 표현이다. 문제는 버블이 꺼지면서 가격이 폭락하기 전까지는 대부분의 시장 참여자가 이를 버블이라고 인지하지 못한다는 것이다. 국제적으로 상호 연관성이 커진 오늘날 어느 한 나라의 버블은 세계 경제 전반에 큰 영향을 미치기 때문에 이를…

건축물 별 월간 전기/가스 사용량 예측: 결합확률분포 모델 기반 예측

건축물 별 월간 전기/가스 사용량 예측: 결합확률분포 모델 기반 예측

우리는 집에서 전기와 가스를 사용하고 매달 전기요금 고지서와 가스요금 고지서를 받는다. 여름에는 더위 때문에 에어컨을 많이 사용하고는 전기요금이 많이 나올까 걱정하고, 겨울에는 추위 때문에 난방을 온종일 틀어놓고 비싼 가스 요금을 걱정하기도 한다. 송정훈 박사는 지난 5월 12일 개최된 ‘데이터사이언스경영학회 2023년 제1차 세미나’에서 한국에너지공단이 공개한 위의 통계자료를 지적하며, 이러한 전기와 가스 소비는 가정뿐만 아니라 비주거용 건물들…

ChatGPT는 실험에 불과, Attention mechanism도 데이터셋 특화된 계산법에 불과

ChatGPT는 실험에 불과, Attention mechanism도 데이터셋 특화된 계산법에 불과

지난해 11월 말에 ChatGPT가 출시되고 2개월만에 사용자가 1억명을 넘었다는 보도가 있었다. 이제 만 2개월이 좀 더 지난 시점인데, 수익화를 위해서 개발사인 OpenAI가 서두르는 것을 보면서, 게임 이상으로 현실 서비스를 뜯어 고칠 수 있을까는 의문을 던져봤다. 한 언론사 기자 지원을 했던 학생이 ChatGPT에서 정보를 얻어 기사 샘플을 작성했다며 제출했단다. 솔직히 밝혀줘서 고맙다면서 글을 읽어본 경력직 기자 분은 ‘XX위키 베꼈네요?’라고…

ChatGPT 시리즈 – ⑤’인간 피드백형 강화학습(RLwHF)’과 대형언어모델(LLM)의 미래

ChatGPT 시리즈 – ⑤’인간 피드백형 강화학습(RLwHF)’과 대형언어모델(LLM)의 미래

ChatGPT에 맞서 구글에서 Bard라는 LaMDA 기반의 대형언어모델(LLM) 모델을 내놨다. 이미 오래전부터 나왔던 이야기고, 모델 자체가 데이터 물량에 크게 의존하는만큼, 세계 최대 검색엔진을 갖고 있는 구글이 유사한 서비스를 못 내놓을 것이라는 생각은 하지 않았었다. 아직 준비 중이었을텐데, 워낙 ChatGPT가 여론의 관심을 받으니 출시일을 좀 앞당긴 것 같은데, 제임스 우주 웹 망원경(JWST)에 대한 설명 중에, 태양계 밖에서 우리 지구의…

ChatGPT 시리즈 – ④’인간 피드백형 강화학습(RLwHF)’과 GPT-3.5

ChatGPT 시리즈 – ④’인간 피드백형 강화학습(RLwHF)’과 GPT-3.5

ChatGPT의 모델 자체는 기존의 강화학습 모델들과 큰 차이가 없다. ChatGPT 측에서 직접 공개한 홈페이지 상의 설명이나, 공개된 논문에서도 기존의 강화학습을 일부 변형해 보상(Reward)를 주는 방식을 인간의 피드백으로 대체했다는 점을 지적하고, 해당 부분의 효과를 설명하는 실험으로 가득찬 전형적인 공학 논문이다. 위의 2번 식에서 볼 수 있듯, 기존의 강화학습(Reinforcement Learning, RL)을 놓고, Supervised Fine-Tuning(SFT)라는 작은 모델로 보정하는 작업을 거친다. SFT는…

ChatGPT 시리즈 – ③’인간 피드백형 강화학습(RLwHF)’의 한계

ChatGPT 시리즈 – ③’인간 피드백형 강화학습(RLwHF)’의 한계

자, 이제 이 시리즈 글의 가장 본질적인 목적으로 돌아와보자. 그간 강화학습이라는 모델과 인간 피드백형 강화학습이 구성되는 논리를 이해했다면 굳이 ‘실험’에 의존하지 않고도 어떤 데이터와 어떤 목적일 때 RLHF가 효과적일 수 있을지 가늠이 될테니, 논리부터 한번 정리해보자.   8.RLHF로 할 수 있는 것과 할 수 없는 것 일반에 ‘강화학습’으로 알려진 계산법은, 고교 시절에 봤던 미분 최적화 +…

ChatGPT 시리즈 – ②’인간 피드백형 강화학습(RLwHF)’의 장점

ChatGPT 시리즈 – ②’인간 피드백형 강화학습(RLwHF)’의 장점

가치함수를 정의하고 벨만 방정식을 풀어내는데까지는 우리가 수식을 찾아낼 수 있다고 가정했다. 근데, 현실적으로 우리가 수식을 알고 있는 경우는 과연 얼마나 될까? 사실 수식을 알아낼 수 있는 학문의 영역은 일부에 지나지 않는다. 그리고, 계산법을 배우는 것이 힘들지는 몰라도 배우고 나면 문제를 풀어내는 것은 전혀 어려운 일이 아니다. 계산기가 풀어줄 수도 있는만큼, 문제를 풀어내느냐 여부는 문제를 수식으로…

ChatGPT 시리즈 – ①강화학습(RL)과 ‘인간 피드백형 강화학습(RLwHF)’

ChatGPT 시리즈 – ①강화학습(RL)과 ‘인간 피드백형 강화학습(RLwHF)’

요즘 ChatGPT가 엄청나게 많은 일을 할 수 있다며 말들이 많다. 모델을 봤을 때는 지난 2017년에 알파고가 나왔던 시절처럼 몇 가지 할 수 있는 것들만 말이 나오고는 Hype이 끝날 것 같은데, 몇 개의 시리즈 글로 ChatGPT가 왜 대단한지, 그럼에도 불구하고 뭔가 엄청난 일을 할 수 있는건 아닌지를 지적해 볼까 한다. ChatGPT의 명성을 이용하기 위해 그럴듯하게 자기네 회사 시스템을…

[논문이야기] Interpretable Topic Analysis ⑤

[논문이야기] Interpretable Topic Analysis ⑤

[논문이야기] Interpretable Topic Analysis ④에서 이어집니다 요약 본 논문을 한 문장으로 요약하자면, NLP(Natural Language Process, 자연어처리)분야에서 토픽의 비율을 뜻하는 $\theta$를 찾아내기 위해 비선형 요인분석(Non-linear Factor Analysis)를 수행한 것으로 볼 수 있습니다(실제로도 토픽들간의 공분산은 존재합니다). 위를 바꿔 말하면, 보통 요인 분석(Factor Analysis, FA)은 수치형 데이터에서 사용되는데, 이를 NLP 분야에 활용(비선형 요인분석)하기 위해 단어와 각 토픽의 구조,…

[논문이야기] Interpretable Topic Analysis ④

[논문이야기] Interpretable Topic Analysis ④

[논문이야기] Interpretable Topic Analysis ③에서 이어집니다 이전 글(1,2,3)까지, ‘화려한’ 모델들을 사용하며 계산 효율성(Computational Efficiency)을 최대화하면서도, 어휘 간 맥락을 반영할 수 있는 토픽 모델링을 설계했습니다. 그 다음으로 연구를 하면서 제가 가장 많이 했던 고민은 ‘이를 통해 어떻게 의사 결정을 내릴 수 있을까’였습니다. 보편 근사 정리(Universal Approximation Theorem, 신경망 모델에서 하나의 레이어만으로도 여러 개 노드 추가를 통해…

[논문이야기] Interpretable Topic Analysis ③

[논문이야기] Interpretable Topic Analysis ③

[논문이야기] Interpretable Topic Analysis ②에서 이어집니다 이전 글에서는 GloVe를 본 연구의 핵심 워드 임베딩 기술로 사용하게 된 배경을 살펴보고, 나아가 그래프 표현을 통해 ‘토픽 내 단어간 관계’를 심도 깊게 반영하는 GTRF를 소개했습니다. 위 논의를 기반으로, 이번 글에서는 본 [논문이야기]의 핵심인 ‘GNTM(Graph Neural Topic Model)’를 살펴봅니다. GNTM은 higher order GNN(Graph Neural Network, 그래프 신경망)을 활용합니다. 즉,…

[논문이야기] Interpretable Topic Analysis ②

[논문이야기] Interpretable Topic Analysis ②

[논문이야기] Interpretable Topic Analysis ①에서 이어집니다 AI(Artificial Intelligence)분야에서 가장 먼저 떠오르는 교수님은 누가 있을까요? 저는 앤드류 응(Andrew Ng) 교수님이 떠오릅니다. 왜 그런진 모르겠지만 언젠가부터 주변에서 앤드류 응 교수의 강의, 인터뷰, 논문을 봤다고 얘기하는 사람들이 늘어나기 시작했습니다. 지금 생각해보면 앤드류 응 교수의 논문이 2000년 대 초반에 나왔다는 것을 생각하면, 최근 들어 이 교수의 명성을 접하게 돼…

[논문이야기] Interpretable Topic Analysis ①

[논문이야기] Interpretable Topic Analysis ①

대학원 수업들을 절반 이상 이수하며 졸업을 얼마 안 남기고 있었던 시점에서, 데이터 사이언스와 인공지능을 배우기 위해 이 대학원에 왔기 때문에 기존 통계학 분석 방법이 사용되지 않는 머신러닝 및 딥러닝이 잘 사용되는 분야로 논문을 작성하고 싶었습니다. 그래야 대학원 교육과정을 마치는 의미가 더욱 있을 것 같았기 때문입니다. 데이터를 찾기 쉽고, 딥 러닝을 활용할 수 있는 분야 저를…

[논문이야기] 측정오차 하 광고 시계열 모델링 연구 ④

[논문이야기] 측정오차 하 광고 시계열 모델링 연구 ④

[논문이야기] 측정오차 하 광고 시계열 모델링 연구 ③에서 이어집니다. 이전 글까지를 통해 예측적(Predictive) 및 해석적(Analytic) 관점에서 측정오차를 살펴봤습니다. 이번에는 측정오차 문제를 보정하는 포아송 칼만 필터(Poisson Kalman Filter)을 살펴보고, 나아가 이를 포아송 시계열 모형과 결합하는 ‘앙상블’ 모형을 소개하는 시간을 가져보죠. 포아송 칼만 필터, 측정오차, 베이지안, 그리고 정규화 칼만 필터는 연구자가 이미 알고 있는 변수의 정보(State Equation,…