‘팬데믹 없는 스마트시티 구현’ 정한민 KISTI 책임연구원
‘팬데믹 없는 스마트시티 구현’ 정한민 KISTI 책임연구원
  • 노철중 기자
  • 승인 2021.09.01 16:16
  • 댓글 0
이 기사를 공유합니다

이종 빅데이터 통합 및 지능화 기술 연구
정한민 한국과학기술정보연구원 책임연구원. 한국과학기술정보연구원
정한민 한국과학기술정보연구원 책임연구원. <한국과학기술정보연구원>

[인사이트코리아=노철중 기자] 4차 산업혁명 시대를 대비하기 위한 여러 연구개발이 진행되고 있다. 스마트 공장·농장, 로봇기술, 자율주행·무인 비행체 기술, 사물과 IT가 접목된 사물인터넷 기술, 디지털 헬스케어 등 전 산업에서 대전환을 위한 준비가 활발하게 진행되고 있다. 4차 산업혁명 시대 산업화 기술은 대부분 빅데이터와 인공지능(AI)을 기반으로 한다. 빅데이터를 통해 AI가 스스로 학습하는 딥러닝 기술은 발전을 거듭하는 중이다.

산업뿐만 아니라 여러 사회 현안을 분석하고 원인과 해결 방법을 찾는 일에도 빅데이터와 AI가 활용된다. 시대 전환기에 발생할 수 있는 부작용을 제거하는 데에도 시대 전환을 촉진한 신기술이 활용되는 것이다.

정한민 한국과학기술정보연구원(KISTI) 책임연구원(과학기술연합대학원대학교 교수)은 이러한 사회적 현안을 분석하기 위한 ‘이종 빅데이터 통합 및 지능화 기술’을 연구하고 있다. 4차 산업혁명 시대에 따른 주요 사회 현안(대기·소음·생활환경·유동인구·펜데믹 등)에 대한 해결 방안을 제시하기 위해 사물인터넷에서 생성되는 ‘머신 데이터’와 SNS·인터넷·댓글·유튜브 등 사람들의 다양한 의견들로 구성된 ‘휴먼 데이터’를 실시간으로 수집해 통합·분석하는 연구를 진행 중이다.

정 교수는 2017년 정부 과제로 스마트시티 구현을 위한 ‘초연결 지능데이터 생태계 구축사업’에 참여해 머신 데이터 기반 대도시 내 환경 정보 수집·분석 연구를 수행한 바 있다. 대구 시내 택시 40여대에 머신 센서를 부착해 실시간으로 미세먼지, 초미세먼지, 일산화탄소, 이산화질소 수치 등 각종 정보를 수집해 주변 정보를 나타내는 시스템을 구축했다.

2020년에는 ‘빅데이터 기반 활동성 팬데믹 모델’이라는 논문을 발표하기도 했다. 정 교수는 코로나19 발생 이후 2020년 3월 11일 WHO가 팬데믹을 선언하기까지 CNN의 뉴스 빅데이터를 분석했다. 그 결과 코로나19 확산 단계에 따른 사람들의 활동성 변화에 초점을 맞춘 새로운 팬데믹 모델을 구축했다. 빅데이터를 기반으로 실제로 일어난 활동성을 제약하는 이벤트(사회적 거리두기, 공연·스포츠 관람 제한 등)들도 추출해 활동성 팬데믹 모델에 적용했다. 정 교수는 논문에서 “전염병 확산 수준으로 팬데믹을 판단하는 기존 팬데믹 모델은 향후 어떠한 양상으로 창궐하고 그것을 통해 받을 피해에 대한 예측이 사실상 어려웠다”면서 “활동성 팬데믹 모델은 전염원(사람들)의 활동을 통제하는 조치들을 분석해 확산 수준과 다음 시나리오들을 예측하는데 기여할 수 있다”고 말했다.

<인사이트코리아>는 정한민 교수와 서면 인터뷰를 통해 ‘이종 빅데이터 통합 및 지능화 기술’에 대한 자세한 이야기를 들을 수 있었다. 사회적인 주요 현안에 관심을 두고 해당 기술을 어떻게 활용할 것인가를 고민하고 있다는 점이 인상적이었다. 그는 해당 연구가 4차 산업혁명의 실현과 사회 현안 해결을 목적으로 한다는 점을 강조했다.

활동성 팬데믹 모델.<한국과학기술정보연구원>

‘이종 빅데이터 통합 및 지능화 기술’이란 어떤 것인가.

“빅데이터는 매우 빠른 속도로 만들어지는 대량의 이질적 데이터를 일컫는 용어이자 기술이다. 빅데이터는 크게 사람들이 관여하는 휴먼 센서 네트워크와 기계적 센서들이 관여하는 머신 센서 네크워크로부터 만들어진다. 머신 센서 네크워크는 다시 고정형 장치들로 이루어진 고정형 센서 네크워크와 이동형 장치들로 이루어진 이동형 센서 네트워크로 구성된다.

예를 들면, 우리가 일상의 활동들을 기록하는 SNS가 일종의 휴먼 센서 네트워크라고 할 수 있다. 머신 센서 네트워크는 CCTV, 스마트홈 등에 고정돼 센서 데이터를 생성하는 고정형 센서 네트워크와 드론·자동차 등 움직이는 기기들로 구성된 이동형 센서 네트워크로 나뉜다. 제가 연구하는 기술은 이러한 다양한 센서 네트워크들로부터 생성되는 실시간 빅데이터들을 수집·통합·분석하는 기술이다.”

2017년 대구 택시 센서를 통해 빅데이터를 수집했는데 현재 어떤 연구를 진행하고 있나.

“2017년부터 40여대의 대구 택시에 미세먼지, 진동, 이산화질소, 황화합물, 악취 등 10여종의 센서를 설치해 실시간 운행하면서 수집한 빅데이터를 분석했다. 자체 차량에 30여종의 추가 센서들을 루프탑 형식으로 설치해 실시간 도로 상황 빅데이터를 수집·분석함으로써 대구의 도로 파손 현황, 미세먼지 집중 발생 지역, 요일·시간대별 과속 지역, 인공지능 기반 차량·보행자 인식 등 가시적인 성과를 만들어 냈다.

최근에는 한국(세종특별자치시), 태국(방콕·치앙마이), 독일(본)을 대상으로 대기질 측정망들을 분석·평가하고 최적의 대기질 측정망 위치를 제안하는 연구 성과를 내기도 했다. 앞으로도 주요 사회 현안(대기·소음·생활환경·유동인구 등)에 대해 스트림 방식 빅데이터 처리 기술로 통합하고, 사회 현안 대응과 성장동력 확보를 위한 인공지능 기반 데이터 지능화를 추구하는 연구를 지속적으로 할 예정이다.”

궁극적인 목표는 스마트시티 구현으로 알고 있다. 실제 적용 사례가 있나.

“대전을 대상으로 교량 진동을 분석해 과적 차량 유무와 정도를 측정하는 연구도 후속 진행됐다. 현재 독일·오스트리아·태국 등의 연구기관·대학들과도 협력해 스마트시티의 실현을 위한 다각적인 노력을 지속하고 있다. 현재 이러한 큰 그림을 뒷받침하기 위한 기술적 인프라가 주요 관심사이며, 추후 도시 단위에서의 실제적 구현이 가능하리라 보고 있다.”

SNS를 통한 빅데이터 수집은 어떻게 이뤄지고 있으며 어떤 활용 사례가 있는지 궁금하다.

“2020년 팬데믹의 시작에 맞추어 CNN, 로이터 등 주요 언론사의 기사들을 분석해 ‘빅데이터 기반 활동성 팬데믹 모델’을 제안함으로써 팬데믹에 따른 각국의 여러 조치들이 어느 단계에서 발생하는지를 추적하고 예측할 수 있는 기반을 제시했다. 최근에는 유튜브 동영상에 대한 사용자 평가와 댓글을 분석하는 연구도 진행하는 등 연구 범위에 있어서 제약을 두지 않고 다양한 시도를 하고자 한다.”

빅데이터 분석을 위해 어떤 AI 알고리즘을 개발했나.

“연구의 초점이 빅데이터를 분석·활용하는 데 맞추어져 있기 때문에, 새로운 AI 알고리즘을 개발하기보다는 딥러닝 알고리즘을 포함한 다양한 AI 알고리즘들을 적용·평가하는 데 주안점을 두고 있다. 최근 태국어 필기체 데이터를 직접 구축하고 인식 알고리즘으로서 다양한 AI 알고리즘을 적용하고 평가한 것이 대표적인 연구의 방향에 해당하는 예라고 할 수 있다.”

대구 도심 데이처 수집 택시. 한국과학기술정보연구원
대구 도심 데이처 수집 택시. <한국과학기술정보연구원>

SKT, KT, LG U+ 등 이동통신 3사에서도 빅데이터 관련 사업을 하고 있는데 차별점이 있나.

“SKT에서 지진 관측을 위해 가속도 센서에 기반을 둔 기기를 만들고, 자사 기지국을 활용하는 사물인터넷 연구를 하거나, 이통사들이 스마트폰 기지국 데이터를 이용해 유동 인구 분석을 하는 등 활발한 빅데이터 연구에 초점을 맞추고 있다. 그렇지만, 이통사의 인프라를 벗어 나는 영역, 예를 들어 저희가 수행한 바 있는 택시 센서를 이용하는 도시 환경 빅데이터 분석이나 대기질 측정망의 최적화 연구 등은 상호 보완적 연구로 볼 필요가 있다. 수익을 추구하는 기업이 빅데이터로부터 부가가치를 창출하는 데 초점을 맞추고 있다면, 공공의 영역에서 사회 이슈를 해결하는 데 도움이 되는 기술들을 개발하는 노력 역시 필요하다고 본다.”

‘빅데이터 기반 활동성 팬데믹 모델’ 연구가 흥미롭다. 활동성 팬데믹 모델이 실제 적용된 사례가 있나.

“2020년 사상 초유의 팬데믹이 발생하였을 때 세계 주요 국가들이 여러 시행착오를 거치는 것을 봤다. 해당 연구는 국가들의 조치가 어떻게 사람들의 움직임에 영향을 주고, 그 인과관계가 어떻게 이뤄지는지 파악하기 위해 수천 건의 영문 기사들을 분석해 모델을 수립해 본 것이다. 실제 적용 사례는 없지만 향후 유사한 팬데믹이 발생할 경우 확진자·사망자 등의 통계 숫자만으로 파악할 수 없는 팬데믹 상황에 대한 이해가 가능하리라 본다. 해당 연구는 과학기술정통부의 주간기술동향, ICT Brief 등에 소개됐다.”

유튜브 동영상 댓글 연구는 어떤 목적으로 진행됐고 어떤 결과가 나왔는지 궁금하다.

“현재 진행 중인 연구이며, 동영상에 사용자들이 부여하는 ‘좋아요·싫어요’ 비율이 같은 주제임에도 편차가 심하게 나타나는 현상을 파악하고, 그 원인과 유형을 분석하고자 시작했다. 감성 분석 기술, 정보 추출 기술 등이 적용될 예정이다.”

지난 3월 국내 최대 빅데이터 분석 플랫폼 ‘썸트렌드’가 유튜브 분석 서비스를 출시했다는 기사를 봤다. 현재 빅데이터 분석 기술이나 플랫폼 연구 동향이 궁금하다.

“썸트렌드, 구글 트렌드 등 대부분의 빅데이터 분석 플랫폼은 사용자들이 검색하거나 포스팅한 단어들에 기반해서 그 빈도 추이를 추적하고 있다. 통계 정보로서 유의미할 수 있지만, 왜 그런 단어들이 주목을 받는지에 대해서는 관련된 수많은 정보들을 동시에 분석할 필요가 있다. 제가 관심을 가지는 주요한 영역이라고 할 수 있다.”

분석해보고 싶은 사회적 이슈나 대상이 있나. 또 향후 연구계획은 어떻게 되나.

“현재 많은 지자체가 통신사 모바일 데이터에 기반 한 유동 인구 데이터를 매우 비싼 가격으로 구독하고 있는 실정이다. 지자체의 유동 인구를 파악하고 이를 기반으로 효율적인 행정을 하는 데는 나름의 의미가 있지만, 결국 자체적인 데이터 확보를 하지 못하고, 계속 의존할 수밖에 없는 상황에 빠지고 있다. 자체 차량을 이용해 인공지능으로 보행자를 인식하는 후속 연구를 통해서 실제 지자체에 어느 정도의 인구가 어떻게, 언제 움직이는지, 그 원인은 무엇인지 등 도시 계획 수립에 도움이 되는 데이터를 생성하고 분석하고 싶다. 결국 초연결된 사물과 사람 간의 네트워크 분석이 성공적인 4차 산업혁명의 실현과 사회 현안 해결에 도움이 될 것이라고 생각한다.”

인사이트코리아, INSIGHTKOREA

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.