강연요약
기조강연
-
류정혜 대표의장
과실연
AI 대전환시대 기업과 일의 미래
인공지능 기술의 비약적 발전은 산업 구조와 사회 시스템 전반에 걸쳐 근본적인 변화를 촉발하고 있다. 기업의 경영 전략, 생산·서비스 혁신, 고객 가치 창출 등 다양한 영역에서 AI의 적용이 가속화되면서 조직의 운영 방식과 경쟁 구도가 새롭게 재편되고 있다. 동시에 노동 시장에서는 자동화와 인간-기계 협업의 확산, 직무와 역량의 재정의, 전문성의 전환 등 본질적인 변화가 진행되고 있으며, 이는 개인과 사회에 새로운 과제를 제기한다. 기업현장에서 나타나는 AI 도입의 구체적 양상과 그 파급효과를 분석하고, 일의 변화가 갖는 학문적·실천적 함의를 고찰한다. 나아가 AI 대전환시대에 요구되는 기업의 역할,일의 미래,그리고 기술발전을 둘러싼 제도적·윤리적과제들을 함께 논의하고자 한다.
-
홍민철 교수
숭실대학교
함께 연구 활동하기 위한?
인공지능 및 반도체 분야의 비약적인 발전으로 동일 학문 분야를 포함하여 다학제간 협동 연구의 필요성이 대두되고 있다. 본 강연에서는 영상신호 처리 분야에서 37년간 발표자의 국내외 연구 활동을 간략히 소개하고, 지난 25년간의 대한전자공학회 인공지능신호처리소사이어티 연구자들과의 공동 연구 내용을 소개한다. 특히 학제간 공동 연구를 진행하기 위한 연구 및 연구 외적인 내용들에 대해 생각해 보는 시간을 갖도록 한다.
초청강연
-
변우진 본부장
ETRI
국가전략기술과 ETRI 대경권연구본부 연구 추진 현황
신정부에서 추진 예정인 국가전략기술과 향후 연구개발 정책에 대해 예측해 보고, 대구ㆍ경북권역에 위치하고 있는 ETRI 지역 본부인 대경권연구본부가 지역 인프라 지능화와 미래 신산업 경쟁력을 높이기 위해 추진하고 있는 AI 기반의 응용 기술(스마트시티, 로봇, 모빌리티, 헬스케어) 연구개발 현황을 소개하고 미래 방향에 대해 고민하고자 한다.
-
윤종필 센터장
KITECH
자율제조를 위한 인공지능 기술의 현재와 미래
최근 인공지능 기술의 발전은 눈부시게 빠르게 이루어지고 있으며, 제조업 역시 그 흐름에서 예외가 아니다. 제조 현장에서는 결함 검사, 설비 진단, 설계 자동화, 물류 관리, 공정 제어 및 최적화 등 다양한 영역에 AI 기술이 적용되면서 새로운 혁신이 진행되고 있다. 그러나 제조업 특유의 데이터 부족, 불균형, 노이즈 등으로 인한 데이터 관점의 한계와, 실제 현장에서의 신뢰성, ,설명 가능성, 처리 속도 등 상용화 관점의 제약은 여전히 극복해야 할 과제로 남아 있다. 이번 강연에서는 이러한 난제를 해결하기 위한 현재의 노력들과 앞으로의 기술 개발 방향에 대해 살펴보고자 한다.
우수신진연구자
-
유재준 교수
UNIST
Expanding the Limits of Our Perception via Generative AI
In an era where imaging technologies are pushing the boundaries of what we can perceive, generative AI has emerged as a transformative tool. In this talk, I will explore how state-of-the-art generative models are redefining image processing, reconstruction, and enhancement across diverse applications. By leveraging advanced image priors, generative models enable groundbreaking solutions in areas such as spatio-temporal super-resolution, video generation, and biomedical imaging. Our research focuses on developing powerful generative models capable of addressing complex challenges in arbitrary-scale spatio-temporal video super-resolution and unsupervised biomedical image reconstruction. These models not only enhance visual fidelity but also adapt seamlessly to multidimensional data, bridging gaps in resolution, scale, and modality. Furthermore, we explore cutting-edge generative paradigms, including video diffusion models and 3D generative architectures, to expand their applicability in dynamic and 3D imaging contexts. Through these efforts, we aim to transcend the traditional boundaries of imaging and pave the way for applications that were previously deemed unattainable. In this talk, I will share the implications of our findings, and discuss the broader potential of generative AI in revolutionizing our understanding of the visual world.
신진연구자발표
-
권혁준 교수
중앙대학교
Toward Efficient Customization of Large Vision Models
최근 AI 지형은 대규모 데이터셋과 연산 자원을 기반으로 학습된 거대 모델 중심으로 빠르게 재편되고 있습니다. Computer Vision 역시 예외가 아니며, 대규모 비전 모델(Large Vision Models, LVM)은 뛰어난 성능과 범용성을 바탕으로 다양한 분야로 확장되는 추세입니다. 그러나 모든 도메인과 사용자의 세부 요구를 단일 모델로 충족시키기는 쉽지 않습니다. 이에 따라 사전 학습된 LVM을 배포한 뒤, 이를 개별 과제나 환경에 맞게 미세 조정(Fine-tuning)하는 접근이 널리 활용되고 있습니다. 하지만 실제 적용 단계에서는 데이터셋 구축 부담, 연산 자원 제약, 전문 인력 의존성 등 여러 현실적 어려움이 존재합니다. 본 강연에서는 이러한 문제를 해결하기 위한 LVM의 효율적 맞춤화(Efficient Customization)를 소개하고, 관련된 최신 연구 동향을 살펴봅니다.
-
이상준 교수
전북대학교
딥러닝 기반의 영상처리 응용 기술
본 세미나에서는 로보틱스와 영상생체신호 분야에서의 딥러닝 기반 영상처리 응용 기술에 대하여 소개한다. 로보틱스 분야의 AI 관점에서는 모바일 로봇의 주행환경 인식 기술과 3차원 환경인지를 위한 딥러닝 기술을 소개한다. 또한, 얼굴영상을 기반으로 사용자의 심박수를 인식하기 위한 영상생체신호 분석기술과 운전자 모니터링 시스템에의 활용 방법에 대하여 발표한다. 다양한 분야에서의 딥러닝 기반 영상처리 기술에 대하여 소개함으로써 도메인의 특성을 반영한 영상인식기술의 연구개발 방법에 대하여 알리고자 한다.
-
지서원 교수
건국대학교
Complementary Learning in Image Processing
최근 영상처리 분야에서는 다양한 딥러닝 기반 기법들이 제안되며, 블러 제거, 깊이 예측 등 고난이도 시각적 태스크에서 높은 성능을 보이고 있다. 이러한 기법 중 일부는 문제를 직접적으로 해결하기보다는 문제를 하위 문제로 분해하고, 각 하위 요소를 보완적으로 학습하는 전략을 통해 더 효율적이고 정밀한 결과를 도출한다. 본 강연에서는 이러한 보완 학습(complementary learning)의 개념을 소개하고, 대표 사례로서 방향 분리 기반의 이미지 디블러링(XYDeblur)과 Hilbert curve 기반의 고정밀 depth 예측 기법을 소개한다. 그리고 이를 통해 복잡한 이미지 처리 문제를 구조적으로 해결하는 접근법의 가능성을 모색한다.
-
박대희 교수
DGIST
Prediction and Planning for Physical AI in Robotics and Autonomous Driving
최근 피지컬 AI의 핵심 과제는 인지에 머무르지 않고 실제 세계에서 안전하고 효율적인 행동을 생성하는 것이다. 본 강연은 컴퓨터비전과 딥러닝을 바탕으로 사람(보행자·로봇)과 자동차를 대상으로 한 예측(prediction)과 계획(planning) 기술을 소개한다. 다중 에이전트 상호작용을 고려한 궤적 예측, 의도 추론, 불확실성 모델링, 그리고 폐루프 행동 계획을 중심으로 접근법과 학습 전략을 설명한다. 실제 자율주행과 로봇 플랫폼 적용 사례를 정리하고, 예측과 계획의 통합을 통한 차세대 피지컬 AI의 연구 방향을 제안한다.
-
이재협 교수
경북대학교
Face Matting with Model Uncertainty Estimation
Face matting aims to separate facial regions from occlusions such as hands, hair, or accessories, a challenge for real-world face transformation tasks. In this talk, I present FaceMat, a novel trimap-free framework guided by per-pixel uncertainty. Our two-stage pipeline first trains a teacher network to jointly predict alpha mattes and uncertainty maps, then distills this knowledge into a student model via uncertainty-guided adaptive learning. We further introduce CelebAMat, a large-scale synthetic dataset designed for occlusion-aware face matting. Experiments demonstrate state-of-the-art performance in both quantitative metrics and visual quality under challenging occlusions. This work highlights the role of uncertainty estimation as a supervisory signal, improving robustness and enabling practical real-time applications in video-based face filtering.
-
이호섭 교수
금오공과대학교
초실감형 디스플레이를 위한 시야 확장 및 화질 개선 딥러닝 기술
최근 딥러닝 기반 인공지능 기술은 초실감형 디스플레이 환경에서의 화질 향상에 중요한 역할을 하고 있다. 그러나 몰입형 콘텐츠나 AR·VR 디바이스에서는 화질 저하가 사용자의 시청 경험을 떨어뜨리는 요인이 되며, 이를 극복하기 위한 다양한 모델들이 개발되어 왔다. 셀프 어텐션(Self-Attention) 기반 딥러닝 모델은 뛰어난 성능을 보이지만, 높은 계산 복잡도로 인해 실시간 처리나 경량화된 기기 적용에 어려움이 있다. 따라서, 연산량을 줄이면서도 다양한 환경에서 안정적으로 동작 가능한 범용 모델의 필요성이 커지고 있다. 본 강연에서는 초실감형 디스플레이에서 발생하는 주요 시야 제한 및 화질 저하 원인을 분석하고, 기존 복원·향상 및 시야 확장 기법을 살펴본다. 이어서, 기존 연구에서 제안된 방법들의 한계와 문제점을 분석하고, 이를 해결하기 위해 개발된 초실감형 디스플레이 환경을 위한 딥러닝 모델을 소개한다.
튜토리얼
-
박관용 교수
서울시립대학교
시각-언어 생성 모델의 최신 연구 동향 및 응용
본 강연에서는 시각–언어 생성 모델의 최신 연구 동향과 다양한 응용 사례를 폭넓게 다루고자 한다. 먼저 시각–언어 이해 및 추론에 특화된 대표적인 생성 모델 (LLaVA 시리즈 등)을 소개하고, 경량화·개인화 등 최신 활용 전략을 살펴본다. 이어 시각 콘텐츠 생성 분야의 대표 모델(Stable Diffusion 시리즈 등)과 이를 활용한 콘텐츠 편집, 경량화, 개인화 사례를 다룬다. 마지막으로 이해와 생성 기능이 통합된 차세대 멀티모달 파운데이션 모델의 구조를 다루며, 앞으로의 발전 방향에 대해 논의하고자 한다.
-
홍성은 교수
성균관대학교
멀티모달학습 핵심 개념 및 트렌드
본 튜토리얼에서는 멀티모달 AI의 핵심 개념과 최신 이론, 주요 트렌드를 다룬다. Multimodal AI 분야의 대표적인 Foundation 모델을 중심으로 멀티모달 AI의 기본 원리와 구조를 소개한다. 특히 최근 연구에서 주목받는 멀티모달 표현 학습, 대규모 사전학습과 파인튜닝 기법, 모달 간 정렬 및 융합 전략, 평가 지표와 벤치마크 변화 등을 심층적으로 분석한다. 또한 텍스트·이미지·음성·비디오 등 다양한 모달을 처리하는 최신 아키텍처 경향성을 분석한다.