ELLA: Generative AI-Powered Social Robots for Early Language Development at Home
이 논문은 가정에서 유아의 언어 발달을 지원하기 위해 생성형 AI 를 활용한 사회적 로봇 'ELLA'를 설계·배포하고, 부모와 교육자 인터뷰 및 가정 내 워크숍을 통해 얻은 인사이트와 아동의 참여 양상을 분석하여 향후 설계 시사점을 제시합니다.
11345 편의 논문
이 논문은 가정에서 유아의 언어 발달을 지원하기 위해 생성형 AI 를 활용한 사회적 로봇 'ELLA'를 설계·배포하고, 부모와 교육자 인터뷰 및 가정 내 워크숍을 통해 얻은 인사이트와 아동의 참여 양상을 분석하여 향후 설계 시사점을 제시합니다.
이 논문은 품질 다양성 (Quality Diversity) 기법과 비전 - 언어 모델을 결합하여 VLA 기반 로봇의 취약점을 발견하고 다양한 자연어 지시문을 생성함으로써 로봇 정책의 견고성을 향상시키는 Q-DIG 프레임워크를 제안합니다.
이 논문은 LLM 평가자가 전역 상관관계는 높게 나타내도 실제 '베스트 오브 N' 선택 작업에서는 within-prompt 순위 능력 부족과 동점 발생으로 인해 성능이 크게 저하될 수 있음을 지적하며, 이를 해결하기 위해 전역 일치도 대신 쌍별 비교와 within-prompt 신호를 평가 지표로 삼아야 함을 주장합니다.
이 논문은 구글 제미니, 메타 라마 등 다양한 대형 언어 모델 (LLM) 의 출력을 실시간으로 비교하고 문장 수준의 편향을 탐지하여 시각화하는 오픈소스 웹 플랫폼인 'LLM BiasScope'를 소개합니다.
이 논문은 대형 추론 모델의 과도한 추론을 방지하고 추론 길이를 14%~55% 단축하면서도 성능을 유지하기 위해, 최종 답변이 처음 나타나는 시점을 예측하여 최적의 중단 지점을 학습하는 새로운 조기 종료 전략 'TERMINATOR'를 제안합니다.
이 논문은 사전 학습된 비전 - 언어 모델의 고정된 백본을 활용하면서도 참조 이미지 분할의 정밀한 공간 위치 파악과 경계 선정을 위해 경량화된 표현 인식 전문가 어댑터와 퓨전 모듈을 도입한 SERA 아키텍처를 제안합니다.
이 논문은 2026 년 기준 리소스가 제한된 엣지 플랫폼에 양자 머신러닝을 적용하는 것의 실현 가능성과 하이브리드 아키텍처 및 양자 코프로세서 구현 경로를 분석하고, 주요 기술적 장벽을 극복하기 위한 공학적 방향과 책임 있는 배포를 위한 거버넌스 방안을 제시합니다.
이 논문은 엣지 디바이스와 클라우드 서버 간의 네트워크 지연 및 손실과 같은 현실적인 통신 제약 조건을 시뮬레이션 중 학습 과정에 명시적으로 반영하여 분산 강화학습 정책의 배포 성능 격차를 획기적으로 줄이는 'CALF(Communication-Aware Learning Framework)'를 제안합니다.
이 논문은 확산 언어 모델 (DLM) 에 적용하기 위해 엔트로피 기반 단계 선택과 단계별 이득을 활용한 효율적인 강화 학습 알고리즘을 제안하여, 기존 방법의 편향을 해소하고 코딩 및 논리적 추론 분야에서 최첨단 성능을 달성했습니다.
이 논문은 도구 오염 하에서도 기존 랭킹 지표가 안전성 저하를 감지하지 못해 위험한 추천이 지속되는 'AgentDrift' 현상을 규명하고, 이를 해결하기 위해 안전성을 명시적으로 반영한 평가 지표와 궤적 수준의 모니터링이 필요함을 주장합니다.
이 논문은 기존 다중 모달 MRI 번역 방법의 해부학적 불일치와 질감 저하 문제를 해결하기 위해 잠재 공간에서 스타일과 구조를 분리하고 다중 스케일 특징을 활용하여 MSG-LDM 이라는 새로운 프레임워크를 제안하고, BraTS2020 및 WMH 데이터셋에서 기존 방법보다 우수한 구조 재구성 성능을 입증했습니다.
이 논문은 이기종 엣지 디바이스 환경에서 곡률 기반 중요도 점수와 경량 재구성을 통해 개인화된 구조적 가지치기를 수행하면서도 전역 모델의 수렴성과 정확도를 보장하는 'CA-HFP' 프레임워크를 제안하고, 이를 통해 통신 및 계산 비용을 크게 절감하면서도 기존 방법보다 우수한 성능을 입증합니다.
이 논문은 RAPTOR 기반 대중교통 경로 탐색 알고리즘의 성능 병목 현상을 해결하기 위해, 최적성을 유지하면서 쿼리 시간을 최대 57% 단축하는 '조기 가지치기 (Early Pruning)' 기법을 제안합니다.
이 논문은 개인화된 RLHF 에서 발생하는 후방 붕괴 (posterior collapse) 문제를 해결하기 위해 가상의 스왑 주석자와 그 선호도의 대칭성을 활용한 '스왑 유도 선호 학습 (SPL)'을 제안하여 사용자별 잠재 변수의 표현력을 강화하고 선호도 예측 성능을 개선합니다.
이 논문은 PPO 의 반복 학습에서 발생하는 노이즈 문제를 해결하기 위해 여러 모델의 예측을 평균화하는 'CAPO' 알고리즘을 제안하여, 추가적인 환경 상호작용 없이도 계산 자원을 깊게가 아닌 넓게 활용함으로써 샘플 효율성을 극대화함을 보여줍니다.
이 논문은 Feynman 이라는 에이전트를 통해 도메인 지식과 코드를 결합하여 대량의 정렬된 다이어그램 - 캡션 데이터셋과 시각적 추론 평가 벤치마크인 Diagramma 를 생성하는 확장 가능한 시각 디자인 파이프라인을 제안합니다.
이 논문은 부정적 의미를 명시적으로 포함하는 새로운 데이터셋 'D-Negation'과 그룹화된 반대 기반 학습 프레임워크를 제안하여, 기존 비전 - 언어 모델이 부정 표현을 처리하는 능력을 획기적으로 향상시켰음을 보여줍니다.
이 논문은 자율주행의 모방 학습 기반 계획 성능을 향상시키기 위해 미래 변위 예측을 통한 공간 인식 강화와 다양한 주행 상황에 적응하는 다중 전문가 디코더를 도입한 'CarPLAN' 프레임워크를 제안하고, nuPlan 및 Waymax 벤치마크에서 최첨단 성능을 입증합니다.
이 논문은 차원별 엔트로피 조절과 연속 분포 비평가라는 새로운 기법을 통해 최대 엔트로피 강화학습이 고차원 인간형 로봇 제어에서 결정적 정책 기반 방법과 경쟁하거나 이를 능가할 수 있음을 입증하는 'FastDSAC' 프레임워크를 제안합니다.
이 논문은 문학 서사를 활용한 새로운 평가 프레임워크를 통해 기존 AI 윤리 평가가 표면적 답변 생성에 그치는 반면, 본 연구는 다양한 AI 시스템에서 진정한 도덕적 추론 능력과 거부 행동을 측정할 수 있음을 입증하고, 시스템 능력 향상과 함께 정교해지는 반성적 실패 모드를 규명하여 고위험 분야 배포 결정에 중요한 함의를 제시합니다.