CogBlender: Towards Continuous Cognitive Intervention in Text-to-Image Generation
이 논문은 텍스트-이미지 생성 과정에서 이미지 사용자가 인지하는 정서적 반응이나 기억력 등 인지적 속성을 다차원적으로 정밀하게 제어할 수 있도록 'Cognitive Space'와 'Semantic Manifold' 간의 매핑을 기반으로 한 새로운 프레임워크 'CogBlender'를 제안합니다.
2559 편의 논문
이 논문은 텍스트-이미지 생성 과정에서 이미지 사용자가 인지하는 정서적 반응이나 기억력 등 인지적 속성을 다차원적으로 정밀하게 제어할 수 있도록 'Cognitive Space'와 'Semantic Manifold' 간의 매핑을 기반으로 한 새로운 프레임워크 'CogBlender'를 제안합니다.
이 논문은 다양한 모달리티 간의 고유한 차이를 고려한 모달리티 인식 퓨전과 RGB 및 X 모달 스트림의 시계열 정보를 독립적으로 처리하는 분해된 시간 전파 메커니즘을 도입하여, 다섯 가지 멀티모달 추적 벤치마크에서 최첨단 성능을 달성한 새로운 프레임워크 MDTrack 을 제안합니다.
이 논문은 오픈소스 코드 저장소를 자동으로 표준화하여 LLM 에이전트가 신뢰성 있게 실행할 수 있는 MCP 호환 도구를 생성하고, 이를 통해 인간의 개입을 최소화하면서 다양한 과학 분야에서 작업 수행 능력을 향상시키는 'ToolRosetta' 프레임워크를 제안합니다.
이 논문은 작업 진행 상황을 명시적인 마일스톤으로 감지하고 실패 시 복구하는 'See, Plan, Rewind (SPR)' 프레임워크를 제안하여, 추가 학습 없이도 LIBERO 및 LIBERO-Plus 벤치마크에서 기존 모델보다 뛰어난 강건성과 일반화 성능을 달성함을 보여줍니다.
이 논문은 네트워크 지연이 네트워킹 가상현실 (NVR) 화이트보드 협업의 실용적 및 쾌락적 차원 QoE 에 미치는 영향을 다양한 협업 모드와 플랫폼 (아바타 유무, PC 기반) 을 비교 분석하여 체계적으로 규명하고 최적화 방안을 제시합니다.
이 논문은 여러 작업 간 간섭을 방지하고 새로운 작업을 순차적으로 학습할 수 있도록 단일 VLA 백본에 작업별 경량 LoRA 전문가를 동적으로 연결하는 확장 가능한 로봇 학습 프레임워크 'CORAL'을 제안합니다.
이 논문은 텍스트 맥락에 의존하지 않고 음성 내의 비언어적 단서와 감정 정보를 융합하여 일본어 공감 대화에서 적절한 감정적 수용 (Validation) 시점을 탐지하는 새로운 모델을 제안하고, 이를 통해 더 공감적인 인간 - 로봇 상호작용을 가능하게 함을 보여줍니다.
이 논문은 제한된 엔트로피를 생성하는 IoT 장치들을 위해 RISC-V 기반의 신뢰 실행 환경 (TEE) 을 활용하여 외부 엔트로피 공급 서비스를 구축하고, 이를 통해 암호화 키 생성에 필요한 안전한 무작위성을 효과적으로 해결하는 방안을 제시합니다.
이 논문은 생성된 SVG 의 렌더링 결과를 시각적으로 피드백하여 생성기와 비판가가 상호작용하는 '생성 - 검토 - 정제' 루프를 통해 텍스트 기반 SVG 생성의 품질과 복잡성을 획기적으로 향상시킨 'IntroSVG' 프레임워크를 제안합니다.
이 논문은 곡면 비시각 촉각 센서의 보정을 위해 일상적인 물체와의 간단한 접촉만으로 정밀한 3D 재구성을 가능하게 하는 효율적이고 물리 일관성이 있는 NLiPsCalib 프레임워크와 이를 검증한 NLiPsTac 센서를 제안합니다.
이 논문은 MLLM 의 정밀한 시각적 불일치 감지 능력을 평가하기 위한 'OddGridBench' 벤치마크를 제안하고, 커리큘럼 학습과 거리 기반 보상을 결합한 강화학습 프레임워크 'OddGrid-GRPO' 를 통해 해당 능력을 획기적으로 향상시키는 방법을 제시합니다.
이 논문은 2025 년 3~4 월에 Ahmia 검색 엔진 등 세 가지 경로를 통해 배포된 허니팟을 활용하여 토르 사용자의 실제 관심사를 분석한 결과, 대부분의 인간 사용자는 Ahmia.fi 에서 유입되었으며 특히 아동 성착취물 (CSAM) 테마의 허니팟에서 가장 높은 참여도를 보였음을 밝혔습니다.
이 논문은 ESP32 의 Xtensa LX6 마이크로컨트롤러에서 부동소수점 연산의 오버헤드를 줄이고 실시간 성능을 향상시키기 위해 Q16.16 고정소수점 연산, CORDIC 삼각함수 모듈, 그리고 런타임 정밀도 전환 메커니즘을 통합한 동적 정밀도 수학 엔진을 설계하고 평가한 연구입니다.
이 논문은 ChatGPT 를 활용해 실제 시스템 요구사항 명세서 (SyRS) 에 접근하지 않고도 10 개 산업 분야에서 300 개의 합성 명세서를 생성한 탐색적 연구 결과를 바탕으로, 생성된 명세서가 전문가 평가에서 62% 의 현실성을 보였으나 모순과 결함이 발견되어 LLM 기반 품질 평가는 전문가 평가를 완전히 대체할 수 없음을 시사합니다.
이 논문은 분류 작업에 국한되었던 테스트 시간 적응 (TTA) 기법을 이미지 회귀 문제로 확장하기 위해, 소스 데이터 없이도 소스 예측 지지 공간과 직교 여공간을 동시에 정렬하는 '예측 스펙트럼 보정 (PSC)'이라는 새로운 프레임워크를 제안하고 있습니다.
이 논문은 AI 가 벡터 검색의 성능을 향상시키고, 벡터 검색이 RAG 를 통해 LLM 의 한계를 보완하는 상호 선순환 관계를 형성하며, 이를 통해 지능형 정보 시스템의 새로운 연구 영역을 개척하는 최신 연구 동향과 미래 과제를 종합적으로 다룹니다.
이 논문은 잠재 공간의 반복적 최적화를 기반으로 하여, 압축 및 이미지 처리와 같은 다양한 공격에 대한 견고성을 크게 향상시키면서도 정보 은닉의 증명 가능한 보안성을 유지하는 새로운 스테가노그래피 프레임워크를 제안합니다.
이 논문은 기존 인간과 모델의 협력 방식을 넘어 다중 에이전트 시스템과 전통적 모델이 협력하는 'ProvAgent' 프레임워크를 제안하여, 정교한 신원 - 행동 바인딩과 가설 검증 기반의 자율 조사를 통해 고급 지속 위협 (APT) 의 탐지 및 재구성을 효율적으로 수행함을 보여줍니다.
이 논문은 뇌졸중 평가용 CT 관류 이미징의 비정형 역문제 해결을 위해 물리 법칙과 증거론적 딥러닝을 결합하여 물리 제약 위반에 따른 불확실성을 정량화하고 정확도와 신뢰성을 동시에 향상시킨 'EPPINN' 프레임워크를 제안하고 임상 데이터에서 우수한 성능을 입증했습니다.
이 논문은 고정된 시야각 (FoV) 에 의존하는 기존 방법의 한계를 극복하고, 이중 판별 학습과 커리큘럼 학습 전략을 통해 단일 모델만으로도 다양한 시야각과 방향 변화에 강인한 교차 뷰 지리 위치 추정 (CVGL) 을 가능하게 하는 'SinGeo'프레임워크를 제안합니다.