cs 편의 논문 | Gist.Science

A dataset of medication images with instance segmentation masks for preventing adverse drug events

이 논문은 약물 오류를 예방하기 위해 다양한 실제 환경의 조건을 반영한 32 종의 약물 이미지와 인스턴스 분할 마스크로 구성된 'MEDISEG' 데이터셋을 제안하고, 이를 통해 YOLO 모델의 높은 성능과 소수 샘플 학습 환경에서도 효과적으로 적용 가능한 범용성을 입증했습니다.

W. I. Chu, S. Hirani, G. Tarroni, L. Li2026-03-12💻 cs

Spatially conditioned dynamics between population and built form

이 논문은 체코의 지역별 인구와 건축 환경 간의 관계를 정량화하기 위해 공간적으로 명시적인 프레임워크를 개발하여, 건축 형태가 사회적 불평등을 어떻게 재생산하는지 공간적 이질성을 고려해 분석한 결과를 제시합니다.

Anna Brazdova, Martin Fleischmann2026-03-12💻 cs

Evaluating Few-Shot Pill Recognition Under Visual Domain Shift

이 논문은 실제 배포 환경의 시각적 도메인 시프트를 고려할 때, 소량의 레이블 데이터만으로도 약물의 의미적 분류는 효과적으로 적응되지만 중첩 및 가려짐 조건에서는 위치 파악과 재인식 성능이 저하됨을 보여주며, 현실적인 다중 약물 데이터로 학습하는 것이 배포 준비도 향상에 중요함을 강조합니다.

W. I. Chu, G. Tarroni, L. Li2026-03-12💻 cs

MAD: Memory Allocation meets Software Diversity

이 논문은 DRAM 오류로 인한 RowHammer 공격을 해결하기 위해 메모리 할당과 소프트웨어 다양성 원리를 결합하여 엔트로피 부족 문제를 극복하고, 성능 저하 없이 공격을 지연시켜 대응 시간을 확보하는 'MAD'라는 새로운 방어 기법을 제안합니다.

Manuel Wiesinger, Daniel Dorfmeister, Stefan Brunthaler2026-03-12💻 cs

Topological Analysis for Identifying Anomalies in Serverless Platforms

이 논문은 호지 분해 (Hodge decomposition) 를 활용한 위상적 모델을 통해 서버리스 플랫폼의 복잡한 정보 흐름을 분석하고, 구조적 특성으로 나타나는 조화 흐름을 식별하여 시스템 재구축 없이도 효율성을 개선할 수 있는 실용적인 대응 전략을 제시합니다.

Gianluca Reali, Mauro Femminella2026-03-12💻 cs

UltrasoundAgents: Hierarchical Multi-Agent Evidence-Chain Reasoning for Breast Ultrasound Diagnosis

이 논문은 유방 초음파 진단의 임상 워크플로우를 모방하여 병변 국소화, 세밀한 특징 분석, 증거 기반 추론을 수행하는 계층적 다중 에이전트 프레임워크 'UltrasoundAgents'를 제안하고, 오차 전파를 완화하기 위한 분해형 점진적 학습 전략을 통해 진단 정확도와 설명 가능성을 동시에 향상시켰음을 보여줍니다.

Yali Zhu, Kang Zhou, Dingbang Wu, Gaofeng Meng2026-03-12💻 cs

OSUM-Pangu: An Open-Source Multidimension Speech Understanding Foundation Model Built upon OpenPangu on Ascend NPUs

이 논문은 GPU 기반 생태계에 의존하지 않고 아센드 (Ascend) NPU 하드웨어와 오픈파누 (OpenPangu) LLM 을 기반으로 구축된 최초의 완전 오픈소스 다차원 음성 이해 기반 모델인 OSUM-Pangu 를 소개하며, 비 CUDA 환경에서도 주요 GPU 기반 모델과 유사한 성능을 달성함을 보여줍니다.

Yujie Liao, Xuelong Geng, Hongfei Xue, Shuiyuan Wang, Lei Xie2026-03-12💻 cs

Beyond Sequential Distance: Inter-Modal Distance Invariant Position Encoding

이 논문은 긴 컨텍스트에서 발생하는 시각적 페이드 현상을 해결하기 위해, 텍스트와 시각 토큰 간의 거리 의존성을 제거하고 상호작용을 고정된 근접성으로 유지하는 새로운 '모달 간 거리 불변 위치 인코딩 (DIPE)'을 제안합니다.

Lin Chen, Bolin Ni, Qi Yang, Zili Wang, Kun Ding, Ying Wang, Houwen Peng, Shiming Xiang2026-03-12💻 cs

Exploring Indicators of Developers' Sentiment Perceptions in Student Software Projects

이 논문은 81 명의 학생을 대상으로 한 설문 연구를 통해 개발자의 기분 특성과 상황적 요인이 텍스트 기반 메시지의 감정 인식에 미치는 영향을 분석한 결과, 개인의 감정 인식은 안정적이지 않으며 문장 자체의 모호성에 크게 의존함을 밝혔습니다.

Martin Obaidi, Marc Herrmann, Jendrik Martensen, Jil Klünder, Kurt Schneider2026-03-12💻 cs

FG-CLTP: Fine-Grained Contrastive Language Tactile Pretraining for Robotic Manipulation

이 논문은 정성적 설명을 넘어 힘, 접촉 기하학, 주축 방향 등 정량적 접촉 상태를 포착하는 대규모 데이터셋과 토큰화 기법을 도입한 FG-CLTP 프레임워크를 제안하여, 로봇의 정밀 조작을 위한 3D 촉각 - 언어 - 행동 (3D-TLA) 모델의 성능을 획기적으로 향상시켰습니다.

Wenxuan Ma, Chaofan Zhang, Yinghao Cai, Guocai Yao, Shaowei Cui, Shuo Wang2026-03-12💻 cs

Bilevel Layer-Positioning LoRA for Real Image Dehazing

이 논문은 CLIP 기반의 비지도 텍스트 지시 손실 함수와 네트워크의 핵심 계층을 자동으로 탐색하여 주입하는 이계층 LoRA 전략 (BiLaLoRA) 을 제안함으로써, 레이블 없는 다양한 실제 안개 환경에서 기존 최첨단 방법보다 우수한 성능을 보이는 이미지 dehazing 방법을 제시합니다.

Yan Zhang, Long Ma, Yuxin Feng, Zhe Huang, Fan Zhou, Zhuo Su2026-03-12💻 cs

RL-Augmented MPC for Non-Gaited Legged and Hybrid Locomotion

이 논문은 강화학습 (RL) 이 고수준의 보행 및 항법 명령을, 모델 예측 제어 (MPC) 가 저수준의 구동 제어를 담당하는 계층적 아키텍처를 제안하여, 도메인 랜덤화 없이 시뮬레이션과 실제 120kg 휴머노이드 로봇 (Centauro) 에서 비주기적 보행 및 다양한 지형에서의 제로샷 이동을 성공적으로 구현했음을 보여줍니다.

Andrea Patrizi, Carlo Rizzardo, Arturo Laurenzi, Francesco Ruscelli, Luca Rossini, Nikos G. Tsagarakis2026-03-12💻 cs

VoxCare: Studying Natural Communication Behaviors of Hospital Caregivers through Wearable Sensing of Egocentric Audio

이 논문은 원시 오디오를 저장하지 않고 웨어러블 기기의 온디바이스 음성 기반 분석을 통해 병원 의료진 간의 자연스러운 의사소통 패턴을 실시간으로 측정하고, 이를 통해 업무 부하와 스트레스를 이해하여 의료 서비스의 질을 향상시키는 'VoxCare' 시스템을 제안합니다.

Tiantian Feng, Kleanthis Avramidis, Anfeng Xu, Deqi Wang, Brandon M Booth, Shrikanth Narayanan2026-03-12💻 cs

S2D: Sparse to Dense Lifting for 3D Reconstruction with Minimal Inputs

이 논문은 희소 입력 조건에서도 고품질의 3D 가우시안 스플래팅 (3DGS) 재구성을 가능하게 하기 위해, 희소 점 구름을 고충실도 이미지로 변환하는 확산 모델과 견고한 모델 피팅을 위한 재구성 전략을 결합한 'S2D'라는 새로운 파이프라인을 제안합니다.

Yuzhou Ji, Qijian Tian, He Zhu, Xiaoqi Jiang, Guangzhi Cao, Lizhuang Ma, Yuan Xie, Xin Tan2026-03-12💻 cs

Expressive Boundedness of Authoritative DNS Response Selection

이 논문은 DNS 프로토콜 제약 조건에 기반하여 권한 있는 DNS 응답 선택의 의미론을 공식화하고, 모든 선택 메커니즘이 유한한 정규형과 대수적 구조를 가진다는 것을 증명하여 다양한 시스템 간의 동치성과 표현력을 정밀하게 추론할 수 있는 이론적 틀을 제시합니다.

Chris Bertinato2026-03-12💻 cs

Data Augmentation and Convolutional Network Architecture Influence on Distributed Learning

이 논문은 분산 학습 환경에서 합성곱 신경망 (CNN) 아키텍처가 모델 정확도에 미치는 영향과 계산 효율성에 영향을 주는 요인들을 분석하여, 리소스 집약적인 시나리오에서의 CNN 배포 최적화를 위한 통찰력을 제공합니다.

Victor Forattini Jansen, Emanuel Teixeira Martins, Yasmin Souza Lima, Flavio de Oliveira Silva, Rodrigo Moreira, Larissa Ferreira Rodrigues Moreira2026-03-12💻 cs

Training-Free Multi-Step Inference for Target Speaker Extraction

이 논문은 사전 학습된 모델을 고정시킨 채 혼합 음성과 이전 추정치를 보간하여 생성된 후보들 중 최적의 것을 반복적으로 선택하는 훈련 없는 다단계 추론 방식을 제안하고, 침습적 및 비침습적 지표를 결합한 최적화를 통해 실제 배포에 적합한 목표 화자 추출 성능을 달성함을 보여줍니다.

Zhenghai You, Ying Shi, Lantian Li, Dong Wang2026-03-12💻 cs

Novel Architecture of RPA In Oral Cancer Lesion Detection

이 논문은 오라클 구강암 병변 탐지를 위해 싱글톤 패턴과 배치 처리를 적용한 OC-RPAv2 가 기존 방법 대비 60~100 배의 효율성 향상과 0.06 초의 초고속 예측 시간을 달성했음을 보여줍니다.

Revana Magdy, Joy Naoum, Ali Hamdi2026-03-12💻 cs

Lifelong Imitation Learning with Multimodal Latent Replay and Incremental Adjustment

이 논문은 시각, 언어, 로봇 상태 정보를 다중 모달 잠재 공간에 저장하고 각도 마진 제약을 통해 작업 간 구별성을 유지하는 점진적 조정 메커니즘을 도입하여, 제한된 메모리와 데이터 조건에서도 기존 최첨단 방법보다 뛰어난 성능과 낮은 망각률을 보이는 평생 모방 학습 프레임워크를 제안합니다.

Fanqi Yu, Matteo Tiezzi, Tommaso Apicella, Cigdem Beyan, Vittorio Murino2026-03-12💻 cs

Huffman-Bucket Sketch: A Simple $O(m)$ Algorithm for Cardinality Estimation

이 논문은 HyperLogLog 스케치를 최적의 공간 효율성으로 압축하면서도 병합 가능성과 업데이트 효율성을 유지하는 새로운 데이터 구조인 '허프먼 버킷 스케치 (HBS)'를 제안하고, 그 이론적 성능과 실용성을 입증합니다.

Matti Karppa2026-03-12💻 cs

← 이전 다음 →

cs