Applied Explainability for Large Language Models: A Comparative Study
이 논문은 SST-2 감정 분류를 위해 미세 조정된 DistilBERT 모델에 대해 Integrated Gradients, Attention Rollout, SHAP 등 세 가지 설명 기법의 실제 성능을 비교 분석하여, 각 방법론의 장단점과 트레이드오프를 실용적인 관점에서 제시합니다.
원저자가 쉬운 설명을 검토한 논문들.
이 페이지에 소개된 모든 논문은 원저자 중 최소 한 명이 저희의 쉬운 설명을 확인하여 내용이 정확하다고 확인했거나 수정 사항을 요청하여 저희가 반영한 것입니다. 확인이 각 문장을 공식적으로 승인한다는 의미는 아니지만, 설명이 논문을 쓴 당사자의 검토를 거쳤다는 뜻입니다.
저자가 검토한 논문 617편 · 461–470 / 617
이 논문은 SST-2 감정 분류를 위해 미세 조정된 DistilBERT 모델에 대해 Integrated Gradients, Attention Rollout, SHAP 등 세 가지 설명 기법의 실제 성능을 비교 분석하여, 각 방법론의 장단점과 트레이드오프를 실용적인 관점에서 제시합니다.
이 논문은 에피택셜 HfZrO 기반 페로전기 메모리 소자가 면적 의존적 터널링과 국소 전도 경로가 공존하는 두 가지 체제를 보이며, 약 10³ μm² 에서 통계적 교차가 일어나고 이는 페로전기 워크업 및 산소 공공 재분포의 시작과 상관관계를 가짐을 규명했습니다.
본 연구는 고질량 항성 형성 영역 M17 에서 원반 비율을 측정하기 위해 심층 VLT/HAWK-I 광도 측정을 활용하여, 국지적 자외선 플럭스는 역학적 혼합으로 인해 원반 생존과 상관관계가 없음을 발견했으나, 유사한 나이의 다른 영역들과의 비교를 통해 외부 광증발이 평균 원반 수명을 현저히 단축시킨다는 것을 확인했다.
이 논문은 기존 전산유체역학의 한계를 극복하기 위해 어텐션 메커니즘이 적용된 U-Net 아키텍처를 기반으로 한 딥러닝 모델인 -FlowNet 을 제안하여, 불규칙한 형태의 마이크로채널 내 유동장을 기존 방법들보다 높은 정확도로 예측하고 매핑하는 방법을 제시합니다.
이 논문은 참이고 정제 가능한 지식을 가진 합리적 에이전트가 스스로 모든 것을 알고 있는지 여부를 알 수 없다는 인식론적 한계를 증명하며, 이는 타율성에 대한 내성이나 새로운 사건 학습으로도 해결되지 않음을 보여줍니다.
이 논문은 질량을 가진 장이 등각 대칭을 깨뜨려 널-변위된 린들러 웨지에서의 가속 관찰자가 경험하는 열적 응답이 무너지고 비열적 반응으로 나타난다는 것을 보여줍니다.
이 논문은 메모리스 대학교 지도 기반의 2D 커스텀 트랙 환경에서 7 개 센서 데이터를 활용하여 우선순위 기반 행동 선택 메커니즘을 도입한 개선된 심층 Q-학습 (DQN) 모델을 구현하고, 기존 DQN 및 일반 신경망 대비 평균 보상이 각각 약 60% 와 50% 향상된 것을 확인했다고 요약할 수 있습니다.
이 연구는 당뇨병이 없는 미국 성인에서 현재 흡연은 HbA1c 수치를 높이는 것과 유의한 연관이 있지만, 과거 흡연자는 그렇지 않음을 밝혀 흡연 중단 시 그 영향이 감소할 수 있음을 시사합니다.
본 논문은 Euclid 의 초기 데이터와 다중 파장 관측 자료를 활용하여 저질량 은하에서 9 개의 이중 활동성 은하핵 (AGN) 후보를 최초로 확인함으로써, 저질량 블랙홀 쌍의 진화와 LISA 대역 중력파 방출에 대한 중요한 단서를 제공했습니다.
이 논문은 확률적 시뮬레이션의 비용이 큰 파라미터 추정 문제를 해결하기 위해, 입력 파라미터와 난수 시드를 모두 고려하여 경로 (trajectory) 수준의 추론을 가능하게 하는 적응형 배치 샘플링 기반의 베이지안 최적화 방법을 제안하고 전염병 모델에 적용하여 기존 방법 대비 효율성을 입증합니다.