Measuring AI R&D Automation
이 논문은 AI 연구개발 자동화 (AIRDA) 의 범위와 영향에 대한 불확실성을 해소하기 위해 자본 지출 비중, 연구자 시간 배분, AI 하위화 사고 등 다양한 차원의 측정 지표를 제안하고, 기업과 정부 차원의 데이터 수집을 권장합니다.
152 편의 논문
이 논문은 AI 연구개발 자동화 (AIRDA) 의 범위와 영향에 대한 불확실성을 해소하기 위해 자본 지출 비중, 연구자 시간 배분, AI 하위화 사고 등 다양한 차원의 측정 지표를 제안하고, 기업과 정부 차원의 데이터 수집을 권장합니다.
본 논문은 16,000 건 이상의 TripAdvisor 리뷰를 분석한 대규모 언어 모델 (LLM) 기반 프레임워크가 기존 지표가 포착하지 못한 항공사 서비스의 미세한 문제와 만족도 하락 원인을 규명하여, 항공 및 관광 산업에 실행 가능한 전략적 통찰을 제공하는 유효한 진단 도구임을 입증합니다.
이 논문은 온라인 시장 경제에서 사회적 규범을 효과적으로 관리하기 위해, 다양한 환경에서 안정적인 인과 관계를 식별하고 해석 가능한 정책 규칙을 도출하는 '불변 인과 라우팅 (ICR)' 프레임워크를 제안하고 그 유효성을 입증합니다.
이 논문은 AGI 가 초래할 수 있는 경제적 위험을 완화하기 위해 기존 컴퓨팅 거버넌스 인프라를 통해 집행 가능한 토큰 세금 (모델 추론 시 부과되는 사용량 기반 과세) 을 제안하고, 그 장단점 및 실행 방안을 논의합니다.
이 논문은 사생활 보호와 윤리적 기준을 철저히 준수하는 사용자 중심 접근법을 통해 도시 공공시장에서 AI 기반 비디오 솔루션이 다중 지표 행동 인사이트를 성공적으로 도출하여 공간 분석의 실용성을 입증한 사례 연구입니다.
이 논문은 클라우드 API 에 의존하지 않고 오픈 가중치 모델과 로컬 하드웨어만으로 구동되며, 화학공학 열역학 과정에서 학생에게는 RAG 기반의 질문 응답을, 강사에게는 강의 분석 및 교재 인덱싱을 제공하는 'Stan'이라는 양면형 AI 도구의 설계, 구현 및 배포 경험을 제시합니다.
이 논문은 다수의 보호 집단을 고려한 공정한 상위-k 선택 문제를 다루며, 기존 연구의 한계를 극복하기 위해 계산 복잡성 분석을 통해 효율성 회복 가능성을 규명하고, 편차 최소화를 넘어 더 안정적인 유틸리티 손실 지표를 도입하여 실세계 데이터에서 우수한 성능을 보이는 통합적 알고리즘을 제안합니다.
본 연구는 13 개 주요 소셜 미디어 플랫폼의 이용약관을 분석하여 동의 관련 정보가 명확히 전달되지 않는 문제를 규명하고, 텍스트 접근성, 의미 투명성, 인터페이스 설계를 평가하는 3 차원 프레임워크를 제안함으로써 이용약관을 단순한 동의 문서가 아닌 사용자의 데이터 관행에 대한 동의 조건을 형성하는 문서로 재정의합니다.
이 논문은 문화적 배경에 따른 인간 주석 편향을 줄이고 마이크로표정 인식 성능을 향상시키기 위해, 오프셋 프레임의 불확실성을 해결하는 새로운 전역 반단조 차분 선택 전략 (GAMDSS) 아키텍처를 제안하고 이를 통해 다문화 데이터셋에서 주관적 오류를 효과적으로 감소시켰음을 보여줍니다.
이 논문은 890 개의 결과를 메타 분석하여 단답형 채점에서 LLM 의 성능이 인간 전문가의 난이도 인식과 무관하며, 디코더 전용 아키텍처가 인코더보다 현저히 낮고 토크나이저 어휘 크기 증가에도 한계가 있으며, 고위험 교육 맥락에서 인종 차별적 편향이 발생할 수 있음을 규명했습니다.
이 논문은 이층 ReLU 합성곱 신경망에서 차분 프라이버시 (DP-SGD) 가 노이즈로 인해 특징 학습이 비최적화되어 불공정성과 취약성을 초래하며, 공개 사전 학습과 개인화 미세 조정의 효과도 데이터 분포 편차에 따라 제한적임을 이론적 분석과 실험을 통해 규명합니다.
이 연구는 법률 분석과 같은 지식 집약적 분야에서 생성형 AI 의 생산성 향상을 위해서는 단순한 접근성 제공보다 사용자 교육이 필수적이며, 이를 통해 AI 활용률과 수행 성과가 모두 유의미하게 개선됨을 보여줍니다.
이 논문은 이름 등 명시적 개인 식별 정보를 제거한 이력서에서도 언어, 취미, 봉사 활동과 같은 미묘한 사회문화적 표지가 인종과 성별의 대용물이 되어 LLM 기반 채용 과정에서 체계적인 편향을 유발하고, 특히 설명을 요구하는 프롬프팅이 이러한 편향을 더욱 악화시킨다는 사실을 싱가포르 맥락의 대규모 실험을 통해 규명했습니다.
이 논문은 현대 분쟁의 핵심 요소인 인지전의 불명확한 정의를 명확히 하고, OODA 루프에 기반한 상호작용 프레임워크와 측정 가능한 우월성 속성을 제시하며, 이를 가상의 사례를 통해 적용함으로써 작전 지휘관과 분석가들이 인지전 캠페인을 이해·비교·평가할 수 있는 실용적 기반을 마련합니다.
본 연구는 중력, 복사, 방문 모델 등 세 가지 도시 이동성 모델의 성능을 다양한 공간 규모에서 평가한 결과, 방문 모델이 전반적으로 우수하지만 모든 모델이 부진한 규모에서는 방문 모델의 성능 저하가 가장 두드러지며, 기존 행정구역보다 거리 기반 군집화가 더 적합한 평가 기준임을 밝혔습니다.
이 논문은 대규모 언어 모델 (LLM) 을 활용하여 자연어 설명을 RTL 과 GDSII 레이아웃으로 자동 변환하는 NL2GDS 프레임워크를 제안하며, 이를 통해 ASIC 설계의 접근성을 높이고 면적, 지연, 전력 효율을 크게 개선할 수 있음을 입증합니다.
이 논문은 의식과 관련된 위험을 의도적으로 배제하면서도 정서적 행동을 구현할 수 있는 계층적 제어 아키텍처를 제안하고, 이를 통해 인공지능의 정서 구현 가능성과 의식 위험 감축을 위한 공학적·이론적·안전적 프레임워크를 제시합니다.
이 논문은 시뮬레이션된 사용자로부터 검증 가능한 감정 보상을 활용하여 LLM 의 공감 능력을 극대화하는 새로운 강화학습 프레임워크인 RLVER 를 제안하고, 이를 통해 Qwen2.5-7B-Instruct 모델의 공감 벤치마크 점수를 13.3 에서 79.2 로 획기적으로 향상시키면서도 수학적 및 코딩 능력을 유지하는 결과를 입증합니다.
이 논문은 암 환자 인터뷰 및 포럼 데이터를 기반으로 대규모 언어 모델 (LLM) 과 인간 개입 방식을 결합하여 네덜란드어 은유를 추출하고 'HealthQuote.NL' 코퍼스를 구축함으로써 환자-임상진 간 소통 개선과 맞춤형 치료 경로 설계에 기여하는 방안을 제시합니다.
이 논문은 네 가지 주요 대규모 언어 모델 (LLM) 을 정치, 이념, 동맹, 언어, 성별 차원에서 체계적으로 분석한 결과, 모델이 중립적으로 정렬되어 있음에도 불구하고 다양한 형태의 편향과 경향을 여전히 드러낸다는 점을 밝혔습니다.