Pwned: How Often Are Americans' Online Accounts Breached?
이 논문은 'Have I Been Pwned' 데이터와 미국 성인 5,000 명 표본을 결합한 분석을 통해 미국인의 약 82.84% 가 적어도 한 번 계정 유출을 경험했으며, 평균적으로 3 회 이상 유출된 것으로 추정된다고 밝히고 있습니다.
143 편의 논문
이 논문은 'Have I Been Pwned' 데이터와 미국 성인 5,000 명 표본을 결합한 분석을 통해 미국인의 약 82.84% 가 적어도 한 번 계정 유출을 경험했으며, 평균적으로 3 회 이상 유출된 것으로 추정된다고 밝히고 있습니다.
이 논문은 버스가 만석으로 탑승하지 못한 승객에 대한 데이터 누락으로 인한 편향을 보정하기 위해 잠재적 초과 수요를 식별하고 필터링하는 프레임워크를 제안하며, 이를 피츠버그 포트 오토리티의 실제 데이터를 적용하여 1 년 간의 초과 수요를 추정했습니다.
이 논문은 NBA 심판 데이터를 분석하여 홈팀 편향 (특히 플레이오프에서 두드러짐) 과 특정 선수에 대한 유리한 편향은 존재하지만, 특정 선수나 팀에 대한 부정적 편향 및 인종적 편향은 발견되지 않았음을 보고하며 팬데믹 이후 홈팀 편향이 감소한 점도 지적합니다.
이 논문은 14 개 산업 분야의 160 개 가이드라인과 정책 성명서를 텍스트 마이닝 기법으로 분석하여 생성형 AI 와 대규모 언어 모델의 혁신과 윤리적 책임, 규제 간의 균형을 모색하고 산업 전반에 대한 책임 있는 통합을 위한 실질적인 통찰과 제언을 제시합니다.
이 연구는 인간 관리자뿐만 아니라 AI 관리자 역시 성별에 따라 다르게 인식되며, 특히 여성 AI 관리자가 보상을 부여하지 않을 때 더 큰 회의감과 부정적 평가를 받는 등 성별 편향이 AI 관리 시스템에도 확장됨을 실험을 통해 규명했습니다.
이 논문은 오스트리아의 주요 신문인 DerStandard 의 10 년간 (2013~2022) 에 생성된 7,500 만 건 이상의 댓글과 4 억 건 이상의 투표, 그리고 메타데이터를 포함한 대규모 종단적 데이터셋을 공개하며, 사용자 프라이버시를 보호하기 위해 원문 대신 임베딩 벡터와 해시화된 식별자를 제공하고 독일어 기반 온라인 담론 분석을 위한 중요한 자원을 제시합니다.
이 논문은 HeyGem 과 같은 오픈소스 도구를 활용해 텍스트 기반 강의 개요를 가상 아바타가 부르는 노래로 변환함으로써 학생들의 참여도와 정보 기억력을 향상시키는 새로운 교수법을 제안하고 그 효과를 입증했습니다.
이 논문은 생성형 에이전트와 가상 민족지 방법을 통합하여 연구자가 가상 사회 환경에 직접 참여하고 개입할 수 있도록 하는 CMASE 프레임워크를 제안하며, 이를 통해 복잡한 사회 현상의 통계적 패턴과 인과적 메커니즘을 동시에 설명하고 예측하는 새로운 사회과학 연구 방법론을 제시합니다.
이 논문은 2021 년부터 2024 년까지의 565 만 건의 과학 논문 데이터를 분석한 결과, 생성형 AI 도구의 사용이 비영어권 국가의 저자들이 미국식 과학 영어에 더 빠르게 수렴하도록 하여 언어적 장벽을 낮추고 있음을 보여준다고 요약할 수 있습니다.
이 논문은 GDPR 의 프라이버시 설계 (PbD) 를 위한 요구사항 공학 방법론을 조직의 목표에 부합하는지 평가하기 위한 목표 중심 접근법을 제안하고 있습니다.
이 논문은 챗봇에 대한 사용자의 신뢰가 실제 신뢰성보다는 인지적 편향을 활용한 설계에서 비롯된다는 점을 지적하며, 챗봇을 '동반자'가 아닌 조직의 목표를 추구하는 '고도화된 영업사원'으로 재정의하고 심리적 신뢰 형성 과정과 규범적 신뢰성 사이의 혼란을 해소할 필요성을 주장합니다.
이 논문은 영향 함수를 활용하여 훈련 데이터에 미세한 교란을 가해 모델의 행동을 의도적으로 조작하는 'Infusion' 프레임워크를 제안하고, 이를 통해 소량의 훈련 데이터만으로도 다양한 아키텍처에 걸쳐 모델 행동을 효과적으로 변화시킬 수 있음을 입증합니다.
이 논문은 ACL 앤솔로지에 게재된 LGBTQIA+ 커뮤니티와 NLP 기술 간의 관계를 다룬 연구들을 체계적으로 검토하여, 현재 연구가 주로 기존 시스템의 편향을 지적하는 수동적 접근에 그치고 있으며, 향후 이해관계자 참여, 교차성, 학제 간 협력 및 비영어권 언어 연구 등 보다 포용적이고 정의로운 NLP 기술 개발을 위한 방향성을 제시합니다.
이 논문은 대규모 언어 모델의 정렬 (alignment) 기법이 오히려 집단적 병리 현상을 유발할 수 있으며, 특히 보이지 않는 검열과 복잡한 정렬 제약이 모델 간 상호작용에서 해로운 결과를 초래할 수 있음을 시사합니다.
이 논문은 중소기업의 자원 제약과 외부 생태계 의존성 등을 반영하여 기존 선형적·기업 중심 모델을 넘어선 다차원적이고 비선형적인 AI 성숙도 개념적 프레임워크를 제시합니다.
이 논문은 외부 API 없이 로컬 LLM 과 결정적 품질 관리 (QC) 를 통해 강의 PDF 를 다지선다형 문제로 변환하는 종단간 자체 호스팅 파이프라인을 제안하고, 정보이론·열역학·통계역학 등 세 가지 강의에서 생성된 24 개의 문제를 검증하여 프라이버시, 책임성, 친환경 AI 를 보장하는 교육 워크플로우를 입증합니다.
이 논문은 항공, 원자력 등 안전 중대 산업에서 발전한 안전 사례 (safety case) 방법론의 교훈을 바탕으로, 정렬 (alignment) 커뮤니티의 기존 접근법의 한계를 지적하고 프런티어 AI 시스템의 안전성을 입증하기 위한 더 견고하고 포괄적인 안전 사례 프레임워크를 제안합니다.
이 논문은 15 일간 34,486 개의 검색 결과를 분석한 결과, 구글의 역이미지 검색이 시각적 허위정보를 검증하는 과정에서 관련 없는 정보와 반복된 허위정보가 상위를 차지하며 사실 확인 콘텐츠의 가시성이 30% 미만으로 제한되는 등 알고리즘 게이트키핑의 한계를 드러냈음을 규명합니다.
이 논문은 논리적 추론 능력의 향상이 기계적 경로를 통해 AI 의 상황 인식과 전략적 기만 같은 위험한 능력으로 이어질 수 있음을 'RAISE' 프레임워크를 통해 분석하고, 이에 대한 구체적인 안전 장치와 연구 공동체의 책임을 제안합니다.
이 논문은 메타 픽셀의 구성을 역공학적으로 분석하는 'PixelConfig' 프레임워크를 제시하고, 2017 년부터 2024 년까지의 데이터를 통해 건강 관련 웹사이트를 포함한 웹상에서 민감한 정보 수집을 위한 추적 기능이 기본 설정에 의해 광범위하게 활성화되어 있으며, 제한 설정이 존재하더라도 실제 보호 효과는 미미함을 규명했습니다.