수천 개의 노출된 GitHub 저장소는 이제 개인적이지만 Copilot을 통해 액세스할 수 있습니다

보안 연구원들은 데이터가 인터넷에 노출된 채로 지속적으로 마이크로소프트 Copilot과 같은 온라인 생성 AI 챗봇에 남아있을 수 있다고 경고하고 있습니다.

레소 (Lasso)라는 이스라엘 사이버 보안 기업이 신생 생성 AI 위협에 중점을 둔 연구 결과에 따르면, 세계 최대의 기업들 중 일부의 한때 공개적이었던 GitHub 저장소 수천 개가 영향을 받고 있습니다. 이 중에는 마이크로소프트의 저장소도 포함되어 있습니다.

레소 공동 창업자인 오피어 드로르는 회사의 GitHub 저장소 내용이 Copilot에 나타나기 시작했다고 TechCrunch에 전했습니다. 그는 Microsoft의 Bing 검색 엔진에 의해 인덱싱되고 캐시로 저장되어 있던 것이라고 말했습니다. 드로르는 저장소가 실수로 잠시 이용 가능하게 되었다가 나중에 개인으로 설정되었다고 설명했으며, GitHub에서 해당 저장소에 액세스하면 "페이지 찾을 수 없음" 오류가 발생한다고 덧붙였습니다.

드로르는 말했습니다. "Copilot에서 의외로 우리의 개인적인 저장소를 발견했습니다. 이 데이터를 인터넷을 둘러보는데서는 볼 수 없지만, 전 세계 누구나 Copilot에 올바른 질문을 하면 이 데이터를 얻을 수 있습니다."

GitHub에 있는 데이터의 어떤 부분이라도, 잠시라도 Copilot과 같은 도구에 의해 노출될 수 있다는 점을 인지한 후, Lasso는 더 심층적으로 조사를 진행했습니다.

레소는 2024년 어느 시점에서 공개적이었던 저장소 목록을 추출하고 나중에 삭제되거나 개인으로 설정된 저장소를 식별했습니다. Bing의 캐싱 메커니즘을 이용하여, 회사는 이제 개인으로 설정된 20,000개 이상의 GitHub 저장소에 아직도 Copilot을 통해 액세스할 수 있는 데이터가 남아 있음을 발견했습니다. 이는 16,000여 개 이상의 기관에 영향을 미쳤습니다.

Lasso는 해당 연구를 발표하기 전에 TechCrunch에 말했습니다. 영향을 받는 기관으로는 Amazon Web Services, Google, IBM, PayPal, Tencent, 그리고 Microsoft가 포함된다고 밝혔습니다. Amazon는 이 문제에 영향을 받지 않았다고 전한 바 있습니다. 레소는 "우리의 법률 팀의 조언에 따라 AWS에 대한 모든 언급을 삭제했습니다"라며 "우리는 우리의 연구에 엄중히 지지합니다."라고 말했습니다.

일부 영향을 받는 기업들에게는 Copilot이 기밀적인 GitHub 아카이브를 반환할 수 있어 지적 재산, 민감한 기업 데이터, 액세스 키 및 토큰이 포함될 수 있다고 회사는 말했습니다.

Lasso는 마이크로소프트에 의해 삭제된 GitHub 리포지토리에 사용되던 "공격적이고 유해한" AI 이미지를 만드는 데 사용되는 도구를 호스팅하던 내용을 Copilot을 통해 검색했다고 언급했습니다.

드로르는 Lasso가 데이터 노출로 심각하게 영향을 받는 모든 기업에 연락을 취하고 침해당한 키를 회전하거나 철회할 것을 권고했다고 전했습니다.

Lasso가 제기한 영향을 받는 기업 중 어느 기업도 TechCrunch의 질문에 응하지 않았습니다. 마이크로소프트도 TechCrunch의 문의에 응하지 않았습니다.

Lasso는 2024년 11월에 발견한 결과를 마이크로소프트에 알렸습니다. 마이크로소프트는 이 문제를 "낮은 심각성"으로 분류하고 이 캐싱 행동을 "허용 가능하다"고 밝혔습니다. 마이크로소프트는 2024년 12월부터 빙의 캐시 링크를 검색 결과에서 제외했다고 전달했습니다.

그러나 Lasso는 캐싱 기능이 비활성화되었음에도 불구하고 Copilot이 전통적인 웹 검색에서는 보이지 않는 데이터에 여전히 액세스할 수 있다는 점을 강조하며, 이는 일시적인 수정임을 나타냅니다.

Amazon Web Services와 Lasso의 발표 이후의 의견을 반영한 업데이트가 있습니다.